Understanding travel demands of aviation customers is of great importance for civil aviation industry which is highly competitive and dynamic. However, modeling and predicting air travelers’ behavior is challenging due to the complex factors of the market situation and individual characteristics of customers (e.g. airlines’ market share, customer membership, and travelers’ intrinsic interests on destinations). To deal with this problem, (1) we propose a Travel Topic Model (TTM) to uncover the latent topic of customers and air routes simultaneously;(2) a Bayesian probabilistic framework based on heterogeneous information network is proposed for the air travel prediction problem by mining the Passenger Travel Record data which contains the operation situation of airlines and travel history of the customers; (3) moreover, we establish a Social Relational TTM to exploit customer graph to alleviate the sparsity of the behavior history. Our will improve the effectiveness and efficiency in travel prediction and the related theories and applications.
在高速发展、竞争激烈的民航产业中,理解旅客的出行需求,实现精准营销具有重要意义。然而,传统客户类别划分等方法无法有效的刻画和建模旅客个性化的出行偏好。针对此问题,本课题以挖掘民航旅客出行大数据切入点,展开以下几方面研究:(1)创新性地提出潜在出行主题模型来建模旅客多种出行偏好的潜在概率分布;(2)提出基于贝叶斯统一框架的异质信息网络多因素建模方法,综合考虑航线热度,旅客忠诚度,市场占有率,客户身份等复杂因素;(3)针对民航数据的大规模、稀疏特性,提出了一种融入社交计算思想的隐式出行主题图模型的建模方法,并建立针对大规模数据的并行化建模算法。在这些研究的基础上,本课题研究结合民航旅客出行的真实应用场景,提供个性化的出行推荐,客户细分,地区细分等服务。研究成果将极大地推进旅客行为建模在民航等行业大数据中的应用, 是对相关应用和机器学习理论的重要探索和扩展,具有重要的理论价值和广泛的应用前景。
旅客出行需求的理解对民用航空公司而言是非常重要的,分析旅客出行行为对机票代理、机场规划、旅游相关行业、地区经济活动分析管理等社会经济活动具有重大价值。项目组以大规模民航出行数据为研究对象,主要研究内容如下:首先通过统计分析方法分析旅客出行特点和行为模式,寻找影响旅客出行行为的因素,并进行合理划分,构建了考虑多种影响因素的旅客出行行为模型;其次,创新性地提出潜在出行主题模型来建模旅客多种出行偏好的潜在概率分布,为了解决数据稀疏性问题,引入旅客关联图,构建社交关系出行主题模型;最后,引入地区对旅客出行行为的影响,构建面向地区的潜在出行主题模型和面向地区的社交关系出行主题模型,并提出多因素旅游预测框架和相关的并行挖掘算法。项目组采用预测旅客选择航线的任务进行实验,数据集采用真实的不同地区的民航旅客出行记录,实验结果显示面向地区的潜在出行主题模型比传统的推荐方法性能更好,并且对于出行频次更低的旅客,社交关系出行主题模型表现出更优的性能,这说明了引入旅客关联图能有效解决数据的稀疏性问题。本课题的研究成果将推动相关的民航旅客出行数据挖掘与分析方法在实际中的应用,所提出的相关理论和方法可广泛用于其他交通,社会经济的大数据挖掘中,具有重要的应用价值、商业价值和社会价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
基于LASSO-SVMR模型城市生活需水量的预测
中国参与全球价值链的环境效应分析
基于集成异构网络的民航旅客-航班关联挖掘研究
基于时间感知模型的学术主题检索与演化挖掘研究
民航旅客社交网络中的用户偏好模型及价值预测算法研究
基于APTS多源数据的公交出行链模型与分析方法研究