Web customer churn prediction requires the prediction model of higher precision and better explanation, while the key to acquiring higher precision and better explanation of the model is to accurately analyze customer features and adopt the new prediction methods. In recent years, statistics, traditional artificial intelligence, statistics learning and ensemble learning are the main methods in the research of building contractual customer churn prediction model. However, many empirical studies show that the few non-contractual customer features exists in the old researches, and the theory of the old methods can not synchronously guarantee the good generalized performance and explanation of the prediction on big data. Based on surveying newly-established web customer churn prediction model structure from the theoretical research,the web customer features including customer emotional semantic feature, customer social network feature, customer home preference feature are analysed ,and the changes of model precision and explanation are reviewed by using rough sets feature selection, satisfactory feature selection, transfer learning, deep learning, dynamic ensemble and estimate of two type errors. By testing the proposed theory results with the real data from the e-commerce corporations including the ASEAN cross-border e-commerce corporations, this task perfects web customer churn prediction theory and thus provides certain theoretic support as well as practical value for companies to deal with web customer churn problems.
网络客户流失预测问题要求预测模型有较高的准确性和较强的解释性,而正确分析与选择客户特征和应用新预测方法是预测模型获得较高准确性和较强解释性的关键。统计学方法、传统人工智能方法、统计学习方法和集成学习方法是目前建立契约客户流失预测模型的主要方法。然而,以往的客户流失预测研究较少考虑非契约客户特征,且所采用的预测方法在理论上不能保证大数据条件下预测模型的泛化能力和可解释性。本项目从理论研究出发,合理拓展网络客户流失预测模型结构,由此构建情感语义特征、社会网络特征、家乡偏好特征等网络客户特征,并考察引入粗糙集特征选择、满意优化特征选择、深度学习、迁移学习、动态集成学习、两类错误评价等方法后,预测模型的准确性和解释性变化。通过利用电子商务行业,特别是东盟跨境电商的实际数据对提出的理论成果进行检验,在完善网络客户流失预测理论的同时,为解决行业中网络客户流失问题提供一定的理论依据和实践。
2021年,我国网民规模达到10.32亿,手机网民规模达到10.29亿,网上消费越来越成为人们接受行业企业产品和服务的重要形式。确定保持策略实施的目标客户,分析网络客户特征,对潜在流失客户进行识别和预测是当前客户管理和商务智能的重要研究问题。本项目从理论研究出发,合理拓展客户流失预测模型结构,由此构建行为偏好聚类特征、客户情感价值特征、行为序列特征、多模态融合特征等客户特征,分别考察引入特征选择、深度学习、迁移学习、集成学习、数据不平衡处理、两类错误评价等方法后,预测模型准确性和解释性变化。研究发现:(1)根据客户流失预测新模型结构,为客户流失管理提供了新的研究途径。(2)构建偏好聚类特征模型、客户情感价值特征模型、行为序列特征模型、多模态融合特征模型等能较好的反映客户数据特征和客户行为特征,并具有较好的解释性。(3)基于堆叠自编码器预测模型(AEMLP)、基于实体嵌入与因子分解机预测模型(EEFM-MLP)、基于CNN权重集成的预测模型(SWACNN)、基于自注意力LSTM预测模型(SA-BILISTM)、基于CNN和GBDT预测模型(CNN-GBDT)、聚类随机采样和代价敏感的预测模型(RWBC-Ensemble)、自适应聚类混合采样预测模型(CUS-Ensemble)、基于Stacking预测模型等(LCMS),具有较好的分类准确性。(4)基于SMOTE预测模型(SM-HA)、基于DBSCAN预测模型(DB-HAS)、基于K近邻预测模型(KN-AMS)、特征欠采样的平衡随机森林预测模型(FUS-BRF)等,能有效处理客户数据不平衡问题。项目主要利用网络客户数据对提出的理论成果进行检验,在完善客户流失预测理论的同时,为解决行业中客户管理问题提供一定的理论依据和实践。.本项目发表学术论文15篇,形成研究报告1篇。申请发明专利和实用性专利5件,计算机软件著作权3件。培养5名青年教师,其中1名获得二级教授,1名获得四级教授。培养博士生3名,硕士9名。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种基于多层设计空间缩减策略的近似高维优化方法
奥希替尼治疗非小细胞肺癌患者的耐药机制研究进展
基于文献计量学和社会网络分析的国内高血压病中医学术团队研究
长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移
二维FM系统的同时故障检测与控制
客户流失预测理论与实证研究
态度-行为关系视角下可解释客户流失预测模型研究
社会网络环境下的客户行为预测模型研究
网络展示广告中的广告投放计划和客户行为预测