大数据环境下基于GMDH的客户分类半监督集成模型研究

基本信息
批准号:71471124
项目类别:面上项目
资助金额:60.00
负责人:肖进
学科分类:
依托单位:四川大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:左仁淑,牛永革,肖玉明,朱兵,腾格尔,李红梅,罗太波,谢玲
关键词:
GMDH客户分类集成学习半监督分类大数据
结项摘要

Customer relationship management (CRM) and its customer classification is one of the mordern enterprises management's key contents. However, customer classification with big data brings challenges for CRM. On one hand, there are relatively few samples with class label for training model, but a lot of samples without class label are available, meanwhile the customer data tend to be high-dimensional; on the other hand, the customer data contain lots of noises. Different from the traditional research paradigm which only utilizes the labeled data to model, this project proposes a new research paradigm, i.e., semi-supervised classification, which utilizes labeled and unlabeled data simultaneously, and provides the concept and research framework of GMDH based semi-supervised ensemble for customer classification with big data. Under the framework, based on the strong anti-noise ability and automatic modeling mechanism of GMDH, it researches the customer classification semi-supervised learning mechanism, provides two GMDH based semi-supervised feature selection models and two GMDH based single semi-supervised classification models, and constructs three GMDH based cost sensitive semi-supervised ensemble selection strategies. At last, it provides the most appropriate semi-supervised classification ensemble solutions for different customer classification problems and conducts empirical research. The research productions will provide an effective tool for CRM in big data time.

客户关系管理(CRM)及其客户分类问题是现代企业管理理论的核心内容之一,然而大数据环境下的客户分类为CRM带来了挑战。一方面,用于建模的有类别标签的样本通常比较少,但却有大量没有类别标签的样本可用,同时客户数据往往是高维的,另一方面,客户数据中包含大量噪声。区别于仅使用有标签数据建模的传统研究范式,本项目提出了同时使用有、无类别标签数据来建模的半监督分类的新研究范式,并给出大数据环境下基于GMDH的客户分类半监督集成的概念及研究框架。在该框架下,以GMDH具有的较强抗噪声干扰能力和自动建模机制为基础,研究了客户分类半监督学习机制,提出了两种基于GMDH的半监督特征选择模型以及两种基于GMDH的单一半监督分类模型,构建了三种基于GMDH的代价敏感半监督集成选择策略。最后,针对不同的客户分类问题,给出最适合的半监督分类集成解决方案并做实证研究。研究成果将为大数据时代CRM提供一种有效的工具。

项目摘要

客户关系管理(CRM)及其客户分类问题是现代企业管理理论的核心内容之一,然而大数据环境下的客户分类为CRM带来了挑战。一方面,用于建模的有类别标签的样本通常比较少,但却有大量没有类别标签的样本可用,同时客户数据往往是高维的,另一方面,客户数据中包含大量噪声。项目将数据分组处理(GMDH)、半监督学习、集成学习以及迁移学习技术相结合,研究大数据环境下的客户分类问题。分别研究了客户分类半监督学习机制、基于GMDH的特征选择模型、基于GMDH的单一分类模型、基于GMDH的半监督集成选择策略以及数据特征驱动的客户分类集成模型。最后,针对不同的客户分类问题,给出最适合的分类集成解决方案并做实证研究。研究成果将为大数据时代客户关系管理(CRM)提供一种有效的工具,大大提升CRM的科学性。此外,项目还将基于GMDH的集成模型用于股票价格、能源需求、交通流量预测等领域,大大拓宽了模型的应用范围。项目共发表研究论文 35 篇,其中,SCI检索的期刊论文19篇,SSCI检索期刊论文12 篇,国家自然科学基金委管理学部认定的 A 级期刊 7 篇,人大复印资料权威转载1篇。研究成果分别获四川省科技进步二等奖1项和四川省哲学社会科学优秀成果三等奖1项。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

DOI:10.13465/j.cnki.jvs.2020.09.026
发表时间:2020
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

DOI:10.3969/j.issn.1674-0858.2020.04.30
发表时间:2020

肖进的其他基金

批准号:51376116
批准年份:2013
资助金额:75.00
项目类别:面上项目
批准号:31501305
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:71101100
批准年份:2011
资助金额:20.00
项目类别:青年科学基金项目
批准号:50806046
批准年份:2008
资助金额:21.00
项目类别:青年科学基金项目

相似国自然基金

1

集成半监督细菌启发式特征选择的客户智能分类模型和方法研究

批准号:71901152
批准年份:2019
负责人:王红
学科分类:G0112
资助金额:18.00
项目类别:青年科学基金项目
2

数据流半监督分类中的半监督迁移学习研究

批准号:61866007
批准年份:2018
负责人:文益民
学科分类:F0603
资助金额:38.00
项目类别:地区科学基金项目
3

基于GMDH动态聚类集成的应用商店客户价值细分研究

批准号:71501136
批准年份:2015
负责人:腾格尔
学科分类:G0112
资助金额:17.40
项目类别:青年科学基金项目
4

基于半监督集成学习的不平衡数据研究

批准号:61203292
批准年份:2012
负责人:陈欢欢
学科分类:F0603
资助金额:24.00
项目类别:青年科学基金项目