The database marketing has become a hot topic in the field of marketing service, owing to the severe marketing competition, increase of marketing cost and variety of consumers’ personal demand. From the perspectives of accuracy and interpretability, we systematically study how to introduce the associative classification rules to ensemble learning to deal with the class imbalance problems existing in database marketing. Our aim is to construct diverse base learners with strong individual performance, such that the overall result of ensemble learning, as well as its interpretability, can be improved and effectively applied to database marketing. The main content of this project includes: (1) associative classification rules generation and their interesting index; (2) ensemble learning models and algorithms based on associative classification rules; (3) application of the proposed models and algorithms in database marketing. This research project contributes to the methodologies of ensemble learning in developing new models and algorithms with high accuracy and interpretability. Meanwhile, the results of the study are applied to database marketing to improve the efficacy of marketing service for organizations and corporations, which shows great values in practice.
市场竞争的加剧、营销成本的上升以及消费者的个性化需求使得数据库营销成为了当前营销服务领域的热点问题。本项目从模型准确性和可解释性出发,针对数据库营销中普遍存在的类别不均衡这一数据特性,系统研究如何在集成学习中引入关联分类规则以构建具有较强个体性能的学习模型,同时各个模型之间具有较强的差异性和多样性,以提高集成学习的总体性能和学习结果的可解释性,并将其应用于数据库营销问题。项目的主要研究内容包括:(1) 关联分类规则提取和兴趣度指标;(2) 基于关联分类规则的集成学习模型和算法;(3) 模型算法在数据库营销中的应用研究。项目从方法论的角度研究具有高度精确性和可解释性的集成学习模型算法,具有重要的理论贡献和意义。同时,项目将形成的理论、模型和算法应用于数据库营销实践,提高组织和企业应用数据挖掘技术进行营销服务的水平,具有较高的应用价值。
项目以数据库营销为研究背景,首先从数据中存在的特征相关性及其对学习模型准确率等角度出发,并通过理论推导和计算实验分析这些特性对于学习模型性能的影响机理。在此基础上,项目提出了一种基于因子分析和聚类分析集成的分类策略CAFAC(Classification Algorithm based on Factor Analysis and Clustering)。在一系列数据集上的实验计算结果表明:如果数据样本集合中存在特征空间异质性,应用CAFAC能够很好地改进传统分类方法分类准确率;与相关研究中考虑特征空间异质性的其它方法相比,CAFAC也能取得更高的分类准确率。在此基础上,项目提出基于原型选择和局域特征赋权的改进K-近邻分类规则,以提高时间效率并解决K值寻优问题。结果表明,与传统K-近邻规则、原型选择算法以及深度学习算法相比,该算法均取得较好的预测准确率和时间效率。最后,提出了一种基于关联分类规则和集成学习的数据库营销模型。模型首先对多数类(非目标客户)进行聚类分析以更好地分析该类客户中存在不同行为模式特征的客户子群体,并将各个客户子群体(数据簇)与少数类(目标客户)进行组合产生训练样本子集合,然后通过关联分析分别提取目标客户和非目标客户中存在的满足一定支持度的强关联分类规则,最后对规则进行集成以预测客户是否为目标客户或成为目标客户的概率。为了验证所提出模型的效果,论文在实际数据集上将所提出的模型与其它模型进行了对比分析。实证分析结果表明所提出的集成学习模型不仅能够提高对目标客户的预测准确率,也能产生具有很好解释性的结果,对于该类风险决策问题中管理决策者选择或制定有效的行动方案具有较好的参考借鉴价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于分形维数和支持向量机的串联电弧故障诊断方法
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
一种改进的多目标正余弦优化算法
基于栅格的时空关联规则与过程关联规则提取研究
基于规则的主动数据库----算法与机制研究
基于半监督学习和集成学习的文本分类方法研究
运用文本数据库中元数据关联规则进行知识发现的研究