Under the influence of various factors, the volume of weakly labeled data are increaing significantly in business analysis, which has brought great challenges to this field. How to use the data mining method to estimate the label of samples from the weakly labeled data has become an valuable research topic. Business analysis tasks often have a strong field background. It is suggested that data mining models often ahieve better result by introducing domain knowledge. This study will conduct research on Target Aggregation Learning problem based on domain knowledge. Firstly, the definition of tag aggregation learning will be provided, and a standard model built and the algorithm porposed, which together will establish a framework for Target Aggregation Learning. Secondly, according to the characteristics of the learning problem, the rational and efficient domain knowledge extraction, presentation and storage methods will be designed. Thirdly, Target Aggregation Learning models based on domain knowledge will be established and solved. Finally, in some business analysis cases, the poposed model wil be used to used to solve real world problems.The exploratory research in this project will lay the foundation for the follow-up research, and it will play an important role in the theory and application in the field of data mining and business analysis.
在各种主客观因素的影响下,商务分析中的数据标签缺失现象愈发严重,给数据分析带来了巨大的挑战。如何通过数据挖掘方法,从标签不完整的数据中,对所有样本的标签进行估计,已经成为了一个具有重要价值的研究问题。商务分析问题往往具有很强的领域背景,而大量研究已经表明领域知识的引入,能够显著提升数据挖掘模型的效果。基于此,本研究将展开基于领域知识的标签聚合学习问题研究。首先,提出标签聚合学习问题,构建模型并设计求解算法,建立其完整的标签聚合学习框架;其次,根据签聚合学习问题的特点,设计合理高效的领域知识提取、表示和存储方式;再次,建立基于领域知识的聚合标签学习模型,并进行优化求解;最后,在具体的商务分析案例应用中,通过模型解决实际问题。本课题的探索性研究将为该问题研究的后续展开奠定基础,对商数据挖掘与商务分析领域的理论与应用实践起到重要的补充与推动作用。
在各种主客观因素的影响下,商务分析中的数据标签缺失现象愈发严重,给商业分析带来了巨大的挑战。如何通过数据挖掘方法,从标签不完整的数据中,对所有样本的标签进行估计,已经成为了一个具有重要价值的研究问题。商务分析问题,往往具有很强的领域背景,而大量研究已经表明领域知识的引入,能够显著提高数据挖掘模型的效果。基于此,本研究将展开基于领域知识的标签聚合学习问题研究。首先,本项目提出了基于流形学习的标签聚合分类模型和基于随机森林的标签聚合回归模型;其次,为了刻画图形式的领域知识关系,研究了图形式领域知识表示与性质研究;再次,进行了面向非结构化数据的标签抽取与关系抽取研究;最后,探索了非结构化图像数据在商业智能应用中的场景与潜在价值。本课题的探索性研究将为该问题研究的后续展开奠定基础,对商数据挖掘与商务分析领域的理论与应用实践起到重要的补充与推动作用。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
学习计算理论及其在知识发现中的应用
基于迁移学习的地理领域知识图谱构建技术
基于双边平台理论的电子中介商务模式及其在我国医药流通领域中的应用
基于情感知识库构建、领域适应和终身学习的社交媒体情感分析方法