基于领域知识的标签聚合学习问题研究及其在商务分析中的应用

基本信息
批准号:71801232
项目类别:青年科学基金项目
资助金额:18.00
负责人:孟凡
学科分类:
依托单位:北京大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:贾传亮,汪波,刁卓,李韵思,李麒麟,赵君然
关键词:
领域知识标签聚合学习商务分析机器学习
结项摘要

Under the influence of various factors, the volume of weakly labeled data are increaing significantly in business analysis, which has brought great challenges to this field. How to use the data mining method to estimate the label of samples from the weakly labeled data has become an valuable research topic. Business analysis tasks often have a strong field background. It is suggested that data mining models often ahieve better result by introducing domain knowledge. This study will conduct research on Target Aggregation Learning problem based on domain knowledge. Firstly, the definition of tag aggregation learning will be provided, and a standard model built and the algorithm porposed, which together will establish a framework for Target Aggregation Learning. Secondly, according to the characteristics of the learning problem, the rational and efficient domain knowledge extraction, presentation and storage methods will be designed. Thirdly, Target Aggregation Learning models based on domain knowledge will be established and solved. Finally, in some business analysis cases, the poposed model wil be used to used to solve real world problems.The exploratory research in this project will lay the foundation for the follow-up research, and it will play an important role in the theory and application in the field of data mining and business analysis.

在各种主客观因素的影响下,商务分析中的数据标签缺失现象愈发严重,给数据分析带来了巨大的挑战。如何通过数据挖掘方法,从标签不完整的数据中,对所有样本的标签进行估计,已经成为了一个具有重要价值的研究问题。商务分析问题往往具有很强的领域背景,而大量研究已经表明领域知识的引入,能够显著提升数据挖掘模型的效果。基于此,本研究将展开基于领域知识的标签聚合学习问题研究。首先,提出标签聚合学习问题,构建模型并设计求解算法,建立其完整的标签聚合学习框架;其次,根据签聚合学习问题的特点,设计合理高效的领域知识提取、表示和存储方式;再次,建立基于领域知识的聚合标签学习模型,并进行优化求解;最后,在具体的商务分析案例应用中,通过模型解决实际问题。本课题的探索性研究将为该问题研究的后续展开奠定基础,对商数据挖掘与商务分析领域的理论与应用实践起到重要的补充与推动作用。

项目摘要

在各种主客观因素的影响下,商务分析中的数据标签缺失现象愈发严重,给商业分析带来了巨大的挑战。如何通过数据挖掘方法,从标签不完整的数据中,对所有样本的标签进行估计,已经成为了一个具有重要价值的研究问题。商务分析问题,往往具有很强的领域背景,而大量研究已经表明领域知识的引入,能够显著提高数据挖掘模型的效果。基于此,本研究将展开基于领域知识的标签聚合学习问题研究。首先,本项目提出了基于流形学习的标签聚合分类模型和基于随机森林的标签聚合回归模型;其次,为了刻画图形式的领域知识关系,研究了图形式领域知识表示与性质研究;再次,进行了面向非结构化数据的标签抽取与关系抽取研究;最后,探索了非结构化图像数据在商业智能应用中的场景与潜在价值。本课题的探索性研究将为该问题研究的后续展开奠定基础,对商数据挖掘与商务分析领域的理论与应用实践起到重要的补充与推动作用。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

孟凡的其他基金

批准号:21177118
批准年份:2011
资助金额:58.00
项目类别:面上项目
批准号:38970187
批准年份:1989
资助金额:3.00
项目类别:面上项目
批准号:49676304
批准年份:1996
资助金额:13.00
项目类别:面上项目

相似国自然基金

1

学习计算理论及其在知识发现中的应用

批准号:60073019
批准年份:2000
负责人:史忠植
学科分类:F02
资助金额:15.00
项目类别:面上项目
2

基于迁移学习的地理领域知识图谱构建技术

批准号:61702386
批准年份:2017
负责人:段鹏飞
学科分类:F0211
资助金额:24.00
项目类别:青年科学基金项目
3

基于双边平台理论的电子中介商务模式及其在我国医药流通领域中的应用

批准号:70672007
批准年份:2006
负责人:李明志
学科分类:G0209
资助金额:15.00
项目类别:面上项目
4

基于情感知识库构建、领域适应和终身学习的社交媒体情感分析方法

批准号:61672288
批准年份:2016
负责人:夏睿
学科分类:F0211
资助金额:62.00
项目类别:面上项目