价值模式挖掘及应用研究

基本信息
批准号:71171007
项目类别:面上项目
资助金额:43.00
负责人:吴俊杰
学科分类:
依托单位:北京航空航天大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:朱兴全,李红,祝世伟,熊海涛,任义丽,崔晶
关键词:
兴趣度数据挖掘关联分析价值模式挖掘
结项摘要

关联分析是数据挖掘这一新兴交叉学科的核心领域。其从大规模复杂数据中寻找关联模式,并应用于商务智能、信息安全、计算机网络、生物医学、地理信息等众多重要领域。研究表明,传统的关联分析由于依赖"支持度-置信度"框架,容易产生大量无价值甚至错误的关联模式。而利用兴趣度指标对关联模式进行后评价,也无法根本解决计算成本过高的问题。有鉴于此,本项目研究真正有价值的关联模式即"价值模式"的挖掘问题,其核心在于把兴趣度指标融入价值模式的挖掘过程中,其难点在于解决指标因缺乏反单调性而无法实现遍历空间剪枝的问题。具体而言,本项目首先将从众多兴趣度指标中筛选出性能优良的指标,然后针对指标设计通用的价值模式挖掘算法,最后将该算法固化到价值模式挖掘系统中,并应用于移动商务推荐、搜索推荐及广告投放、突发事件监测等重要热点领域。本项目的研究有望对关联分析的理论和应用实践提供重要的补充和推动作用。

项目摘要

由于问题的普遍性和复杂性,从大数据中寻找价值模式(interesting pattern),并将之应用于商务智能、信息安全、计算机网络、生物医学、地理信息等众多实践领域,已经成为大数据分析的核心任务之一。课题组在历时四年的研究中,秉持“顶天立地”的原则,不仅积极发表具有国际顶尖水平的价值模式挖掘理论成果,而且大力开展产学研建设以将理论成果转化为社会舆情管理的重要助力。课题组取得的学术贡献包括:(1)在“局部价值模式挖掘”领域,第一次清晰指出了传统“支持度—置信度”框架的缺陷;通过证明余弦(cosine)乃至泛化的广义均值(generalized mean)具有新颖的“条件反单调性”,提出了基于余弦的价值模式挖掘算法,以及基于广义均值的价值模式挖掘一般性框架,并将挖掘算法推广至分布式计算环境,从根本上解决了大数据计算问题;通过将价值模式成功应用于噪声图像过滤、社交网络群体抽取、冷门产品推荐等问题,证明了其优越性及乐观的产业化前景。(2)在“全局价值模式挖掘”领域,针对聚类分析中使用最广的K-均值算法,从泛化理论、算法分析、算法设计、客观评价、组合聚类等方面进行了全面而深入的研究,形成了一套完整的成果体系,奠定了课题组在该领域的国际影响力。(3)在新兴的“社会化媒体大数据挖掘”领域,以上述价值模式挖掘技术为基础,围绕社会事件分析、用户情感分析、信息传播分析、潜在欺诈检测等热点问题,开展了大规模的理论与应用研究,理论价值与社会经济效益均显著。截至2016年1月18日,课题组已发表(含接收)共34篇标注课题资助的学术论著,其中包括1本Springer出版英文专著、21篇SCI检索论文(含6篇IEEE Trans.论文)、11篇数据挖掘顶级会议论文(含2篇KDD和4篇ICDM论文)。形成了一批面向社会化媒体大数据的实践应用成果,其中包括11项国家发明专利申请(1项已获批)、2项获批软件著作权(已技术入股某创业公司)、为工信部某中心构建的“社会舆情分析与管理”平台、为国安部某局构建的“台湾选情预测平台”等。项目负责人依托本课题支持,成长为NSFC优青,并主持了NSFC重点项目、科技部863项目、工信部信息安全项目等国家级课题,在日渐频繁的国际、国内交流合作中,逐步成长为社会化媒体大数据分析领域的重要研究力量。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
3

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
4

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
5

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021

吴俊杰的其他基金

批准号:61003082
批准年份:2010
资助金额:19.00
项目类别:青年科学基金项目
批准号:81372236
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:70901002
批准年份:2009
资助金额:17.50
项目类别:青年科学基金项目
批准号:71531001
批准年份:2015
资助金额:294.00
项目类别:重点项目

相似国自然基金

1

基于问题模式挖掘的自适应蚁群算法及其应用研究

批准号:60875043
批准年份:2008
负责人:冯祖仁
学科分类:F0601
资助金额:30.00
项目类别:面上项目
2

VIE境外上市模式、盈余质量及企业价值

批准号:71662030
批准年份:2016
负责人:韩金红
学科分类:G0206
资助金额:29.00
项目类别:地区科学基金项目
3

基于价值管理和价值创造的并购模式研究

批准号:70572054
批准年份:2005
负责人:李善民
学科分类:G0205
资助金额:17.00
项目类别:面上项目
4

负序列模式挖掘关键技术及其在医保欺诈检测中的应用研究

批准号:71271125
批准年份:2012
负责人:董祥军
学科分类:G0112
资助金额:54.00
项目类别:面上项目