众包环境下的成对约束传递问题研究

基本信息
批准号:61300164
项目类别:青年科学基金项目
资助金额:25.00
负责人:付振勇
学科分类:
依托单位:南京邮电大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:汪云云,肖学中,陈军军,李婉珺,宋玲玲,万文强,张伶卫
关键词:
半监督学习成对约束传递众包
结项摘要

As a weaker type of supervisory information, pairwise constraints have been widely used for many machine learning and pattern recognition problems. Pairwise constraint propagation can effectively exploit the scarce pairwise constraints. However, the current propagation methods cannot address the problem of how to obtain the initial constraints. It is worth to explore how to obtain the cheap initial constraints and how to effectively propagate the constraints when there exists a lot of noise in the initial constraints. On the basis of our previous research works about pairwise constraint propagation, this project will utilize a new kind of crowd cooperation manner, crowdsourcing, to obtain plenty of cheap initial constraints. The initial constrains obtained in the crowdsourcing environment are from multiple providers and include a lot of noise. We will apply the constraint tensor to express the initial constraint from multiple providers. Under the framework of low-rank tensor recovery and multidimensional information spreading, we will handle the constraint from multiple providers, remove the noise and exploit the large amount of unconstrained data to implement the propagation of the initial constraints from crowdsourcing. The research of this project takes into full account the characteristic of the constraints obtained under the complicated crowdsourcing environment, propose the specific solutions. Our work will address the limitation of the current works on collecting the initial constraints and enhance the application of the constraint propagation. At the same time, our work will also be a valuable supplement to the crowdsourcing research.

成对约束作为一类弱监督信息已经被广泛用于各类机器学习、模式识别问题中,成对约束传递可以有效地利用有限的约束信息,但现有的传递算法并没有很好地解决初始约束的获取问题,如何得到廉价的初始约束,如何能够在初始约束包含大量噪声的情况下实现约束信息的有效传递都是值得探索的重要问题。本项目在申请人前期关于成对约束传递问题研究的基础上,充分利用新型的大众协作方式众包获取大量廉价的初始约束信息。众包环境下获得的初始约束具有多源、含大量噪声的特点。我们将利用约束张量来统一表示多源初始约束,在低秩张量恢复和多维信息扩散框架下处理多源约束信息、消除噪声影响并利用大量未约束数据实现众包约束信息的传递。该项目的研究充分考虑了复杂的众包环境下获取的成对约束的特点,提出了针对性的方案,将会解决现有约束传递算法对获取初始约束的限制,极大地扩展约束传递算法的应用,同时也为众包分析的研究提供有益的补充。

项目摘要

在机器学习、计算机视觉等研究领域中,标记数据的获得是极为关键的。当前的机器学习算法,尤其是深度学习计算,都已经扩展到了可以处理大规模数据的阶段。同时,在大数据时代,数据的获取变得廉价。有效的算法加上廉价的数据促成了近几年人工智能的巨大发展。但是应当指出,大规模数据,尤其是来自于互联网的数据中,有价值的大量数据仍然是极为难以获得的。本项目的研究对象成对约束就是这样的一类弱监督信息,已经被广泛地应用于各类机器学习和模式识别问题,但约束信息的获取仍然是其应用的瓶颈。为此,我们研究了在众包背景下获取廉价约束关系,并利用一种增强的学习方式来从有限的约束信息繁衍出大量的可信成对约束的问题。众包是利用互联网技术,利用大众智慧解决复杂问题的有效手段。近年来,大量的大规模机器学习和计算机视觉的研究数据集都是通过众包的方式获得标注的。但是,利用众包方式获取成对约束关系这样的弱监督信息仍然是研究空白。这不仅在于众包方式获取约束信息的难度,更在于约束信息获取后的利用问题。..众所周知,众包获取的标记信息,具有大量、廉价,但低质量、噪声多等特点。为了将众包获取的约束有效地利用起来,必须设计能够抑制噪声的约束传递算法。我们针对众包环境下的约束传递问题进行了深入研究。首先,我们研究了众包获取的约束表示,提出了约束矩阵的表示方式,可以扩展到张量模型来表示多源的约束信息。其次,我们研究在传统半监督学习框架下的成对约束传递,半监督学习会利用多数数据中的正确约束信息抑制少量数据中的错误约束信息,从而达到噪声抑制和消除作用。再者,我们研究了利用数据的低秩分析对众包约束信息做传递的方法,低秩分析利用了数据内部天然包含的低秩特性,利用我们提出的低秩优化算法,可有效去除众包约束信息中的随机噪声。最后,我们还在基于约束信息的图像聚类和利用了约束信息的图像分类等应用场景中测试提出的约束传递算法。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

DOI:10.13465/j.cnki.jvs.2020.09.026
发表时间:2020
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
4

Himawari-8/AHI红外光谱资料降水信号识别与反演初步应用研究

Himawari-8/AHI红外光谱资料降水信号识别与反演初步应用研究

DOI:
发表时间:2020
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

付振勇的其他基金

批准号:61876085
批准年份:2018
资助金额:62.00
项目类别:面上项目

相似国自然基金

1

众包环境下基于胜任力的供需双方匹配研究

批准号:71301102
批准年份:2013
负责人:刘景方
学科分类:G0112
资助金额:20.00
项目类别:青年科学基金项目
2

农村电商环境下的众包物流在线配送优化研究

批准号:71701048
批准年份:2017
负责人:冯鑫
学科分类:G0102
资助金额:16.00
项目类别:青年科学基金项目
3

不确定环境下众包机制设计问题研究

批准号:61876080
批准年份:2018
负责人:王崇骏
学科分类:F0608
资助金额:62.00
项目类别:面上项目
4

社会化网络环境下众包服务质量评估及其治理研究

批准号:71471141
批准年份:2014
负责人:刘汕
学科分类:G0112
资助金额:60.00
项目类别:面上项目