基于几何拓扑的网络众包策略研究

基本信息
批准号:61672514
项目类别:面上项目
资助金额:62.00
负责人:许倩倩
学科分类:
依托单位:中国科学院计算技术研究所
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:杨亮,马坷,王川,吴庆波,荆丽桦,郭电杰,雷青
关键词:
异常样本检测主动采样几何拓扑众包
结项摘要

With the rapid growth of Internet and wireless networks, crowdsourcing strategy provides us a new opportunity to conduct user studies from an Internet crowd in Big Data era. Since such a crowd can be quite large, it enables researchers to conduct experiments with a more diverse set of participants at a lower economic cost than would be impossible under laboratory conditions. In this project, we aim to develop robust and low-economic cost strategies for crowdsourcing subjective studies. Specifically, as the data quality might be significantly damaged in an uncontrolled crowdsourcing environment, by introducing geometric and topological principles, we propose to establish an outlier detection method which is suitable for large scale crowdsourceable pairwise data. On this basis, we further design some simple yet fast algorithms for adaptive outlier detection which can estimate the number of outliers automatically. Besides, considering task requester usually only has a limited amount of budget, we study two scenarios of active sampling (i.e., unsupervised sampling and supervised sampling) to wisely allocate the budget to achieve better quality of the finally aggregated result. Our project plans to achieve breakthrough in the task of crowdsourcing experimental design. Moreover, world-class research achievements in paper publication and personnel training will be obtained.

随着互联网及无线宽带网络技术的迅猛发展,网络众包因其具有成本低、参与人员广泛、数据量大等优点,提供了大数据时代下通过群体来完成主观评测的新途径。本项目以提升网络众包测试结果鲁棒性和节约测试成本为研究目标。考虑到网络众包环境收集的数据存在噪声和异常,本项目将以相关几何拓扑学理论为基础,建立针对比对测试数据、适合大数据的统计抑噪和异常样本检测方法;在此基础上进一步提出自适应的、能自动检测异常样本的快速算法。此外,考虑到实际应用中测试成本有限,本项目还将研究无监督和有监督两种场景下不同的主动采样机制,从而为互联网网络众包实验节省测试成本和开销。本项目拟在网络众包主观实验设计的任务上取得突破,并且在论文发表、人才培养等方面取得具有国际领先水平的研究成果。

项目摘要

近年来,互联网技术的飞速发展及人机交互技术的快速普及催生了一种新的数据收集方式:网络众包标注。本项目聚焦于众包的鲁棒性及高效性两大关键技术点,围绕鲁棒异常样本检测、自适应异常样本检测及组合Hodge理论框架下的主动采样三大研究内容展开了系统研究,取得了如下进展:1)在基于linearized Bregman Iteration的鲁棒异常样本检测方面,构造了基于Huber LASSO的稀疏异常样本检测算法,证明该算法可提供不一致排序子空间分量的相合稀疏近似,并进一步根据linearized Bregman Iteration动力系统方程构建了稀疏正则化项的超参数优化方法,实验结果证明该方法可在加速超参数选择的情况下给出近似无偏的排序;2)在基于iterative Least Trimmed Squares的自适应异常样本检测方面,分别在已知及未知异常样本数量的条件下,通过损失函数重构方法给出了Least Trimmed Squares的0范数正则框架下的异常样本检测多项式时间近似求解算法,理论分析证明在一定假设下所提出算法可快速收敛于真实参数,并可给出具有统计相合性的参数估计,实验结果进一步证明所提出算法性能提升显著;3)在组合Hodge理论框架下的主动采样方面,针对无监督场景,提出基于Fisher信息最大化的主动采样算法,针对有监督场景,提出基于Bayesian信息最大化的有监督主动采样,性能优于当前的最佳方法CrowdBT, 并且可以加速30倍以上。在本项目的资助下,共发表/录用论文30篇,其中CCF-A类论文29篇,包括T-PAMI 2篇、T-KDE 1篇、T-IP 2篇、NeurIPS 3篇、CVPR 1篇、AAAI 11篇、ACM MM 9篇。人才培养方面,项目负责人先后获得中国人工智能学会吴文俊人工智能优秀青年奖、中国人工智能学会最佳青年科技成果奖、中国图象图形学学会石青云女科学家奖、ACM中国SIGMM新星奖、中国人工智能学会吴文俊人工智能自然科学一等奖(排名第3)等一系列奖项,培养的多名博士生硕士生获得微软学者奖学金、百度奖学金全球20强、国家奖学金、中科院百篇优博论文等一系列奖项。此外,申请人积极参加各类学术服务,先后担任IJCAI SPC和ICME AC,以及多个顶级期刊和会议(T-PAMI, ICML, NIPS, CVPR等)的审稿人。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

五轴联动机床几何误差一次装卡测量方法

五轴联动机床几何误差一次装卡测量方法

DOI:
发表时间:
2

基于全模式全聚焦方法的裂纹超声成像定量检测

基于全模式全聚焦方法的裂纹超声成像定量检测

DOI:10.19650/j.cnki.cjsi.J2007019
发表时间:2021
3

基于图卷积网络的归纳式微博谣言检测新方法

基于图卷积网络的归纳式微博谣言检测新方法

DOI:10.3785/j.issn.1008-973x.2022.05.013
发表时间:2022
4

人工智能技术在矿工不安全行为识别中的融合应用

人工智能技术在矿工不安全行为识别中的融合应用

DOI:10.16265/j.cnki.issn1003-3033.2019.01.002
发表时间:2019
5

面向工件表面缺陷的无监督域适应方法

面向工件表面缺陷的无监督域适应方法

DOI:
发表时间:2021

许倩倩的其他基金

批准号:61402019
批准年份:2014
资助金额:10.00
项目类别:青年科学基金项目

相似国自然基金

1

基于网络博弈动力学的反恶意众包研究

批准号:61772080
批准年份:2017
负责人:王胜灵
学科分类:F0207
资助金额:65.00
项目类别:面上项目
2

竞赛型众包中网络接包群体的涌现机制研究

批准号:71874118
批准年份:2018
负责人:刘忠志
学科分类:G0404
资助金额:48.00
项目类别:面上项目
3

基于行动者网络框架的众包模式设计与管理研究

批准号:71403119
批准年份:2014
负责人:赵宇翔
学科分类:G0414
资助金额:22.00
项目类别:青年科学基金项目
4

移动社会网络中众包系统的可信机制研究

批准号:61502410
批准年份:2015
负责人:王莹洁
学科分类:F0208
资助金额:20.00
项目类别:青年科学基金项目