查询驱动的交互式多媒体数据清洗方法研究

基本信息
批准号:61572252
项目类别:面上项目
资助金额:65.00
负责人:张立言
学科分类:
依托单位:南京航空航天大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:黄圣君,刘绍翰,邵伟,祖辰,郝小可,屠黎阳,孙亮,张丹
关键词:
查询驱动人在环路技术概率数据库多媒体数据清洗查询处理
结项摘要

The rapid advances of Internet, Internet of Things and Mobile Wireless Internet have led us into an era of massive multimedia data explosion. It becomes an essential issue to effectively extract semantics and process data cleaning, in order to support broad real-world applications. However in the era of big data, the traditional offline setting for data cleaning is not tenable. We simply do not have adequate computing resources and man power to process every data for each possible annotation. Therefore, in this proposal, we target to address the key issues for query-driven interactive multimedia data cleaning techniques. Given a dataset of massive media data, we first propose to analyze semantic information with automatic techniques, leveraging heterogeneous contextual information which can improve the performance of semantic extraction. Based on the extracted semantic information, we then construct a big probabilistic database. When users present a query, we propose to perform query processing on the probabilistic database and acquire the initial results. To further enhance the accuracy of query results, we propose to leverage active learning based interactive techniques to help users achieve satisfied query answers as soon as possible. Our research will provide technical support for researches on big data cleaning, analysis and mining, and meanwhile definitely make important advance to the real-world applications for massive multimedia data.

互联网、物联网及移动互联网的高速发展将我们带入多媒体数据大爆炸的时代。如何准确提取语义信息并进行高效数据清洗,以支持广泛的实际应用成为至关重要的问题。然而大数据时代下,传统脱机模式的数据清洗技术已不再适用,我们没有足够的人力和计算资源对每个样本的每个潜在标签进行清洗。为此,本课题致力于研究查询驱动的交互式多媒体数据清洗关键技术。针对大规模媒体数据集,本课题拟首先进行自动语义分析,融合多源多模态的上下文信息以提高语义提取的准确性;利用获取的语义信息,构建大规模概率数据库;基于此概率数据库,对用户提出的查询进行有效表示和处理,得到初始查询结果;为进一步提高查询结果的准确性,拟采用基于主动学习的人机交互机制,快速帮助用户得到更加满意的查询结果。本课题将为大数据清洗、分析及挖掘等研究提供技术支持,也将有力推动大规模多媒体数据实际应用的全面发展。

项目摘要

大数据时代下,传统脱机模式的数据清洗技术已不再适用,我们没有足够的人力和计算资源对每个样本的每个潜在标签进行清洗。本课题致力于研究查询驱动的交互式多媒体数据清洗关键技术。针对大规模媒体数据集,我们首先进行自动语义分析,融合多源多模态的上下文信息以提高语义提取的准确性;利用获取的语义信息,构建大规模概率数据库;基于此概率数据库,对用户提出的查询进行有效表示和处理,得到初始查询结果;为进一步提高查询结果的准确性,我们采用基于主动学习的人机交互机制,快速帮助用户得到更加满意的查询结果。相关研究成果在多媒体数据分析领域的著名国际会议及期刊发表论文14篇,其中SCI检索论文6篇(包括CCF A类期刊IEEE T-PAMI2篇,IEEE TIP 1篇),会议论文8篇(包括IJCAI,AAAI等CCF A类会议4篇),其中一篇获得国际会议ICIMCS2017最佳学生论文奖。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

DOI:10.16085/j.issn.1000-6613.2022-0221
发表时间:2022
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020

张立言的其他基金

相似国自然基金

1

查询语义分析驱动的多层次交互式查询意图识别技术研究

批准号:61402304
批准年份:2014
负责人:宋巍
学科分类:F0211
资助金额:26.00
项目类别:青年科学基金项目
2

数据驱动的交互式和定制化服务链推荐方法研究

批准号:61872002
批准年份:2018
负责人:张以文
学科分类:F0203
资助金额:56.00
项目类别:面上项目
3

多模态融合的视频监控数据交互式查询及分析研究

批准号:61772268
批准年份:2017
负责人:张立言
学科分类:F0210
资助金额:62.00
项目类别:面上项目
4

基于复杂查询类型的多媒体检索

批准号:61502157
批准年份:2015
负责人:袁进
学科分类:F0211
资助金额:21.00
项目类别:青年科学基金项目