混杂数据的模式识别及敏感内容挖掘理论与方法

基本信息
批准号:61532005
项目类别:重点项目
资助金额:295.00
负责人:赵耀
学科分类:
依托单位:北京交通大学
批准年份:2015
结题年份:2020
起止时间:2016-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:彭宇新,常冬霞,王东,林春雨,朱超,魏云超,刘若愚,张健,何相腾
关键词:
视频分析与理解混杂数据分析网络多媒体信息处理
结项摘要

As the rapid development of Internet、personal sensor equipment (such as mobile phone)、wechat and microblog, vast amount of diverse data which are unstructured, low quality, multi-modal, heterogeneous and non-homologious,have been generated. How to mine some useful information from the massive data is a key technology nowadays.. Focused on the diverse data which are low quality、multi-modality and heterogeneous、multi-source and non-homologious,the project will study the pattern recognition theory and method for the massive diverse data, including the cleaning and reduction of low-quality and redundant diverse data, consistency representation of heterogeneous data, the validity identification of multi-source and non-homologous diverse data, association modelling of diverse data, etc. The project will further apply the theory and method to the analysis and mining of sensitive content with diverse data properties.. The research achievement will not only enhance the theory of traditional pattern recognition, but also provide theoretical and technological support to the applications such as social media analysis, multimedia applications, big data anakysis and sensitive content detection.

伴随着互联网、个人传感设备(手机等)、微信、微博等信息技术的飞速发展,人类社会产生了数以亿计的具有非结构化、多态异构、多源异质、不完备以及过度冗余等特性的混杂数据,如何从这些海量的数据中挖掘出有用信息是当前信息领域亟待解决的核心问题之一。. 围绕海量低质、多态异构、多源异质的混杂数据,本课题拟开展混杂数据模式识别的基础理论与方法研究,包括海量低质混杂数据的清洗与约减、多态异构混杂数据的同构表征、多源异质混杂数据的有效性辨识以及多源混杂数据的关联建模等,实现混杂数据的清洗、统一表示、有效性辨识、进而实现数据间的关联建模,构建混杂数据模式识别的基础理论,并将理论研究成果应用于具有混杂特性的敏感内容(暴恐视频等)的分析与挖掘中。. 研究成果将丰富模式识别的基础理论,并为社交媒体分析,多媒体应用,大数据及敏感内容的检测等应用提供有力的理论和技术支撑。

项目摘要

伴随着互联网、个人传感设备(手机等)、微信、微博等信息技术的飞速发展,人类社会产生了数以亿计的具有非结构化、多态异构、多源异质、不完备以及过度冗余等特性的混杂数据,如何从这些海量的数据中挖掘出有用信息是当前信息领域亟待解决的核心问题之一。.课题组以低质、多态异构、多源异质的混杂数据为研究对象,围绕低质混杂数据的清洗与约减、多态异构混杂数据的同构表征、多源异质混杂数据的有效辨识、多源混杂数据的关联建模这四个混杂数据计算的关键问题,开展了混杂数据模式识别基础理论方面的研究工作。课题组提出了面向任务指派的数据约减模型、基于语义匹配的跨模态数据表征、基于CNN的图像多标签属性辨识、基于多粒度层级网络的跨模态关联学习、面向细节挖掘的图像细粒度分类等创新性算法,实现了混杂数据的约减与增强、表征、辨识和关联等,进而挖掘出潜在的规律和模式,并以此为基础实现了具有混杂特性的敏感数据内容的分析与挖掘。课题执行期间共发表论文95篇,其中期刊论文61篇,会议论文34篇。相关重要研究成果在IEEE Transactions on Pattern Analysis and Machine Intelligence(PAMI), International Journal of Computer Vision(IJCV)以及CVPR,IJCAI等领域重要期刊和会议上,3篇论文已被google scholar引用300次以上。以第一完成单位获中国图像图形学学会科学技术奖一等奖和教育部自然科学二等奖各1项,获CVPR国际竞赛中冠军等奖励多项,构建了6个相关的数据集。相关关键技术在广电总局、中国移动、国家安全等敏感内容检测中得到应用。.该项目的研究成果丰富了模式识别的基础理论,并为社交媒体分析,多媒体应用及敏感内容的检测等应用提供有力的理论和技术支撑。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018

赵耀的其他基金

批准号:31600293
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:51479078
批准年份:2014
资助金额:84.00
项目类别:面上项目
批准号:30800972
批准年份:2008
资助金额:20.00
项目类别:青年科学基金项目
批准号:69802001
批准年份:1998
资助金额:12.00
项目类别:青年科学基金项目
批准号:51906150
批准年份:2019
资助金额:27.00
项目类别:青年科学基金项目
批准号:90604032
批准年份:2006
资助金额:30.00
项目类别:重大研究计划
批准号:50579023
批准年份:2005
资助金额:27.00
项目类别:面上项目
批准号:60776794
批准年份:2007
资助金额:28.00
项目类别:联合基金项目
批准号:81371876
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:60373028
批准年份:2003
资助金额:23.00
项目类别:面上项目
批准号:51079060
批准年份:2010
资助金额:35.00
项目类别:面上项目
批准号:60172062
批准年份:2001
资助金额:20.00
项目类别:面上项目
批准号:91543101
批准年份:2015
资助金额:83.00
项目类别:重大研究计划
批准号:51707114
批准年份:2017
资助金额:26.00
项目类别:青年科学基金项目
批准号:21301181
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:19672020
批准年份:1996
资助金额:9.00
项目类别:面上项目

相似国自然基金

1

管理与决策大数据的模式识别与敏感内容挖掘研究

批准号:91746209
批准年份:2017
负责人:吴信东
学科分类:G0112
资助金额:240.00
项目类别:重大研究计划
2

矢量地理数据共享中敏感内容的伪装方法研究

批准号:41801317
批准年份:2018
负责人:陈令羽
学科分类:D0114
资助金额:24.20
项目类别:青年科学基金项目
3

数据挖掘中的凸规划理论与方法

批准号:10601064
批准年份:2006
负责人:田英杰
学科分类:A0405
资助金额:16.00
项目类别:青年科学基金项目
4

面向大数据的媒体内容分析与关联语义挖掘研究

批准号:61223003
批准年份:2012
负责人:瞿裕忠
学科分类:F0202
资助金额:300.00
项目类别:专项基金项目