As the rapid development of Internet、personal sensor equipment (such as mobile phone)、wechat and microblog, vast amount of diverse data which are unstructured, low quality, multi-modal, heterogeneous and non-homologious,have been generated. How to mine some useful information from the massive data is a key technology nowadays.. Focused on the diverse data which are low quality、multi-modality and heterogeneous、multi-source and non-homologious,the project will study the pattern recognition theory and method for the massive diverse data, including the cleaning and reduction of low-quality and redundant diverse data, consistency representation of heterogeneous data, the validity identification of multi-source and non-homologous diverse data, association modelling of diverse data, etc. The project will further apply the theory and method to the analysis and mining of sensitive content with diverse data properties.. The research achievement will not only enhance the theory of traditional pattern recognition, but also provide theoretical and technological support to the applications such as social media analysis, multimedia applications, big data anakysis and sensitive content detection.
伴随着互联网、个人传感设备(手机等)、微信、微博等信息技术的飞速发展,人类社会产生了数以亿计的具有非结构化、多态异构、多源异质、不完备以及过度冗余等特性的混杂数据,如何从这些海量的数据中挖掘出有用信息是当前信息领域亟待解决的核心问题之一。. 围绕海量低质、多态异构、多源异质的混杂数据,本课题拟开展混杂数据模式识别的基础理论与方法研究,包括海量低质混杂数据的清洗与约减、多态异构混杂数据的同构表征、多源异质混杂数据的有效性辨识以及多源混杂数据的关联建模等,实现混杂数据的清洗、统一表示、有效性辨识、进而实现数据间的关联建模,构建混杂数据模式识别的基础理论,并将理论研究成果应用于具有混杂特性的敏感内容(暴恐视频等)的分析与挖掘中。. 研究成果将丰富模式识别的基础理论,并为社交媒体分析,多媒体应用,大数据及敏感内容的检测等应用提供有力的理论和技术支撑。
伴随着互联网、个人传感设备(手机等)、微信、微博等信息技术的飞速发展,人类社会产生了数以亿计的具有非结构化、多态异构、多源异质、不完备以及过度冗余等特性的混杂数据,如何从这些海量的数据中挖掘出有用信息是当前信息领域亟待解决的核心问题之一。.课题组以低质、多态异构、多源异质的混杂数据为研究对象,围绕低质混杂数据的清洗与约减、多态异构混杂数据的同构表征、多源异质混杂数据的有效辨识、多源混杂数据的关联建模这四个混杂数据计算的关键问题,开展了混杂数据模式识别基础理论方面的研究工作。课题组提出了面向任务指派的数据约减模型、基于语义匹配的跨模态数据表征、基于CNN的图像多标签属性辨识、基于多粒度层级网络的跨模态关联学习、面向细节挖掘的图像细粒度分类等创新性算法,实现了混杂数据的约减与增强、表征、辨识和关联等,进而挖掘出潜在的规律和模式,并以此为基础实现了具有混杂特性的敏感数据内容的分析与挖掘。课题执行期间共发表论文95篇,其中期刊论文61篇,会议论文34篇。相关重要研究成果在IEEE Transactions on Pattern Analysis and Machine Intelligence(PAMI), International Journal of Computer Vision(IJCV)以及CVPR,IJCAI等领域重要期刊和会议上,3篇论文已被google scholar引用300次以上。以第一完成单位获中国图像图形学学会科学技术奖一等奖和教育部自然科学二等奖各1项,获CVPR国际竞赛中冠军等奖励多项,构建了6个相关的数据集。相关关键技术在广电总局、中国移动、国家安全等敏感内容检测中得到应用。.该项目的研究成果丰富了模式识别的基础理论,并为社交媒体分析,多媒体应用及敏感内容的检测等应用提供有力的理论和技术支撑。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
跨社交网络用户对齐技术综述
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
管理与决策大数据的模式识别与敏感内容挖掘研究
矢量地理数据共享中敏感内容的伪装方法研究
数据挖掘中的凸规划理论与方法
面向大数据的媒体内容分析与关联语义挖掘研究