Efficient data mining is one of the core techniques for revealing the value of big visual data, which plays an important role in recommendation, trend prediction, and public opinion analysis. Due to the characteristics of diverse source, low quality and lack of labels, big visual data often has large capacity and low value density. Therefore, big visual data mining and analysis have several challenges: "storage difficulty", "calculation difficulty", "low value density", which need urgent corresponding theoretical and technical basis. To address these challenges, this project plans to utilize the efficiency of binary representation in storage and calculation, and studies three research problems, namely "binary data representation for large-scale pattern mining", "efficient pattern mining based on Hamming space analysis", "semantic understanding based on binary neural network", which support each other and step forward gradually. The outcome of this project is expected to provide basic theories and key technologies supporting large scale data mining and analysis, to give solutions to high value data mining in the context of big data, and to play an important role in big visual data perception, services and regulations.
高效数据挖掘是发现大数据价值的核心技术之一,其在内容推荐、趋势预测、舆情分析等领域都发挥着重要作用。由于来源丰富、质量参差不齐、标注信息缺失的问题,网络视觉大数据往往具有容量大、噪声高的特点,给面向网络视觉大数据的挖掘与分析提出了“存不下”、“算不了”、“价值低”的挑战,急需对应的理论基础与技术支撑。针对上述问题,本项目拟围绕二值化表达在大数据存储与计算中的高效性,提出“面向大规模模式挖掘的二值数据表示”、“基于海明空间分析的高效模式挖掘”与“基于二值神经网络的语义理解”三个相辅相成、彼此递进的研究点,展开对应的理论与技术研究。本项目的研究成果有望为大规模数据挖掘与分析提供基础理论和关键技术支持,为网络视觉大数据的高价值信息提取与分析提供解决方案,使多媒体内容分析更好地在网络视觉大数据感知、服务和监管等方面发挥重要作用。
网络视觉大数据内容高效分析与挖掘是管理网络大数据的重要课题。通过该项目,完成了在二值化空间高效挖掘、特定内容高效识别、图像伪造内容生成与识别等方面取得创新性研究成果。具体来说,探索视觉信息的高效分析方法,挖掘二值表达的特点提升网络视觉内容的高效分析能力;探索图像内部结构固有信息的关联性,提升特定视觉内容理解的效率;探索视觉内容自然特征与生成技术特点,提升网络视觉内容真实性。同时在多项国际竞赛中取得三项第一,验证了所提出方法的有效性。并且结合一系列工程技术解决方案,应用于京东拍照购(商品识别)、腾讯文字检测产品(OCR),效果达到国内领先水平。发表学术论文8篇,其中A类论文5篇,包括CCF-A类国际会议/期刊如CVPR, ICCV, TIFS 等。申请发明专利 3项,申请吴文俊人工智能自然科学二等奖1项(第三完成人)。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
论大数据环境对情报学发展的影响
氟化铵对CoMoS /ZrO_2催化4-甲基酚加氢脱氧性能的影响
基于SSVEP 直接脑控机器人方向和速度研究
基于二值量化深度卷积神经网络的视觉检测与跟踪方法研究
基于数据挖掘的网络交通状态分析方法研究
社交网络互动中用户“信息窄化”机理分析:基于微博的数据挖掘
基于网络化数据挖掘的软件重用方法研究