复杂背景图像中文字关键词匹配技术研究

基本信息
批准号:61771468
项目类别:面上项目
资助金额:62.00
负责人:谢洪涛
学科分类:
依托单位:中国科学技术大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:李锡荣,毛震东,白旭,杨嘉佳,方山城,张望,王晓旭,蓝玮毓,孙楠楠
关键词:
多索引哈希复杂背景图像文字区域定位文字关键词匹配跨空间特征融合
结项摘要

The wide spread of Internet images has brought a series of security problems. It is a challenging problem in the field of information security to identify and filter the sensitive text information in complex background images. It also has important research value, social benefits and broad market prospects. Different from the traditional text recognition technology, we attempt to study the text keyword matching in complex background images with image matching, determining whether particular keywords appear in the query image. Firstly, we design stroke feature based text detection method, multi-level text location algorithm and deep learning to hash based cross-space feature fusion framework, to improve the precision of text location and text keyword matching in complex background images. Then, we propose data-oriented multi-index hashing, text geometric consistency constraint and build a CPU-GPU co-processing image matching system, to improve the speed and scalability of text keyword matching. This project will verify its performance with real large-scale network data. Our research can obtain a breakthrough in the key techniques of text keyword matching in complex background images, and provide technical support for national network image supervision.

网络图像的广泛传播带来了一系列安全问题。如何识别过滤复杂背景图像中的敏感文字信息是当前信息内容安全领域的研究热点,具有重要的研究价值、社会效益和广阔的市场应用前景。不同于传统的文字识别技术,本项目以图像样例匹配为技术手段研究复杂背景图像中文字关键词匹配技术,判定特定关键词是否出现于查询图像。拟通过设计基于笔画特征的文字检测算法、多级文字区域定位算法和基于深度哈希学习的跨空间特征融合方法,以有效提高复杂背景图像中文字区域定位和文字关键词匹配的精度;进而通过研究数据依赖的多索引哈希算法和文字几何一致性验证方法,并构建一个CPU-GPU协同处理的样例匹配系统,充分提高文字关键词匹配的速度和可扩展性。本项目将在真实数据环境下验证系统性能,以期在复杂背景图像中文字关键词匹配的关键技术方面取得突破,为国家网络图像管理提供核心技术支持。

项目摘要

以复杂背景图像为载体传播非法文字信息给网络信息内容安全带来巨大挑战。本项目针对这一挑战,研究了多级文字区域定位、多尺度图像文本检测、视觉与语言集成的通用图像文本识别和图像中维语文字(关键词)识别等方法,相关技术指标位居国际先进水平。本项目在国际著名会议和期刊上发表23篇高水平研究论文、授权专利5项、申请专利3项、软件著作权2项;1名项目组成员获得国家级奖励、1名项目组成员获得国家级人才项目;培养5名博士研究生、6名硕士研究生。本项目研究成果已经应用于新疆生产建设兵团公安局及其下辖的14个师(市)级公安局,为防范有害视频在新疆传播发挥了有效作用。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
4

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015
5

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020

相似国自然基金

1

数字图像复杂背景中文字信息的提取与退化识别

批准号:60602031
批准年份:2006
负责人:王春恒
学科分类:F0116
资助金额:27.00
项目类别:青年科学基金项目
2

笔迹图像中关键词语过滤技术研究

批准号:61462080
批准年份:2014
负责人:卡米力·木依丁
学科分类:F0210
资助金额:47.00
项目类别:地区科学基金项目
3

支持多关键词复杂匹配的可搜索代理重加密研究

批准号:61872181
批准年份:2018
负责人:方黎明
学科分类:F0206
资助金额:65.00
项目类别:面上项目
4

复杂背景下的多行文档图像检索技术研究

批准号:61662076
批准年份:2016
负责人:阿不都萨拉木·达吾提
学科分类:F0605
资助金额:42.00
项目类别:地区科学基金项目