文本检测是可视媒体高层语义分析、自动语义标注和内容检索的关键技术之一。本项目的目标是借鉴人类视觉感知与认知的选择性注意与反馈特性,把文本显著特征的先验知识引入传统的视觉选择注意计算模型,针对可视媒体中的文本区域,选择文本模式的特殊显著特征,通过视觉底层特征与高层知识的协作,形成Bottom-up和Top-down的反馈结构,构建适合于文本检测任务的视觉选择注意计算模型。该模型通过选择性显著特征提取、特征显著图的竞争与协同计算、以及视觉显著图的级联检测,解决可视媒体文本显著区域的快速检测问题。
本项目借鉴人类视觉感知与认知的选择注意与反馈机理,针对视觉对象检测的层次认知计算模型,通过局部单元解析逐步实现对视觉对象的整体认知;探索了自然场景图像文本区域的快速检测、随机森林形状片段上下文样本学习的物体检测以及场景高层语义目标检测与属性计算的理论问题;所提出的一种基于网格模型预测的文本图像几何变形恢复方法的相关论文已在2012年IEEE T-PAMI上发表,此外,研究开发了两个具有完全自主知识产权的主动视觉识别系统:文本内容变化的非编码快速检测系统、大场景微小目标图像采集双视觉系统。
{{i.achievement_title}}
数据更新时间:2023-05-31
监管的非对称性、盈余管理模式选择与证监会执法效率?
基于细粒度词表示的命名实体识别研究
基于全模式全聚焦方法的裂纹超声成像定量检测
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
基于密集快速特征提取的可视媒体篡改检测研究
基于视觉注意机制的迷彩伪装评价模型和检测方法研究
海量文本信息集合可视化呈现及可视化文本检索方法研究
无需视觉注意力的文本输入方法研究