计算机模仿人类视觉认知机理,实现对视觉信息的主动获取和理解是一个极具挑战的课题。本项目以揭示在人类视觉选择注意机制下对视觉图像认知的规律为目标,研究视觉信息认知计算中多特征融合的视觉特征的特性和表征,探讨采用流形学习和聚类技术构造出能更好反映图像语义的高效视觉单词本;通过潜在统计结构学习、聚类和鲁棒参数估计等方法,探寻图像、图像主题和视觉单词之间双向推理学习的内在机理;建立具有较强鲁棒性的图像语义认知计算模型;最后结合人类视觉选择性注意特性,实现以高层语义知识为驱动的选择性注意对象主动认知模型,从而发展基于空间观点的视觉注意模型,丰富基于物体对象的视觉注意感知研究。项目成果将为图像理解、目标跟踪和海量图像信息检索等研究提供新的理论方法和技术手段。
实现计算机对视觉信息的主动感知、识别、学习和推理一直是计算机科学发展过程中的挑战性问题。为了揭示在人类视觉选择注意机制下计算机对视觉信息认知的规律,本项目深入研究了满足图像认知需求的底层视觉特征提取和表征的方法以及多特征融合的机理,得到一系列成果,如基于梯度相关矩阵的角点检测算法,基于LoG变换的不变区域检测方法,基于非负矩阵分解和稀疏表示的图像特征提取方法,视觉特征降维和聚类的统一框架以及鲁棒视觉字典本的构造算法等等。本项目还重点研究了图像、多特征基元、视觉语义之间的潜在关系和双向学习机制以及具有语义认知功能的图像视觉注意的内在规律和选择性注意模型的建立,提出了基于潜在语义分析(LSA)的形状语义分析方法和基于显著视觉注意力的自底向上显著区域检测模型。本项目已圆满完成了原计划的所有工作, 项目成果已发表在国内外著名期刊Pattern Recognition,IEEE Transactions on Broadcasting,Journal of Electronic Imaging, Sensor Letters,自动化学报,电子与信息学报,光电子•激光上,共计论文16篇,其中SCI检索5篇,EI检索7篇。
{{i.achievement_title}}
数据更新时间:2023-05-31
监管的非对称性、盈余管理模式选择与证监会执法效率?
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
基于SSVEP 直接脑控机器人方向和速度研究
内点最大化与冗余点控制的小型无人机遥感图像配准
基于多模态信息特征融合的犯罪预测算法研究
基于视觉注意与眼动跟踪的地图认知计算模型与方法研究
视觉注意的计算模型及其应用
视觉注意模型在语义视频搜索中的应用
基于协同式视觉注意的认知计算与交互技术研究