How to improve the visual recognition ability of machines by applying information processing system of human visions has become a hot research topic in computer vision field in recent years. However, the great challenge is how to imitate the typical function or information processing mechanism of the brain vision system to equip the computers with the recognition ability comparable to the mankind. In this project, combined with existing machine learning methods, we plan to establish a system of objects recognition and classification with characteristics of human vision based on the information processing mechanism and principles of human visual cortex. The concrete research of this project includes: 1) introduce the human visual selective attention mechanism and learning mechanism, and improve the learning ability in visual cognition models, then use for "learning" prototypical features of the objects and enhancing the separability of the coding, 2) simulate the coding mechanism of human advanced vision system, and establish a polynomial bidirectional mapping based on the manifold learning theory, then used for effectively extracting the essential features of objects, 3) introduce some key mechanisms of vision system in support vector machines (SVMs), and improve the classification speed and accuracy. The results of this project not only provide new solving methods for objects recognition and classification, but also they have a revelation effect for the research on biology and psychology. Hence, this project has an important theoretical significance and vast application prospect.
近年来借助人类视觉的信息处理机制来增强机器视觉的识别能力已成为计算机视觉领域的研究热点之一。然而,如何模拟大脑视觉系统的典型功能或信息处理机制,使计算机拥有人类所具备的识别能力,却是我们面临的一大挑战。本项目拟借鉴人类视觉系统的信息处理机制以及视觉心理认知准则,结合现有的机器学习方法,构建具有人类某些视觉功能特性的目标识别和分类系统,具体包括:1)在视觉认知模型中引入人的选择性注意机制和学习机制,改善模型的学习能力,用于"学习"目标的原型特征向量,提高编码的可分性,2)模拟人的较高层次视觉系统的编码机制,建立基于流形学习理论的多项式双向映射模型,用于目标本质特征的快速提取,3)将视觉认知系统中的若干关键性机制引入到支持向量机中,用于提高分类器的分类速度和精度。所获结果将不仅为目标识别和分类问题提供新的解决方案,也有望对生物学、心理学的研究有启示作用,因而具有重要的理论意义与广阔的应用前景。
目标识别和分类作为计算机视觉领域中的重要研究方向,长期以来受到了众多学者的广泛关注。真实世界环境下的目标物体呈现出复杂的多样性,其表观形式由于受到各种视角变化、光照变化、目标遮挡、背景干扰、场景变化等因素的影响而千差万别,从而给计算机识别带来巨大的挑战。本项目从图像恢复、字典学习与稀疏编码、本质特征提取以及高效SVM分类器设计等方面开展一系列创新性的研究工作。首先,我们把视频图像序列看做三维张量,运用低秩张量模型实现了图像序列的对正、对齐、去噪以及缺失像素的填充。其次,将数据之间的结构稀疏性加入到字典学习模型中,从而在训练过程中迫使无标签样本能够自动加入到它所在的样本类别中,与其同类的有标签样本共享少数字典元素,提高了字典的抗噪声能力和区分能力。再次,在基于稀疏编码的目标分类方面,合理利用无标签样本与有标签样本之间的稀疏结构信息和仿射结构信息,并将此信息融入到分类器的训练过程中,提高了分类器的精度。然后,提出基于测地线的半监督多流形学习的正则化方法和基于“LDA的特征融合”+“LDA评分函数”的特征选择方法。最后,根据Radmacher复杂度给出了混合线性SVM分类器的期望风险的一个上界估计,从而设计出具有层次树结构的的高效SVM分类器算法;为了克服核分类器分类速度较慢的问题,设计了针对图片数据的块-多项式映射,它不仅能够提取出图像的局部结构特征,更重要的是它的分类复杂度与训练样本的个数无关,因此能够很大程度上提高了目标行为的分类速度。本项目在《IEEE Transactions on Image Processing》、《Pattern Recognition》、《IEEE Signal Processing Letters》、《Neurocomputing》、NIPS、IJCAI、AAAI等国际知名期刊和会议上发表论文 14 篇,申请发明专利6项,已授权专利 3 项。在项目支持下,申请人获批浙江省科技厅公益性工业项目1项,入选温州市551人才计划,培养了多名硕士研究生,达到了课题预期目标,圆满完成课题任务。
{{i.achievement_title}}
数据更新时间:2023-05-31
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
伴有轻度认知障碍的帕金森病~(18)F-FDG PET的统计参数图分析
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于细粒度词表示的命名实体识别研究
基于视觉认知方法的视频目标分类与识别研究
视觉认知机制启发的无人机自主压缩目标成像与识别
服务机器人的环境认知与目标行为识别
基于RGB-D视觉的机器人目标识别与获取技术研究