The topic on unstructured random natural scene perception and understanding is a challenging problem in visual imaging and processing research area. This paper, taking example by Biological Vision Model(BVM), is devoted to providing a new technical approach for the scene perception and recognition by merging new cognitive visual features into the scene expression. Inspired by Nerve Cells Cognitive Intelligence, we make use of the characteristics of Gabor filter and Laplacian of Gaussian filter which is be akin to V1 cells in the biological visual cortex, and apply the wavelet transform and ICA to study a new technique in adaptive natural scene perception and recognition. Especially through the study of the biological visual model, the adaptive recognition ability of the natural scene image is enhanced with the integration of cognitive visual features and the scene expression, and new related algorithms are put forward to solve varieties of critical theoretical problems in visual image processing system such as diversity, randomness, complexity and moveability, in order to discover the inherent law and dialectical characteristics and provide new scientific research thoughts and methods in robot visual perception, exception handling in video surveillance, intelligent warning, mass image fast retrieval, efficient image storage and et al.
对非结构化、随机性自然场景的感知和理解,是视觉成像处理系统中具有挑战性的前沿课题。本课题通过借鉴生物视觉模型,将场景表达与认知学新视觉特征进行融合,为场景感知和辨识提供一种新的技术手段。受视神经细胞认知智能启发,特别是利用生物视觉皮层上的V1细胞,具有类似于Gabor滤波器和高斯拉普拉斯滤波器特性,借助小波变换和独立分量分析原理,探索新型算法,研究自适应自然场景感知和新的识别技术。其中,通过生物视觉模型的研究,将认知学新特征与场景表达相融合,提升自然场景图像的自适应辨识能力。为此,提出新的相关算法,解决视觉图像处理系统中面临的自然场景多样性、随机性、复杂性以及运动性所带来的一系列关键理论问题,揭示其内在规律与辩证特性,为机器人视觉感知、视频监控异常处理、智能化预警和海量图像的快速检索和高效摄像存储等领域,提供新的科学研究方法和手段。
图像理解(Image Understanding)是近年来计算机学科的热点研究领域。它是对图像的语义理解,与认知学的视觉生理学和心理学有密切的联系。用计算机从影像中提取被摄景物语义信息,以实现图像的识别、分类和判读。图像理解所包括的内容主要是场景的描述和理解、场景中目标的识别。计算机视觉是使用计算机及相关设备对生物视觉的一种模拟。与计算机视觉相关的学科包括认知学、神经生理学、计算机科学与工程、物理学、信号处理、应用数学与统计等学科。.近年来,经过认知心理学,认知生理学和神经科学等领域科学家的共同努力和深入研究,从生物视觉系统的“低级”表达到“高级”的视觉认知形成机理,都取得了丰硕的研究成果,为基于视觉感知机制的图像理解技术奠定了坚实的理论和实验基础:.图像分割(Image Segmentation):所谓图像分割就是按一定的规则将图像划分成若干有意义的区域,即各区域的并集是整个图像,各区域的交集为空集。图像分割利用目标和背景的差异性,对图像中的目标和背景像素进行标识,实现从背景图像中提取目标的功能,包括基于边缘特征的分割方法, 基于阈值的分割方法, 基于区域的分割方法以及复合分割方法。.目标识别:发现场景中的目标及目标的位置就是目标识别。.基于视觉层次感知机制的图像理解:认知学为图像理解提供人类视觉的基本原理和认知过程,图像理解通过建立与人类视觉机制相似的计算机视觉理解系统来实现快速有效的场景理解,对人的视觉系统工作机制及人如何利用知识实现场景理解的研究尤为重要。.图像特征表达,以及图像分类器:K-means,SVM,BPNN。.针对本研究课题,项目组做了大量而有效的工作:提出了生物启发的复杂场景分割模型,利用量子计算的优化算法对生物启发的图像进行处理以提高算法的效率,增强图像处理鲁棒性理论与方法,spiking神经网络在图像抗噪处理的方法研究,deep learning模型进行图像识别分类处理方法等,在图像处理理论与技术方面做出了重要贡献,为进一步的研究打下了良好的理论和实践基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
基于SSVEP 直接脑控机器人方向和速度研究
拥堵路网交通流均衡分配模型
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
城市复杂环境下基于视觉和通信的智能车辆感知与定位
基于多模型嵌入技术的复杂环境感知研究
基于判别图模型的复杂环境下自治机器人定位与地图构建研究
面向动态复杂无线环境基于多域无线信息融合的认知协作定位与跟踪模型