基于后顶叶皮层注视角、汇聚角和视差神经机制的深度感知模型

基本信息
批准号:61771146
项目类别:面上项目
资助金额:62.00
负责人:危辉
学科分类:
依托单位:复旦大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:陶晓鹏,唐雪嵩,任远,郁钱,阳诚砖,戴大伟,王陆平,苏子豪,张欢
关键词:
生物信息系统仿生建模
结项摘要

Although human perception of depth has a limited precision and range compared with laser radars, its reliability, adaptability, and effectively is superior to artificial systems due to its combination with other visual abilities. The perception of depth of biological vision concentrates on visual cortexes. The fundamental clue of binocular parallax is formed in the V1 area, but has its limitations because reception fields cannot disambiguate. A parallax signal accomplish two basic tasks of 3D spatial location and 3D object recognitions using the detected complex features through the dorsal part (via V5 into parietal area 7) and the ventral pathway (via V4 into inferotemporal cortex area IT). It greatly inspires algorithm designs that the neural population based sparse coding mechanism represents the statistical features of images, detects depth discontinuity using neuronal lateral inhibition to disambiguate, realizes the transformation between a allocentric coordinate system and an egocentric coordinate system using the parallax compensation of head movement and eye movement, strengthens the saliency in the depth differences of objects outside the focal plane using the parallax compensation for a distance, and the short term effect of parallax selectivity should reveal the existence of a direct pathway from V1 to higher visual cortex. This research is of great significance in the following aspects: the research imitates those elaborate biological mechanisms, designs the engineering model of depth perception with a similar calculation principal to posterior parietal cortex by simulating the cortical structure and the calculation circuit, explores a new approach for depth perception, and applies psychological achievements to engineering practice.

虽然人感知深度的精度和范围相对激光雷达而言是有限的,但和其它视觉功能捆绑,其可靠性、适应性、高效性是当前人造系统所不及的。生物视觉的深度感知集中于视皮层,最基础的双目视差线索形成于V1区,但限于感受野范围不具消歧能力。视差信号经背侧(经V5入顶叶7区)和腹侧通路(经V4入颞下皮层IT区),用检测出的更复杂特征完成3D空间定位和3D物体识别两个基础性任务。基于神经元集群的稀疏编码机制表征自然图像统计特性,利用神经元的侧抑制特性检测深度不连续性来消歧,利用头动和眼动的视差补偿实现物体中心和观察者中心坐标系的转换,用对距离的视差补偿来增强焦平面外物体深度差异的显著性,以及视差选择性的短时效应能揭示V1到更高视觉皮层存在直接通路等对算法设计都极具启发性。本项研究基于神经生物学机制,在设计深度感知工程模型时采用类似后顶叶皮层的计算原理,模拟其皮层结构和计算回路,探索深度感知在工程应用上的新方法。

项目摘要

双目视觉是人的视觉系统中,产生立体感知的一个重要的组成部分。它能通过计算人的左右双眼获得图像之间的相似与差异,来获取场景物体的深度信息。这在双目生物的场景识别、场景理解、运动控制和路径规划等方面都起着重要的指导作用。同时,对人眼的双目视觉系统进行研究,在揭示生物系统立体知觉原理、生物系统视觉神经传递机制上同样有着重要的意义。而视觉皮层是人脑处理视觉信息的重要部分,V1层和V2层都是视觉皮层的一部分。V1层是初级视觉皮层,它主要接受来自外侧膝状体的输入。V2层是次级视觉皮层,对它的了解相对较少,它主要接受来自V1层的输入,并对更复杂的刺激有反应。并且有研究发现,部分V2层感受野是由V1层感受野组合而成的。在现有的双目视觉模型中,纯粹的数学计算模型缺乏生物学依据。它们没有生物学研究和实验的支持,因此难以和人的神经系统理论兼容,没有生物学上的意义。并且一些基于全局的数学计算模型过于复杂,若转化为硬件就会有较高的硬件复杂度,因此并不适用。而现有的生物模型又在精度上有所欠缺,一些基于初级视觉皮层感受野的生物学模型都会受到感受野尺度的限制。将初级视觉皮层的神经元感受野尺度设置过大是不合适的,因此这些模型的可求视差范围受到了限制。本研究通过对视觉皮层中V1层和V2层部分功能的模拟,设计了一个双目视觉的生物工程模型,该模型能根据输入的左右两张图片求出图片中物体的对应视差。该模型模拟了部分视觉皮层的特征,有生物学依据,对研究人脑的立体视觉感知过程有指导和启示作用。该模型加入了对V2层部分特性的探索和研究,这是在很多生物学模型中都没有的。该模型结合了颜色、方向和区域特征信息,并用左右一致性和不同尺度感受野进行了求精,相较于一些生物学模型有较高的精度。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

DOI:10.16085/j.issn.1000-6613.2022-0221
发表时间:2022
3

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022
4

疏勒河源高寒草甸土壤微生物生物量碳氮变化特征

疏勒河源高寒草甸土壤微生物生物量碳氮变化特征

DOI:10.5846/stxb201912262800
发表时间:2020
5

生物炭用量对东北黑土理化性质和溶解有机质特性的影响

生物炭用量对东北黑土理化性质和溶解有机质特性的影响

DOI:10.19336/j.cnki.trtb.2020112601
发表时间:2021

危辉的其他基金

批准号:60303007
批准年份:2003
资助金额:25.00
项目类别:青年科学基金项目
批准号:61375122
批准年份:2013
资助金额:78.00
项目类别:面上项目

相似国自然基金

1

基于高分辨率神经影像的后内顶叶皮层高精度亚区图谱构建计算方法及其验证研究

批准号:91432115
批准年份:2014
负责人:贺永
学科分类:H2708
资助金额:80.00
项目类别:重大研究计划
2

引入新大脑皮层视觉感知计算模型和深度信息的室内人体动作识别

批准号:61502494
批准年份:2015
负责人:贾立好
学科分类:F0210
资助金额:20.00
项目类别:青年科学基金项目
3

基于眼动机制的大视差计算模型

批准号:90820012
批准年份:2008
负责人:胡占义
学科分类:F0304
资助金额:50.00
项目类别:重大研究计划
4

大脑后顶叶皮层内的空间编码和多感觉整合

批准号:31471047
批准年份:2014
负责人:陈晓冬
学科分类:C0904
资助金额:88.00
项目类别:面上项目