目标协同分割与识别技术的研究

基本信息
批准号:61471321
项目类别:面上项目
资助金额:80.00
负责人:于慧敏
学科分类:
依托单位:浙江大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:张仲非,胡浩基,郑伟伟,谢奕,杨白,李燕飞,周厚奎,汪东旭,舒醒
关键词:
目标识别深度学习先验知识目标分割
结项摘要

Human can segment and recognize objects precisely in complex scenes. However, it has proven to be a severe challenge for machine vision systems. Aimed at this challenge, this research pursues a cooperative solution to the problems of object segmentation and recognition. This study attempts to provide a different solution to cooperative object segmentation and recognition by simulating the mechanism of the coordination between "bottom-up" and "top-down" on the inner mechanism and a more micro level.We hope to further understood the mechanism of the coordination between "bottom-up" and "top-down" through this study, and want to be able to reduce the gap between these two processes and to promote its application in computer vision. This project belongs to computer vision, machine learning, cognitive science and mathematics of interdisciplinary,and will be to study the computing model of cooperative object segmentation and recognition and related issues surrounding some key issues such as how to understand and mimic the mechanism of the coordination between "bottom-up" and "top-down", prior data uniform representations, multi-layer features based inference and reconstruction,inference and reconstruction based cooperative object segmentation and deep learning. This project will implement an image recognition system DEMO, for the particular or bad information image recognition in the Internet or Internet of things.

人类能够在复杂场景中精确分割和识别目标,但这对于机器视觉却是一种严峻的挑战。针对这一难题,本项目提出了图像协同分割与识别技术的研究。本项目试图从内在工作机理和更微观层面上模拟自底向上与自顶向下这两个过程之间的协调工作机理,来研究图像的协同分割与识别技术,提高其处理能力。希望通过本项目的研究能够进一步理解自底向上与自顶向下这两个过程之间的协调工作原理,减少这两个过程之间鸿沟,并推动其在计算机视觉中的应用。本项目研究属于计算机视觉、机器学习、认知科学和数学等多学科交叉,项目将围绕如何理解和模仿自底向上和自顶向下这两个过程的协同工作机理、先验数据统一表达问题、多层特征推理与重建、基于推理和重建的图像协同分割、深度学习等关键问题与技术,来研究图像协同分割与识别计算模型及其相关问题与技术。本项目将实现一个图像识别系统的DEMO,用于互联网或物联网中特定或不良图案图像的识别。

项目摘要

人类能够在复杂场景中分割和识别目标,但这对于机器视觉却是一种严峻的挑战。针对这一难题,本项目提出了图像协同分割与识别技术的研究。本项目从内在工作机理和更微观层面上模拟自底向上与自顶向下这两个过程之间的协调工作机理。项目研究内容包括如何理解和模仿自底向上和自顶向下这两个过程的协同工作机理、先验数据统一表达问题、多层特征推理与重建、基于推理和重建的图像协同分割与识别、深度学习等关键问题与技术。项目提出了两种图像协同分割和识别的框架:基于RBM和基于Capsule网络;在国际/国内重要期刊/会议上发表论文18篇,其中一篇发表在AAAI会议上,一篇发表在ICCV会议上;受理发明专利28项,其中授权6项。项目的主要贡献在于:1)我们提出了基于深度学习的可拓展的协同分割与识别模型,用于对视觉认知机制的模仿,其中分割任务与识别任务相互交流,相互促进和协同,能够提升计算机在这两个任务上的性能和表现。而且,任务的协同也给识别结果带来了更多的解释性,因为识别过程中提取到的特征必须能够解释和生成出原始目标。模型中的两个重要模块“编码器与解码器”可以进行任意拓展,也可以替换为其他不同的模块,以满足模型在不同场景的应用需求。2)基于Capsule的模型能够在协同任务执行的过程中,解耦目标与干扰的特征,过滤掉干扰信息,更好地提取到目标的形状特征;而Capsule神经元独特的设计也保证了提取到的特征中,每一维数据都具有某种特定的含义,因此能够进一步提升识别过程的可解释性,以及生成的目标参考形状的可解释性。3)RBM的判别特性和生成性被应用到协同分割与识别模型中,一方面用于提取目标形状的特征,同时完成识别任务;另一方面则基于特征和识别结果,生成出参考形状用于约束分割结果。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
2

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
3

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
4

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

于慧敏的其他基金

批准号:41503001
批准年份:2015
资助金额:22.00
项目类别:青年科学基金项目
批准号:60172079
批准年份:2001
资助金额:3.00
项目类别:面上项目
批准号:21776157
批准年份:2017
资助金额:64.00
项目类别:面上项目
批准号:20976094
批准年份:2009
资助金额:34.00
项目类别:面上项目
批准号:20206014
批准年份:2002
资助金额:20.00
项目类别:青年科学基金项目
批准号:21476126
批准年份:2014
资助金额:90.00
项目类别:面上项目
批准号:60872069
批准年份:2008
资助金额:30.00
项目类别:面上项目
批准号:21176143
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:10901095
批准年份:2009
资助金额:16.00
项目类别:青年科学基金项目
批准号:11671237
批准年份:2016
资助金额:48.00
项目类别:面上项目
批准号:41873007
批准年份:2018
资助金额:68.00
项目类别:面上项目

相似国自然基金

1

基于图理论的目标分割与识别研究

批准号:60605004
批准年份:2006
负责人:程健
学科分类:F0304
资助金额:24.00
项目类别:青年科学基金项目
2

协同目标群存在性检测与识别技术研究

批准号:61401475
批准年份:2014
负责人:宋志勇
学科分类:F0111
资助金额:26.00
项目类别:青年科学基金项目
3

基于深度学习的协同目标分割与行为理解研究

批准号:61401098
批准年份:2014
负责人:陈飞
学科分类:F0116
资助金额:27.00
项目类别:青年科学基金项目
4

基于随机场的声纳图像分割与目标识别

批准号:41506121
批准年份:2015
负责人:宋三明
学科分类:D0608
资助金额:15.00
项目类别:青年科学基金项目