计算机视觉赋予机器对视觉环境感知、计算和理解的高级智能,具有重要的理论意义和实际价值。以Marr视觉理论为代表的现有计算机视觉研究工作局限于欧氏空间,和人类认知空间具有显著差异,因而在复杂的应用场景中缺乏鲁棒性。本项目从人类视觉认知机理出发,研究非欧氏空间视觉计算的理论和方法,建立相应的数学基础,提出非欧空间视觉特征表达和模式匹配算法,推动计算机视觉走向实用;结合机器和生物视觉智能对非欧空间认知机理进行探索,促进信息科学和认知科学的交叉融合;将非欧视觉计算应用于图像和视频分析、目标检测与识别等具体视觉问题,构建理论研究成果的原型验证系统。本项目变革视觉计算的基础空间,有望开辟计算机视觉学科发展的新方向,使我国在非欧空间视觉研究方面引领国际发展,并为我国在多媒体检索、视频监控、生物特征识别、人机交互、视觉导航等战略高技术领域的自主创新提供理论基础和核心算法。
以 Marr 视觉理论为代表的现有计算机视觉研究工作局限于欧氏空间, 和人类认知空间具有显著差异,因而在复杂的应用场景中缺乏鲁棒性。本项目从人类视觉认知机理出发,研究非欧氏空间视觉计算的理论和方法,建立相应的数学基础,提出非欧空间视觉特征表达和模式匹配算法,推动计算机视觉走向实用;将非欧视觉计算应用于图像和视频分析、目标检测与识别等具体视觉问题,构建理论研究成果的原型验证系统。..该项目已全面完成计划书中预定的研究目标,取得一系列高水平研究成果:在拓扑空间学习上,提出了基于拓扑持续同调的目标表达框架,涵盖特征提取、拓扑空间构建、拓扑不变性计算、基于拓扑不变性的目标表达等方面,对光照、遮挡、形变等具有非常强的鲁棒性;在稀疏和低秩空间学习上:以共轭函数诱导的半二次函数逼近为基础,以向量和矩阵为研究对象,分别研究了鲁棒稀疏向量和鲁棒低秩矩阵的恢复问题;在语义空间学习上,提出了特征编码的理论框架,统一目前国际上主要的特征编码方法,揭示了特征编码的本质特征,并将其应用于目标分类和虹膜识别等问题;在隐式空间学习上,提出了相关主题模型,通过层级先验来联合学习目标的隐藏主题和分类器,在非结构化的复杂社交视频分析中取得了当前国际最好结果。..受该项目资助发表论文34篇,受Springer出版社邀请撰写专著2部,申请国家发明专利17项。研究成果获ICPR2014最佳学生论文奖,CCCV2015最佳学生论文,CCBR2015最佳论文奖,CVPR DeepVision研讨会最佳论文奖,百度人形分割大赛冠军等奖励和荣誉。在人才培养与国际合作交流方面,项目负责人在项目执行期间分别当选为中科院院士、英国皇家工程院外籍院士和发展中国家科学院院士。依托该项目已经培养杰青1名,教授1名,副教授2名,培养博士18名,硕士2名,博士后2名。在项目实施过程中,组织国际/国内会议2次。..本项目变革视觉计算的基础空间,有望开辟计算机视觉学科发展的新方向,使我国在非欧空间视觉研究方面引领国际发展,并为我国在多媒体检索、视频监控、生物特征识别、人机交互、视觉导航等战略高技术领域的自主创新提供理论基础和核心算法。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
基于SSVEP 直接脑控机器人方向和速度研究
伴有轻度认知障碍的帕金森病~(18)F-FDG PET的统计参数图分析
低轨卫星通信信道分配策略
基于视觉计算的井下信息感知理论与预警方法研究
欧氏空间与仿射空间曲面的变形及其应用
空间非合作目标基于点云模型的视觉与惯性融合相对导航方法与实验研究
非欧氏空间上Hamilton系统的类Bertrand-Darboux定理的研究