基于层次化学习算法的大规模目标识别

基本信息
批准号:61373077
项目类别:面上项目
资助金额:75.00
负责人:曲延云
学科分类:
依托单位:厦门大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:李翠华,沈佳烈,伍洋,严严,李建敏,杨小清,廖威敏,周燕稳,宋书阳
关键词:
视觉感知分层分层视觉树层次化学习大规模视觉目标识别学习复杂性
结项摘要

Facing the great challenges brought by the high computational efficiency and effectiveness demands of large-scale visual recognition, we propose to build a hierarchical learning model for solving the problem more effectively and efficiently, inspired by the hierarchical visual perception mechanism of human vision. This research will build a visual-perception-driven hierarchical tree to reflect the visual topological structure of object categories which can be leveraged to guide the selection of the optimal number of the nearest neighbors eliminating the sensitivity to it for the K-NN algorithm which has been proven to be promising in the large-scale visual recognition field. It will also look into the evaluation and prediction of the data separability and the complexity of classifier learning, in order to select the optimal K-NN model for an improved performance. Moreover, the research will cover the design and training of classifiers based on the hierarchical visual tree, along with the constructing of a top-down hierarchical recognition framework, targeting at significantly reducing the optimization cost of K-NN and controlling the inter-layer error propagation. All the above efforts will greatly improve the efficiency and boost the recognition performance. The research utilizes the divide-and-conquer strategy for large-scale visual recognition, which is expected to result in a novel computational model, overcoming the efficiency and effectiveness limitations of traditional pattern recognition methods. It is fundamental to the theory and algorithm development of the large-scale visual recognition. The achievements will significantly promote the research in computer vision, multimedia and other related fields, whilst advance its industrial and commercial applications, showing great values in both academia and industry.

面对大规模视觉目标识别带来的计算效率和性能要求上的挑战,课题拟借鉴视觉感知的层次化机制,建立大规模视觉目标识别的层次化学习模型,提高计算效率、改善识别性能。本课题通过构造视觉感知驱动的分层视觉树,反映目标类之间的视觉拓扑关系,指导最优的K-NN近邻参数选择,从而克服在大规模目标识别中被证明有潜力的K-NN分类器对近邻参数的敏感性;研究目标类可分性和分类器学习复杂性的评估预测方法,选择最优的K-NN学习模型,改善分类性能;研究分层视觉树结构驱动的分类器设计与训练,建立自顶向下的分层识别框架,显著降低K-NN的优化代价并控制层间误差传播,提高效率和识别性能。本研究对大规模目标类识别采用分而治之策略,可克服传统模式识别方法在效率与性能上的局限,预期将形成新的计算模式,为大规模视觉目标识别的理论和算法研究奠定基础。其成果有助于推动计算机视觉和多媒体等领域的研究,具有重大的科学意义和应用价值。

项目摘要

面对大规模视觉目标识别带来的计算效率和性能上的挑战,课题拟借鉴视觉感知的层次化机制,建立大规模视觉目标识别的层次化学习模型,提高计算效率,改善识别性能。本课题通过构造视觉感知驱动的分层视觉树,反映目标类之间的视觉拓扑关系;研究目标类可分性和分类器学习复杂性的评估预测方法,改善分类性能;研究分层视觉树结构驱动的分类器设计与训练,建立自顶向下的分层识别框架,显著降低模型优化代价并控制层间误差传播,提高效率和识别性能。本项目取得的重要成果如下:1)提出了一种新的层次化的类结构学习和大规模图像分类联合学习的方法,包括三个方面的贡献,设计了一种新的类间相似性度量,基于分层谱聚类形成视觉树;设计基于最优路径的图像类别标号预测方法。2)提出了基于Bregman 迭代的联合字典学习方法。父节点形成公共字典,叶子节点形成判别字典,提高了类标号预测效率。3)提出了基于超图聚类正则化的非负矩阵分解方法并用于图像聚类。将单个超图限制拓展到多个超图限制,提出多个超图结构自适应学习的低秩矩阵分解方法。4) 将层次化学习的思想应用于行人再识别,设计基于时间增强卷积神经网络的面向视频的行人再识别。5)提出了基于耦合自编码网络的超分辨重建方法和基于锚点高斯过程回归的超分辨重建方法。本项目共发表论文23篇,其中SCI期刊论文14篇(JCR1区论文1篇,JCR2区论文8篇),一篇论文被顶级会议AAAI2018录用。授权发明专利一项。参加2017年中国智能车未来挑战赛离线组比赛—交通标志识别获得一等奖,2017年CCF大数据与计算智能大赛舰船识别组比赛三等奖,获得2016年福建省优秀硕士学位论文一篇。本研究对大规模目标类识别采用分而治之策略, 可克服传统模式识别方法在效率与性能上的局限,形成新的计算模式,为大规模视觉目标识别的理论和算法研究奠定基础。该研究成果可推广到异构大数据分析、图像标注等多方面应用,有助于推动计算机视觉和多媒体等领域的研究,具有重大的科学意义和应用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018

曲延云的其他基金

批准号:61876161
批准年份:2018
资助金额:66.00
项目类别:面上项目

相似国自然基金

1

基于层次化表达的大规模图像物体识别

批准号:61673375
批准年份:2016
负责人:黄凯奇
学科分类:F0304
资助金额:62.00
项目类别:面上项目
2

基于仿生学习的多拍摄角度视频目标识别算法

批准号:61170193
批准年份:2011
负责人:蔡昭权
学科分类:F0210
资助金额:50.00
项目类别:面上项目
3

面向遥感影像分类的“场景-目标-像素”层次化迁移学习研究

批准号:61601522
批准年份:2016
负责人:石茜
学科分类:F0113
资助金额:22.00
项目类别:青年科学基金项目
4

基于稀疏表示和深度学习的大规模目标检测

批准号:61572472
批准年份:2015
负责人:唐胜
学科分类:F0210
资助金额:66.00
项目类别:面上项目