基于随机森林和深度学习耦合模型的RGB-D图像语义标注关键技术研究

基本信息
批准号:61702185
项目类别:青年科学基金项目
资助金额:24.00
负责人:王青正
学科分类:
依托单位:华北水利水电大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:刘雪梅,曹源昊,刘雨,刘玉宇,梁栋,曹智辉,马瑞志,郭琳
关键词:
稀疏表示随即森林语义标注深度学习先验知识
结项摘要

The desire to the unified optimization framework coupling feature learning and the classification model has focused the attention of the image semantic labelling community. Due to the higher complexity of the model, the larger size of parameter, and the exchange between parameter, the realization of the coupling model inevitably encounter difficulties in computational power, storage requirement, and efficient optimization. However, the low accuracy rate caused by prediction error of decision tree and the general lack of expert knowledge is a tough challenging problem for the classification method. To solve the aforementioned challenges, we investigate a host of research problems and develop a range of technical solutions in this project. First, we propose a new feature mapping method (which can preserve most of the discriminative information) to resolve the problem of feature reuse, and introduce the expert knowledge into the prediction model to improve the accuracy rate. Second, by extending the sparsity analysis method to parameter tuning, we plan to devise a new algorithm to effectively train the coupling model with a compact form. Taking the sparse representation analysis theory as background mathematical tool, we focus on the compression of the parameters for the coupling model, which facilitates to the portability improvement of the initial coupling model. Finally, in this project, we can build a complete framework for RGB-D image semantic labeling, including the coupling of random forest with feature learning and expert knowledge, compact and light-duty coupling model design. Specially, our framework can afford efficiency and high accuracy for data modeling, which will offer new theories and engineering solution for some applications of pattern recognition.

基于特征学习和多分类任务耦合的统一处理框架已成为图像语义标注领域的研究热点。在耦合模型构建过程中,受到模型复杂度高、参数维数巨大、参数间内部协作等因素的影响,不可避免地面临计算能力不足、存储空间缺乏、模型高效求解困难等问题。此外,由于随机树预测误差和专家知识缺乏等因素产生的预测低准确率是目前多分类任务处理中极具挑战的问题。为此,本项目拟针对耦合模型中的特征重用和预测准确率低问题,研究语义信息保持的特征维数映射方法和耦合专家知识的决策模型;针对耦合模型中的参数维数巨大问题,研究基于稀疏性先验知识的紧致耦合模型构建;针对模型可移植性差问题,研究基于稀疏表示模型的轻型耦合模型构建。最终形成以耦合特征学习和专家知识的优化模型、以及紧致化和轻型化耦合模型为主体算法的RGB-D图像语义标注处理框架,实现高效、高精度数据建模,为模式识别领域相关问题提供理论和技术支持。

项目摘要

本项目研发期间,针对所面临的关键问题展开基础理论分析和研讨,在具有共生结构特性的谱聚类算法、深度测距仪定位方法、稀疏正则化约束特征选择策略、多尺度结构特征提取、轻量级网络构建等方面,提出基于代表点的大尺度谱聚类方法,解决了传统谱聚类方法高计算复杂度问题;提出了长方体标定物的二维激光测距仪定位方法,实现测距仪的空间位置的精确计算;提出了基于线性判别分析和L_2,1范式的鲁棒特征选择方法,实现最具区别性特征的获取,并有效消除冗余特征;提出了基于热核的数据相关各向异性小波,实现多尺度内蕴结构特征的提取;提出了基于全局特征抽象的轻量级网络模型,实现主干网浅层细节特征和深层全局上下文特征的双向学习和融合,提高了图像语义分割算法的速度;提出了基于多维度特征内在联系学习模型的轻量级网络模型,实现多维度特征的内在联系学习,提高了网络模型的深度估计准确性。经过主持人与团队成员的不懈努力,已发表学术论文4篇,其中SCI论文3篇,EI论文1篇,申请国家发明专利1项;在投稿论文2篇。因此,该项目总体较顺利地完成了研究计划,达到研究目标。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
2

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
3

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019

王青正的其他基金

相似国自然基金

1

基于深度学习和迁移学习的图像自动语义标注方法研究

批准号:61602004
批准年份:2016
负责人:赵鹏
学科分类:F0605
资助金额:20.00
项目类别:青年科学基金项目
2

噪声环境下基于深度学习的图像自动标注方法研究

批准号:61502105
批准年份:2015
负责人:柯逍
学科分类:F0605
资助金额:21.00
项目类别:青年科学基金项目
3

基于图像集合和深度学习的物体分类关键技术研究

批准号:61662014
批准年份:2016
负责人:徐智
学科分类:F0605
资助金额:33.00
项目类别:地区科学基金项目
4

融合社交语义环境的网络图像标注关键技术研究

批准号:61402174
批准年份:2014
负责人:张静
学科分类:F0210
资助金额:24.00
项目类别:青年科学基金项目