Computer vision gives the robot the ability to perceive surrounding information, and the development of machine vision further expands the breadth and accuracy of robotic perception. The study of first-person vision video is an important topic of computer vision. This project intends to use the analysis sparse representation and sparse deep neural networks to model the first-person vision video. Firstly, the smooth differentiable function is selected as the sparse constraint, the orthogonal constraint is applied to the analysis dictionary to eliminate the trivial solution, and the signal compression process based on the analysis dictionary learning is established. Secondly, the non-convex optimization algorithm—DC programming is applied to process the non-convex problem of analysis sparse representation based on the determinant constraint. Thirdly, an efficient signal recovery algorithm is developed based on sparse deep learning. Finally, the proposed compressed sensing algorithm is applied to the first-person vision video compressive sensing which needs to consider structured properties.
机器视觉赋予人工智能机器人感知周围信息的能力,其发展进一步拓展了人工智能感知精度和广度。为解决机器视觉中第一视角视频压缩感知的信号内在结构表达不足及优化函数非凸非光滑等问题,本项目拟采用解析稀疏表示及稀疏深度神经网络开发高效第一视角视频压缩感知算法。首先,选取光滑可微行列式约束作为稀疏度量,并且对解析字典施加正交约束以消除平凡解,建立基于解析字典学习模型的信号压缩过程;其次,引用非凸优化算法—DC规划处理基于行列式约束的解析稀疏表示的非凸问题,并且采用流形优化方法构造具有对数据内在结构属性表达能力的解析字典,提高信号压缩过程对信号内在结构的表达能力;再者,基于稀疏深度学习,采用行列式强稀疏约束,增加深度神经网络节点稀疏度,开发高效的信号恢复算法;最后,将所开发的压缩感知算法应用于需考虑结构化属性的第一视角视频压缩感知及其他可携带数据处理,为人工智能视觉分析和发展提供理论支撑和技术支持。
第一视角视频压缩感知的研究可提高类人机器人感知周围信息的能力。为解决第一视角视频压缩感知的信号非负性、内在结构表达不足及优化函数非凸非光滑等问题,本项目采用稀疏表示及深度神经网络开发高效第一视角视频压缩感知算法。首先,选取光滑可微行列式约束如行列式、MCP等强稀疏约束作为稀疏度量,建立基于字典学习模型的信号压缩过程;其次,引用非凸优化算法—DC规划处理优化函数的非凸问题,开发高效的字典学习优化算法;再者,基于深度神经网络学习结构化特征,开发有效的信号恢复算法;最后,将所开发的压缩感知算法应用于第一视角视频压缩感知及其他可携带数据处理。三年来,申请人围绕着本项目的研究内容在IEEE/CAA Journal of Automatica Sinica、J. Vis. Commun. Image Represent.等国际权威期刊发表论文8篇和中文核心期刊1篇,发明国家专利3件。课题组培养在读硕士研究生4名。项目负责人及指导的学生多次参加国内国际相关会议,与国内同行紧密交流研讨,取得了一定的国际国内学术影响力。
{{i.achievement_title}}
数据更新时间:2023-05-31
针对弱边缘信息的左心室图像分割算法
基于改进LinkNet的寒旱区遥感图像河流识别方法
新型树启发式搜索算法的机器人路径规划
信息熵-保真度联合度量函数的单幅图像去雾方法
现代优化理论与应用
基于稀疏表示和深度学习的大规模目标检测
基于分层超完备字典稀疏表示的深度学习算法研究及应用
面向数据表示的深度稀疏保持学习
基于深度学习特征提取的稀疏表示异常事件检测