Computer vision gives the robot the ability to perceive surrounding information, and the development of machine vision further expands the breadth and accuracy of robotic perception. The study of first-person vision video is an important topic of computer vision. This project intends to use the analysis sparse representation and sparse deep neural networks to model the first-person vision video. Firstly, the smooth differentiable function is selected as the sparse constraint, the orthogonal constraint is applied to the analysis dictionary to eliminate the trivial solution, and the signal compression process based on the analysis dictionary learning is established. Secondly, the non-convex optimization algorithm—DC programming is applied to process the non-convex problem of analysis sparse representation based on the determinant constraint. Thirdly, an efficient signal recovery algorithm is developed based on sparse deep learning. Finally, the proposed compressed sensing algorithm is applied to the first-person vision video compressive sensing which needs to consider structured properties.
机器视觉赋予人工智能机器人感知周围信息的能力,其发展进一步拓展了人工智能感知精度和广度。为解决机器视觉中第一视角视频压缩感知的信号内在结构表达不足及优化函数非凸非光滑等问题,本项目拟采用解析稀疏表示及稀疏深度神经网络开发高效第一视角视频压缩感知算法。首先,选取光滑可微行列式约束作为稀疏度量,并且对解析字典施加正交约束以消除平凡解,建立基于解析字典学习模型的信号压缩过程;其次,引用非凸优化算法—DC规划处理基于行列式约束的解析稀疏表示的非凸问题,并且采用流形优化方法构造具有对数据内在结构属性表达能力的解析字典,提高信号压缩过程对信号内在结构的表达能力;再者,基于稀疏深度学习,采用行列式强稀疏约束,增加深度神经网络节点稀疏度,开发高效的信号恢复算法;最后,将所开发的压缩感知算法应用于需考虑结构化属性的第一视角视频压缩感知及其他可携带数据处理,为人工智能视觉分析和发展提供理论支撑和技术支持。
第一视角视频压缩感知的研究可提高类人机器人感知周围信息的能力。为解决第一视角视频压缩感知的信号非负性、内在结构表达不足及优化函数非凸非光滑等问题,本项目采用稀疏表示及深度神经网络开发高效第一视角视频压缩感知算法。首先,选取光滑可微行列式约束如行列式、MCP等强稀疏约束作为稀疏度量,建立基于字典学习模型的信号压缩过程;其次,引用非凸优化算法—DC规划处理优化函数的非凸问题,开发高效的字典学习优化算法;再者,基于深度神经网络学习结构化特征,开发有效的信号恢复算法;最后,将所开发的压缩感知算法应用于第一视角视频压缩感知及其他可携带数据处理。三年来,申请人围绕着本项目的研究内容在IEEE/CAA Journal of Automatica Sinica、J. Vis. Commun. Image Represent.等国际权威期刊发表论文8篇和中文核心期刊1篇,发明国家专利3件。课题组培养在读硕士研究生4名。项目负责人及指导的学生多次参加国内国际相关会议,与国内同行紧密交流研讨,取得了一定的国际国内学术影响力。
{{i.achievement_title}}
数据更新时间:2023-05-31
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
基于SSVEP 直接脑控机器人方向和速度研究
内点最大化与冗余点控制的小型无人机遥感图像配准
平行图像:图像生成的一个新型理论框架
时间序列分析与机器学习方法在预测肺结核发病趋势中的应用
基于稀疏表示和深度学习的大规模目标检测
基于分层超完备字典稀疏表示的深度学习算法研究及应用
面向数据表示的深度稀疏保持学习
基于深度学习特征提取的稀疏表示异常事件检测