The development of three Dimension (3D) Video coding Technologies is facing many challengs. For example, coding effeciency is not high, visual quality assessment is not accurate, reconstructed quality of depth is not satisfied and so on. It is impossible that 3D video can be applied in practice, until these problems have to be efficiently solved. Based on thorough research on the theories of video coding, for sloving the existing probles on 3D video coding technology, some concrete researches will be done in this project. 1) Rate Distortion (R-D) optimization theroy is studied in this project. The different R-D behaviors of coding video and depth are analyzed. The R-D optimization framework for both video and depth is setup for achieving the global optimal coding performance. 2) The visual quality assessment method of 3D video is also studied in this project. Visual perception to depth and 2D video is analyzed. The joint stimulus of 2D video and depth signals to perception is explored. The visual quality assessment model of joint video and depth is established for the accurately visual assessment of 3D video. 3) Moreover, visual depth reconstruction is studied in this project. The mechanism of lossy video coding is analyzed for obtaining the accurate depth reconstruction information through the video aware. The effects of both subjective and objective visual qualities are considered for setting up the subjective and objective qualities jointly adaptive assessment based optimization model for visual depth reconstruction. With the model, depth map are reconstructed in high visual qualtiy. The achievements of this project can provide supports of theory and technology for applications of 3D video coding.
三维(3D)视频编码技术发展面临很多挑战,如:编码效率不高,视觉质量评价不精确,深度信息重建质量不理想等。必须有效的解决这些问题,3D视频才能获得实际的应用。本课题在对视频编码理论深入研究基础上,针对3D视频编码技术中存在的问题,1)研究率失真优化理论,分析视频和深度图编码的不同率失真行为,建立视频和深度图加权的率失真编码框架,提高3D视频编码性能。2)研究立体视觉质量评价方法,分析深度和平面视频的视觉响应,探索平面视频与深度信息对视觉感知的共同作用,建立平面视频和深度联合视觉质量评价模型,准确评估3D视频的视觉质量。3)研究深度信息视觉重建技术,分析深度图编码信息损失机理,结合视频的深度感知,提供深度重建精确信息,全面考虑主观质量和客观质量评价效果,建立基于主客观质量联合自适应评价的深度重建优化模型,重建高视觉质量的深度图。本课题的研究成果可为3D视频编码应用提供理论和技术支持。
随着人们对视频应用需求的逐渐增长,传统二维(2D)视频应用已经不能够满足人们的更高要求,因此三维(3D)视频应用开始蓬勃发展。3D视频编解码是3D视频应用中的关键技术,3D视频比2D视频需要更多的视频数据来展示,然而海量的视频数据对视频的存储和传输提出了巨大挑战,没有高效的3D视频压缩,3D视频无法进行有效的存储和传输,也就无法得到实际的应用。目前的3D视频应用只能在某些不计成本的场景下得到有限的使用,而无法得到大规模的普及。本项目针对3D视频数据的特点,对3D视频编码优化方法进行深入研究,具体在3D视频编码优化方法和视频质量评价两个关键内容进行探索,并尝试采用深度学习等新的方法理论在视频编码的优化,使视频编码优化框架有实质性的突破。另外,围绕深度学习方面的新技术,我们也尝试了其在视频图像分析理解方面的应用,使新技术能够在更多的应用中获得显著的性能提高。本项目所获得的研究结果及其科学意义如下:.1).在视频质量评价方面,我们首先尝试了使用结构相似度测量的主观质量评价方法在现有率失真框架下的应用,然后提出了空时域显著性检测方法,通过该方法可以更有效检测出人类视觉系统关注的区域。主观质量评价方法的好坏决定评价结果是否与人类视觉系统的视频质量感知一致,而显著性的检测可以更有效的确定视频中人类视觉系统关注的区域,对关注区域进行高质量的编码可以显著提高视频的压缩性能。.2).3D视频是多路视频的一种特例(包含两路视频),在多路视频为视频分析提供了更多的信息,我们将多路视频的目标跟踪转化为求解优化问题,引入超图理论建立时间-空间-视角多维优化目标函数,并给出多路超图优化的求解方法,使多路视频的目标跟踪有更好的跟踪效果。将超图技术引入求解多变量优化函数是一种新的优化方法,可以替代传统优化方法得到更精确的优化解。.3).求解优化问题通常是求解一个非线性目标函数,然而现有方法无法精确求解非线性目标函数,通常使用近似方法求解,但近似方法无法得到更接近最优解的次优解,我们提出采用深度学习的方法,通过训练拟合得到神经网络模型可获得更接近最优解的次优解。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于SSVEP 直接脑控机器人方向和速度研究
基于多模态信息特征融合的犯罪预测算法研究
坚果破壳取仁与包装生产线控制系统设计
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
肉苁蓉种子质量评价及药材初加工研究
基于主观质量评价模型的屏幕视频高效编码研究
基于视觉感知的屏幕视频质量评价及编码优化策略研究
基于视觉特性的高效视频编码研究
结合视觉质量及视觉舒适度的三维视频质量评价方法研究