面向三维视频编码的智能视点合成预测方法

基本信息
批准号:61901083
项目类别:青年科学基金项目
资助金额:25.00
负责人:李帅
学科分类:
依托单位:山东大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
多视点视频编码视点合成立体编码多视点加深度视频
结项摘要

Multiview video plus depth is an important representation format of 3D video and widely studied by researchers. Due to the presence of videos from multiple views, the amount of data significantly increases comparing with the conventional 2D video. Therefore, efficiently reducing the redundancy among multiple views is one of the key technologies to achieve efficient 3D video coding. View synthesis prediction, based on the depth-image-based rendering (DIBR) technique, enables the prediction of the to-be-coded view from the reference view by 3D warping. However, in the 3D warping process, the pixels in the reference view cannot be directly mapped to integer pixel locations, and thus interpolation to integer pixels is needed, leading to geometric distortion. Thus the performance of view synthesis prediction is degraded. This project focuses on the view synthesis prediction for 3D video coding. The relationship between the warping location and the pixel quality in the warped image will be investigated, and a new method on geometric distortion rectification and adaptive pixel-level view blending will be developed by taking advantage of the deep learning technologies. The new method will enhance the quality of view synthesis, and thus improve the efficiency of the view synthesis prediction and 3D video coding. The research of this project is of great scientific importance for the further development of 3D video coding.

多视点加深度视频是一种重要的三维视频表示格式并受到学者的广泛关注,由于多个视点的出现,三维视频数据量相对传统二维视频急剧增加,因此,如何有效去除视点间相关性是实现高效三维视频编码的关键技术。视点合成预测利用基于深度的视点合成技术将已编码的参考视点映射至待编码视点作为参考进行预测,然而,在视点合成的三维映射过程中,由于参考视点像素不能准确映射至待编码视点的整数像素位置,导致映射图像中存在几何失真,因而视点合成预测效率较低。本项目围绕三维视频编码中的视点合成预测展开研究,分析三维映射几何位置与像素质量的关系,通过构建深度学习神经网络,充分利用映射几何位置信息建立三维映射几何失真校正和像素级自适应视点融合模型,突破传统视点合成无法进行自适应校正及增强的技术瓶颈,实现智能视点合成预测并提升其在三维视频编码中的效率,对推动三维视频编码的发展具有重要的科学意义。

项目摘要

随着三维视频的逐渐普及,三维视频相比二维视频的更大数据量及更高体验感要求对三维视频的高质量视点合成和高效编码提出了更大的需求。本项目针对三维视频视点合成中几何失真问题和编码视频质量增强开展了相关研究:分析像素三维映射几何位置信息对映射图像质量的影响,利用可变形卷积,提出了基于几何映射误差的视点增强,实现三维映射中的几何失真校正;同时研究像素几何位置信息对视点融合的影响,建立基于像素几何位置信息的自适应像素级视点融合;对于融合图像,进一步使用部分卷积进行空洞填补,提升最终视点生成质量。在编码视频增强方面,分析编码视频的失真来源,提出基于全局图像信息和基于局部块失真信息的编码视频质量增强方案;提出了基于多尺度偏移计算的多帧视频编码增强方法,改善可变形卷积梯度回传不稳定问题,显著提升了编码视频质量,达到25.6%的相对码率节省。成果方面,发表论文10篇,包括国际期刊论文4篇和会议论文6篇,包括IEEE TBC、ACM MM等;提交专利申请7项,其中3项已授权。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
4

多空间交互协同过滤推荐

多空间交互协同过滤推荐

DOI:10.11896/jsjkx.201100031
发表时间:2021
5

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021

李帅的其他基金

批准号:51709056
批准年份:2017
资助金额:28.00
项目类别:青年科学基金项目
批准号:41505077
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:61401385
批准年份:2014
资助金额:27.00
项目类别:青年科学基金项目
批准号:51804337
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:31870860
批准年份:2018
资助金额:59.00
项目类别:面上项目
批准号:51905040
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:31400673
批准年份:2014
资助金额:24.00
项目类别:青年科学基金项目
批准号:51908123
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:20402025
批准年份:2004
资助金额:23.00
项目类别:青年科学基金项目
批准号:81902261
批准年份:2019
资助金额:21.00
项目类别:青年科学基金项目
批准号:81700497
批准年份:2017
资助金额:20.00
项目类别:青年科学基金项目
批准号:61672077
批准年份:2016
资助金额:63.00
项目类别:面上项目
批准号:11901223
批准年份:2019
资助金额:22.00
项目类别:青年科学基金项目
批准号:81173529
批准年份:2011
资助金额:58.00
项目类别:面上项目
批准号:31901956
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:61300067
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:21072233
批准年份:2010
资助金额:36.00
项目类别:面上项目
批准号:31601372
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:81702886
批准年份:2017
资助金额:19.00
项目类别:青年科学基金项目

相似国自然基金

1

面向FTV视点绘制的多视点视频与深度联合编码研究

批准号:60902096
批准年份:2009
负责人:邵枫
学科分类:F0116
资助金额:22.00
项目类别:青年科学基金项目
2

面向多视点视频的高性能编码算法研究

批准号:61102059
批准年份:2011
负责人:王瀚漓
学科分类:F0101
资助金额:23.00
项目类别:青年科学基金项目
3

面向对象和手术器械光学定位的三维医疗视频编码与视点合成技术研究

批准号:61672362
批准年份:2016
负责人:张楠
学科分类:F0210
资助金额:64.00
项目类别:面上项目
4

多视点视频编码预测结构的性能评估与设计优化

批准号:60802013
批准年份:2008
负责人:李东晓
学科分类:F0101
资助金额:20.00
项目类别:青年科学基金项目