面向三维视频编码的智能视点合成预测方法

基本信息

批准号：61901083

项目类别：青年科学基金项目

资助金额：25.00

负责人：李帅

学科分类：

依托单位：山东大学

批准年份：2019

结题年份：2022

起止时间：2020-01-01 - 2022-12-31

项目状态：已结题

项目参与者：

关键词：

多视点视频编码视点合成立体编码多视点加深度视频

结项摘要

Multiview video plus depth is an important representation format of 3D video and widely studied by researchers. Due to the presence of videos from multiple views, the amount of data significantly increases comparing with the conventional 2D video. Therefore, efficiently reducing the redundancy among multiple views is one of the key technologies to achieve efficient 3D video coding. View synthesis prediction, based on the depth-image-based rendering (DIBR) technique, enables the prediction of the to-be-coded view from the reference view by 3D warping. However, in the 3D warping process, the pixels in the reference view cannot be directly mapped to integer pixel locations, and thus interpolation to integer pixels is needed, leading to geometric distortion. Thus the performance of view synthesis prediction is degraded. This project focuses on the view synthesis prediction for 3D video coding. The relationship between the warping location and the pixel quality in the warped image will be investigated, and a new method on geometric distortion rectification and adaptive pixel-level view blending will be developed by taking advantage of the deep learning technologies. The new method will enhance the quality of view synthesis, and thus improve the efficiency of the view synthesis prediction and 3D video coding. The research of this project is of great scientific importance for the further development of 3D video coding.

多视点加深度视频是一种重要的三维视频表示格式并受到学者的广泛关注，由于多个视点的出现，三维视频数据量相对传统二维视频急剧增加，因此，如何有效去除视点间相关性是实现高效三维视频编码的关键技术。视点合成预测利用基于深度的视点合成技术将已编码的参考视点映射至待编码视点作为参考进行预测，然而，在视点合成的三维映射过程中，由于参考视点像素不能准确映射至待编码视点的整数像素位置，导致映射图像中存在几何失真，因而视点合成预测效率较低。本项目围绕三维视频编码中的视点合成预测展开研究，分析三维映射几何位置与像素质量的关系，通过构建深度学习神经网络，充分利用映射几何位置信息建立三维映射几何失真校正和像素级自适应视点融合模型，突破传统视点合成无法进行自适应校正及增强的技术瓶颈，实现智能视点合成预测并提升其在三维视频编码中的效率，对推动三维视频编码的发展具有重要的科学意义。

项目摘要

随着三维视频的逐渐普及，三维视频相比二维视频的更大数据量及更高体验感要求对三维视频的高质量视点合成和高效编码提出了更大的需求。本项目针对三维视频视点合成中几何失真问题和编码视频质量增强开展了相关研究：分析像素三维映射几何位置信息对映射图像质量的影响，利用可变形卷积，提出了基于几何映射误差的视点增强，实现三维映射中的几何失真校正；同时研究像素几何位置信息对视点融合的影响，建立基于像素几何位置信息的自适应像素级视点融合；对于融合图像，进一步使用部分卷积进行空洞填补，提升最终视点生成质量。在编码视频增强方面，分析编码视频的失真来源，提出基于全局图像信息和基于局部块失真信息的编码视频质量增强方案；提出了基于多尺度偏移计算的多帧视频编码增强方法，改善可变形卷积梯度回传不稳定问题，显著提升了编码视频质量，达到25.6%的相对码率节省。成果方面，发表论文10篇，包括国际期刊论文4篇和会议论文6篇，包括IEEE TBC、ACM MM等；提交专利申请7项，其中3项已授权。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：

发表时间：2020

DOI：10.3788/CJL201946.0801003

发表时间：2019

DOI：10.13609/j.cnki.1000-0313.2022.04.019

发表时间：2022

DOI：

发表时间：2021

李帅的其他基金

批准号：51709056

批准年份：2017

资助金额：28.00

项目类别：青年科学基金项目

批准号：41505077

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：61401385

批准年份：2014

资助金额：27.00

项目类别：青年科学基金项目

批准号：51804337

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：31870860

批准年份：2018

资助金额：59.00

项目类别：面上项目

批准号：51905040

批准年份：2019

资助金额：25.00

项目类别：青年科学基金项目

批准号：31400673

批准年份：2014

资助金额：24.00

项目类别：青年科学基金项目

批准号：51908123

批准年份：2019

资助金额：25.00

项目类别：青年科学基金项目

批准号：20402025

批准年份：2004

资助金额：23.00

项目类别：青年科学基金项目

批准号：81902261

批准年份：2019

资助金额：21.00

项目类别：青年科学基金项目

批准号：81700497

批准年份：2017

资助金额：20.00

项目类别：青年科学基金项目

批准号：61672077

批准年份：2016

资助金额：63.00

项目类别：面上项目

批准号：11901223

批准年份：2019

资助金额：22.00

项目类别：青年科学基金项目

批准号：81173529

批准年份：2011

资助金额：58.00

项目类别：面上项目

批准号：31901956

批准年份：2019

资助金额：25.00

项目类别：青年科学基金项目

批准号：61300067

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：21072233

批准年份：2010

资助金额：36.00

项目类别：面上项目

批准号：31601372

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：81702886

批准年份：2017

资助金额：19.00

项目类别：青年科学基金项目

相似国自然基金

面向FTV视点绘制的多视点视频与深度联合编码研究

批准号：60902096

批准年份：2009

负责人：邵枫

学科分类：F0116

资助金额：22.00

项目类别：青年科学基金项目

面向多视点视频的高性能编码算法研究

批准号：61102059

批准年份：2011

负责人：王瀚漓

学科分类：F0101

资助金额：23.00

项目类别：青年科学基金项目

面向对象和手术器械光学定位的三维医疗视频编码与视点合成技术研究

批准号：61672362

批准年份：2016

负责人：张楠

学科分类：F0210

资助金额：64.00

项目类别：面上项目

多视点视频编码预测结构的性能评估与设计优化

批准号：60802013

批准年份：2008

负责人：李东晓

学科分类：F0101

资助金额：20.00

项目类别：青年科学基金项目

面向三维视频编码的智能视点合成预测方法

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

基于多色集合理论的医院异常工作流处理建模

基于腔内级联变频的0.63μm波段多波长激光器

结直肠癌免疫治疗的多模态影像及分子影像评估

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

李帅的其他基金

近场水下爆炸气泡坍塌后期撕裂行为及其对结构的损伤机理研究

基于遥感的沙尘对东帕米尔高原典型冰川规模影响机理研究

通信局限下基于分布式动态神经网络的多机器人协作研究

絮凝剂残留与超细全尾砂似膏体管输阻力时变特性的响应机理研究

基于线性双链DNA与门逻辑基因线路的合成生物学新方法的开发与应用

基于加捻筒与燕麦草相互作用的单捻制辫成型机理研究

28s rRNA 5'末端衍生小RNA分子生成机制及生物学功能研究

近断层高墩大跨梁桥在河谷地形效应作用下的破坏机理与设计方法研究

手掌参防治老年性痴呆有效成分及构效关系的研究

Sestrins-mTOR-TFE3轴调控自噬-溶酶体功能在椎间盘退变中的作用及其机制研究

SECTM1/CD7通路趋化单核细胞并诱导其表型分化在新生儿坏死性小肠结肠炎中的炎症调节作用及机制研究

基于广义集成学习的超声图像甲状腺结节自动识别关键技术研究

两组分玻色-爱因斯坦凝聚问题的基态解研究

山慈菇药效物质基础的研究

纹枯病菌效应蛋白AGLIP1调控水稻免疫的分子机制

内蕴特征空间基于低秩和稀疏分析的医学图像集处理方法

水柏枝抗类风湿性关节炎有效成分的研究

绿豆结荚习性控制基因的鉴定与功能位点分析

NNT的抗氧化作用在胃癌细胞失巢凋亡抵抗中的作用及机制研究

相似国自然基金