QoE驱动下的基于内容分析的3D视频感知编码研究

基本信息
批准号:61671283
项目类别:面上项目
资助金额:58.00
负责人:王永芳
学科分类:
依托单位:上海大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:李凯,冯妮娜,杜欢,马健,朱康华,吴健,朱芸,孔维检
关键词:
感知编码感知模型视频编码视觉内容分析视频体验质量3D
结项摘要

The naked eye 3D video technology is the direction of the future development of virtual reality, while the current 3D video coding efficiency is limited and 3D QoE of user is poor. It is one of reason why practical application of 3D video is limited nowadays. Starting from the terminal user QoE, it is urgent to explore a new high efficient 3D video coding method. This project intends to study two aspects including QoE-driven perceptual model and 3D perceptual coding method based on the content analysis, by constructing 3D perceptual model fully exploiting the human eye 3D visual characteristics and the 3D video characteristics, proposing a perceptual 3D video preprocessing method based content analysis, designing a perceptual 3D coding method based on local features analysis and a rate optimization allocation strategy for 3D video, we proposed an efficient 3D perceptual video coding method based on visual content analysis, which solves existing coding problem failed to fully make use of the human visual perception characteristics and failure to use related advanced visual content analysis technology, leading to limited coding efficiency, high complexity, and poor user 3D quality of experience. The project is expected to be achieved research results with independent intellectual property core technology. It will promote the conjunction of visual perception theory, visual content analysis theory and 3D video technologies and will be applied for free viewpoint television, 3D video, virtual reality related other fields.

裸眼3D视频技术是虚拟现实未来发展的方向,而当前3D视频编码效率有限、3D显示效果不佳等问题是3D视频的实际应用推广受限的主要原因之一。从终端用户QoE出发,寻求高效的3D视频编码新方法是亟待解决的问题。本项目拟研究面向QoE的感知模型和基于内容分析的感知3D编码方法,通过构建充分挖掘人眼视觉特性和3D视频特点的3D感知模型和提出基于内容分析的感知3D视频编码预处理方法,设计基于局部特征分析的高效3D感知编码框架及3D视频码率优化分配的策略,获得一套高效的基于内容分析的感知3D视频编码新方法,解决现有编码方法未能充分挖掘人眼视觉感知特性、未能利用视觉内容分析先进技术及效率有限、复杂度高、不能兼顾用户的3D视觉体验质量等问题。预期本项目可取得具有自主知识产权核心技术的研究成果,可促进视觉内容分析理论、视觉感知理论与3D视频技术结合,可应用于自由视点电视、3D视频、虚拟现实等领域。

项目摘要

裸眼3D视频技术是虚拟现实未来发展的方向,而当前3D视频编码效率有限、3D显示效果不佳等问题是3D视频的实际应用推广受限的主要原因之一。本项目主要探索面向QoE的感知模型和基于内容分析的感知3D编码方法。获得主要成果如下:1)显著性感知模型:提出一种感知的显著性框架、一种基于自注意生成对抗网络的RGB-D显著性算法及一种非局部增强的生成对抗网络的3D显著性算法等,这些算法充分应用感知信息和3D深度信息,大大提高了3D显著性的检测能力;2)JND感知模型:提出一种基于超像素的区域JND模型、一种基于双目抑制的3D-JND模型及一种基于共生矩阵融合深度的JND模型,这些模型充分利用人眼特性和3D深度特性,有效提高了JND模型的准确性;3)QoE评估模型:提出一种基于双目时空内在推理机制和自然视频统计的3D视频质量盲评估及一种多尺度卷积神经网络的3D质量盲评估模型等,这些模型充分利用了人眼、人脑特性和3D深度特性,优于存在的算法,更符合3D视频的视觉体验质量; 4)基于内容分析的感知编码:提出了一种基于双目抑制的3D感知视频编码、一种基于内容的编码视频质量预测及一种基于压缩感知的3D视频编码算法,提出的这些编码方法充分利用了感知信息,视频内容信息及视差信息,与现存的3D视频编码算法相比,可获得更高的编码效率; 5)基于特征的视频编码重建:提出了一种基于LBP级联的多列卷积神经网络的超分辨率算法、一种循环多列3D卷积网络的视频超分辨率算法、一种双流的基于全局特征指导的重建算法及一种基于迭代投影的多列平滑空洞卷积的3D超分辨率重建算法,这些算法利用深度学习网络来学习帧内、帧间、视间的特征来重建视频帧,与现存的重建算法相比,可获得更高的重建视频质量。.上述研究成果,已取得具有自主知识产权核心技术的研究成果,可应用于自由视点电视、3D视频、虚拟现实、视频监控和无人机视频等领域。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
3

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
4

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

王永芳的其他基金

批准号:81902331
批准年份:2019
资助金额:21.00
项目类别:青年科学基金项目
批准号:61301113
批准年份:2013
资助金额:24.00
项目类别:青年科学基金项目
批准号:60972137
批准年份:2009
资助金额:33.00
项目类别:面上项目

相似国自然基金

1

传输导向感知与语义驱动的3D视频表示与编码

批准号:61671412
批准年份:2016
负责人:朱仲杰
学科分类:F0108
资助金额:58.00
项目类别:面上项目
2

基于视觉感知的高效3D全景视频编码压缩研究

批准号:61871270
批准年份:2018
负责人:王旭
学科分类:F0108
资助金额:63.00
项目类别:面上项目
3

基于内容分析的高效视频编码理论与方法

批准号:61632001
批准年份:2016
负责人:马思伟
学科分类:F0210
资助金额:270.00
项目类别:重点项目
4

移动云计算环境下QoE驱动的HAS融合视频直播方法研究

批准号:61772414
批准年份:2017
负责人:张未展
学科分类:F0207
资助金额:65.00
项目类别:面上项目