基于内容的智能视频编码优化研究

基本信息
批准号:61871154
项目类别:面上项目
资助金额:67.00
负责人:梁永生
学科分类:
依托单位:哈尔滨工业大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:柳伟,仪双燕,李鑫,杨火祥,崔浩翔,黄玉程,王昌伟
关键词:
视频内容分析视频编码优化深度学习视频质量评价
结项摘要

This project focuses on video coding optimization from the two aspects of coding components and coding parameters. A content-based intelligent video coding optimization scheme is proposed for balancing between performance and efficiency, meanwhile resolving the complexity. Considering the requirement of coding optimization and deep learning, the program focus on scene detection based on graph convolution, which results in end-end scene detection. Loop filtering relying on deep learning and neural network compression based on principal component analysis (PCA) are presented to compromise the efficiency and property during the component optimization process. While in the stage of parameters optimization, we use Harmonic algorithm to select coding parameters and set up a rate-distortion optimization model including distortion drift, aiming to reduce complexity and enhance accuracy. To design a objective evaluator reflecting subjective perception, we employ deep neural network to construct a video quality evaluation model. Our research can provide new thinking and method for video optimization and extend to other research area.

项目主要研究视频编码模块优化和编码参数优化,针对前者的性能效率平衡问题和后者的编码参数复杂问题,提出基于内容的智能视频编码优化方案。在分析视频编码优化问题的需求和深度学习优势的基础上,项目将重点研究基于图卷积的视频场景检测模型,解决端到端的场景分类问题;研究基于深度学习的环路滤波和基于主成分分析方法的深度神经网络压缩,解决视频编码模块优化的效率性能平衡问题;研究基于Harmonic方法的视频编码参数选择和基于失真漂移的率失真优化模型,解决编码参数复杂和编码优化准确性问题;研究基于深度神经网络的视频质量评价模型,解决反映视觉感知的客观评价指标问题。研究成果将为视频编码优化提供新的思路,并可拓展到其它研究领域。

项目摘要

在视频数据越来越丰富的应用背景下,如何解决有限资源、高效访问和用户体验之间的矛盾问题尤为关键。本项目围绕基于内容的智能视频编码优化开展研究,在视频内容分析与理解的基础上,进行基于深度学习的视频编码优化,并通过视频质量评价验证视频编码优化技术的有效性,实现视频编码技术在视频播出质量和编码效率之间的平衡。本项目分别对视频场景检测、编码模块优化、编码参数优化和视频质量评价四个方面开展深入探索,提出了用于数据增广的样本融合网络来提高视频场景检测算法的鲁棒性和准确性;提出了视频编码优化方法,能够有效兼顾编码性能与编码复杂度,包括基于信号调制的变换编码方法、基于稀疏剪枝和加法网络的编码模型压缩方法、基于PCA的鲁棒特征选择方法以及矩阵低秩表示的编码参数优化方法;并构建了基于PCA方法的深度神经网络模型压缩理论来增强其可解释性;提出了多种视觉注意力模块以及引入感知度量的率失真损失改进方案,实现了更好主观视觉感受的图像重建,提升视频播出质量。项目期间发表及已接受的期刊论文12篇、发表会议论文9篇、申请国家发明专利6项、共培养博士生6名、硕士生12名。本项目的实施促进了视频编码优化技术的发展,为高质量视频编码的需求提供了技术支持。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
2

肉苁蓉种子质量评价及药材初加工研究

肉苁蓉种子质量评价及药材初加工研究

DOI:10.11842/wst.2017.02.019
发表时间:2017
3

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
4

中外学术论文与期刊的宏观差距分析及改进建议

中外学术论文与期刊的宏观差距分析及改进建议

DOI:
发表时间:2021
5

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019

梁永生的其他基金

批准号:60772163
批准年份:2007
资助金额:30.00
项目类别:面上项目
批准号:61172165
批准年份:2011
资助金额:60.00
项目类别:面上项目

相似国自然基金

1

基于内容感知的可重构视频编码方法研究

批准号:61001108
批准年份:2010
负责人:齐洪钢
学科分类:F0101
资助金额:20.00
项目类别:青年科学基金项目
2

基于内容分析的高效视频编码理论与方法

批准号:61632001
批准年份:2016
负责人:马思伟
学科分类:F0210
资助金额:270.00
项目类别:重点项目
3

基于内容的可伸缩多描述视频编码方法研究

批准号:60805044
批准年份:2008
负责人:兰旭光
学科分类:F0604
资助金额:21.00
项目类别:青年科学基金项目
4

内容基视频编码中的运动补偿

批准号:60002007
批准年份:2000
负责人:颜尧平
学科分类:F0117
资助金额:18.00
项目类别:青年科学基金项目