基于变换域特征的图像/视频深度编解码

基本信息

批准号：61902022

项目类别：青年科学基金项目

资助金额：28.00

负责人：姚超

学科分类：

依托单位：北京科技大学

批准年份：2019

结题年份：2022

起止时间：2020-01-01 - 2022-12-31

项目状态：已结题

项目参与者：

关键词：

帧内编码帧间编码视频压缩多视点视频编码

结项摘要

Recently, deep learning techniques have been applied in various areas and have achieved a number of breakthroughs on performance optimization and representation learning. However, with regard to image/video compression, the development of deep learning based technique is still relatively slow. On one hand, the complexity of the optimization issue on image/video compression is one of the reasons; on the other hand, most of the existing compression algorithms based on deep learning are limited in the framework of traditional image/video compression. The architecture with deep learning as the core has been not constructed. In order to improve the Rate-Distortion (R-D) performance of image/video compression, we will try to explore the deep coding framework for image/video compression. We will focus on the following three issues: 1) to effectively mining the related information in image/video, we will discuss the image/video deep compression representation learning in the transform domain; 2) aiming to optimize the deep representation, the R-D optimization strategy is designed in the field of deep learning; 3) we will investigate the image/video reconstruction methods to increase the visual quality of the reconstructed image/video. Finally, oriented to the practical application, this proposal will provide new theoretical supports and realization methods, exploring for next generation image/video coding standard.

近年来，深度学习技术得到广泛应用并且在性能优化和表示学习方面取得重大突破。然而，深度学习技术在图像/视频压缩领域的应用仍相对发展较慢。究其原因，一方面在于图像/视频压缩的优化问题具有一定复杂性；另一方面也在于现在有的基于深度学习的压缩方法大多仍局限在传统的图像/视频编码框架内，而没有建立以深度学习技术为核心的压缩表示体系。本课题将以深度学习技术作为核心，探索适用于图像/视频压缩的深度编解码框架，提高图像/视频压缩的率失真性能。研究重点从三个方面展开：1）研究基于变换域的图像/视频的深度压缩表示，有效地挖掘图像/视频数据的相关性信息；2）研究基于深度学习技术的率失真优化策略，优化深度压缩表示；3）研究图像/视频的深度解码重建方法，提高图像/视频重建的视觉质量。最终本课题将以实际应用为导向，为深度学习在图像/视频压缩领域应用提供新的理论依据与实现方法，为下一代图像/视频编码标准做技术探索。

项目摘要

本项目重点开展了适用于图像/视频压缩的特征表示学习的研究，研究并设计了基于深度特征的图像/视频压缩框架，提出了基于特征变换学习的图像压缩深度网络模型，优化了面向图像压缩任务的全局与局部深度特征表示，所提图像压缩框架对比VVC帧内编码模型在Kodak数据集可取得BD-PSNR增益0.28dB，节省编码码率6.57%。以深度特征驱动图像质量增强，项目提出了一系列深度特征学习方法包括纹理一致性变换的深度特征表示、分级特征反馈融合的图像质量增强方法以及多阶段渐进式特征融合策略，综合考虑不同空间尺度下丰富的特征表示，通过引入常微分方程动态地对多种分布的质量衰减因子进行多阶段的仿真拟合，最终达到图像质量增强的目的。与图像压缩与质量增强问题不同，视频编解码与质量增强面临的优化问题更加复杂，本项目基于视频的时域连续性特点，重点挖掘视频帧间冗余和帧间运动连续性提升重建视频的时域连续性质量，并提出面向人-机感知协同的视频编码优化策略，在视频内容理解和视频质量增强方面实现面向人-机感知的共同提升。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：

发表时间：2020

DOI：10.3788/CJL201946.0801003

发表时间：2019

DOI：10.13609/j.cnki.1000-0313.2022.04.019

发表时间：2022

DOI：

发表时间：2021

姚超的其他基金

批准号：81602590

批准年份：2016

资助金额：17.00

项目类别：青年科学基金项目

批准号：51602307

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：61802315

批准年份：2018

资助金额：27.00

项目类别：青年科学基金项目

批准号：81903848

批准年份：2019

资助金额：21.00

项目类别：青年科学基金项目

相似国自然基金

基于压缩感知理论的图像/视频编解码技术研究

批准号：60973056

批准年份：2009

负责人：施云惠

学科分类：F0210

资助金额：31.00

项目类别：面上项目

因特网无线接入中的视频和图像编解码研究

批准号：60072009

批准年份：2000

负责人：林行刚

学科分类：F0116

资助金额：17.00

项目类别：面上项目

面向图像与视频特征表示的深度编码方法研究

批准号：61272319

批准年份：2012

负责人：常虹

学科分类：F0605

资助金额：80.00

项目类别：面上项目

基于空谱域联合特征深度强化学习的光谱遥感图像在轨处理

批准号：61701360

批准年份：2017

负责人：吴宪云

学科分类：F0106

资助金额：27.00

项目类别：青年科学基金项目

基于变换域特征的图像/视频深度编解码

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

基于多色集合理论的医院异常工作流处理建模

基于腔内级联变频的0.63μm波段多波长激光器

结直肠癌免疫治疗的多模态影像及分子影像评估

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

姚超的其他基金

IGF信号通过STAT3/Fra-1/Nanog途径维持结直肠癌干细胞自我更新的机制探究

Sr1-xKxFe2As2超导圆线的微观结构与临界电流提高机制研究

基于三通道判别卷积神经网络和迁移学习的红外人体行为识别

基于代谢重编程研究中药米仔兰活性成分楝酰胺通过靶向ULK1抑制肺癌转移的分子机制

相似国自然基金