基于深度学习的自然图像先验模型及高效视频编码研究

基本信息
批准号:61872116
项目类别:面上项目
资助金额:64.00
负责人:赵德斌
学科分类:
依托单位:哈尔滨工业大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:刘绍辉,姜峰,王洋,董瑞,石武祯,陶文,崔文学,李晨光,刘然
关键词:
自然图像先验深度学习统计建模视频压缩
结项摘要

Natural image and video data contain rich hierarchical and structured information. Human brain provides basic guarantee for understanding and cognition by effectively mining and modeling the general rule of natural images. Based on the understanding of the mechanism of human vision in the pathway of vision information transmission and human vision characters, our project tries to give summarization the general laws of the nature images corresponding to the human vision perception process, especially the deep learning based prior model as well as the corresponding key techniques in the video coding. The dominant contents include: exploring the general rule of the temporal and spatial context information of natural image and its optimal expression, developing effective deep learning based prior and the image prior models fusion strategy. Accordingly, we will focus on the problems in the video coding frameworks, and propose the method of deep learning based high quality images reconstruction and reliable quality for analysis and classification in the condition of low ration; these measures can be applied to break through the independence of video coding and video analysis, which are expected to make contribution to the future applications.

自然图像和视频数据中蕴含着丰富的层次化、结构化关联信息,人类大脑通过有效挖掘和建模自然图像的一般规律,为理解和认知提供根本保障。该项研究在理解与总结人类视觉系统的机理基础上,研究视觉先验深度模型及基于深度学习的视频编码理论与方法,完成以下目标:以深度学习为手段,兼顾计算视觉层面的识别与理解,挖掘自然图像时空上下文信息一般规律及其优化表达,实现融合图像先验深度模型的图像高效增强,建立并完善、普适的自然图像先验深度模型学习策略;进而研究视觉信息感知、语义层面上失真度量方法,以此为基础构建基于视觉特性的率失真模型,以及基于深度学习的快速帧内帧间预测,适用于深度网络编码的熵编码方法;最终综合以上,选择合理的视觉先验深度模型介入的途径与方式,研究基于深度学习的图像和视频数据的压缩编码框架,为视频智能应用奠定理论和技术基础。

项目摘要

自然图像和视频数据中蕴含着丰富的层次化、结构化关联信息,人类大脑通过挖掘和建模自然图像的一般规律,为理解和认知提供根本保障。本项目主要研究视觉先验深度模型及基于深度学习的视频编码理论与方法。具体而言,以深度学习为手段,兼顾计算视觉层面的识别与理解,挖掘自然图像时空上下文信息一般规律及其优化表达,实现融合图像先验深度模型的图像高效增强,建立并完善普适的自然图像先验深度模型学习策略;研究视觉信息感知、语义层面上失真度量方法,以此为基础构建基于视觉特性的率失真模型,以及基于深度学习的快速帧内帧间预测方法。.通过上述研究,本项目在以下几个方面取得重要成果:1. 在基于深度网络的压缩感知研究中,我们首先提出了图像压缩感知方法CSNet,CSNet首次利用深度网络联合优化采样矩阵和重建,大幅度提高了重建质量并极大地减少了计算复杂度。在此基础上,提出了可伸缩压缩感知方法SCSNet,SCSNet只需要训练一个模型就可以实现任意采样率下的可伸缩图像采样和重建。最后,将上述方法扩展到视频压缩感知,提出了视频压缩感知方法VCSNet。2. 在基于深度学习的视频编码研究中,分别针对帧内预测和帧间预测,提出了使用深度网络的MSCNN和NNIP方法,较大地提升了视频编码的编码效率。3. 在3D Mesh和点云数据的建模及增强研究中,我们首先提出了基于图的特征保持的法向量滤波方法:GGNF。其次,我们首次将深度网络引入到3D Mesh去噪任务,提出了基于学习的Mesh法向量滤波方法:NormalNet。最后,针对3D点云,我们提出了点云滤波网络PointFilterNet,通过将滤波与深度学习相结合完成点云去噪。上述方法较好地提升了3D数据的质量。.以上成果的取得推动了压缩感知技术的发展,为基于深度学习的视频编码应用提供了技术基础,并为3D数据建模与增强提供了高效解决方案。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
3

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

赵德斌的其他基金

批准号:60672088
批准年份:2006
资助金额:22.00
项目类别:面上项目
批准号:61272386
批准年份:2012
资助金额:81.00
项目类别:面上项目
批准号:60736043
批准年份:2007
资助金额:180.00
项目类别:联合基金项目

相似国自然基金

1

基于先验建模的图像与视频高效算法研究

批准号:61003144
批准年份:2010
负责人:孙剑
学科分类:F0210
资助金额:19.00
项目类别:青年科学基金项目
2

图像和视频去模糊深度学习模型及算法研究

批准号:61872421
批准年份:2018
负责人:潘金山
学科分类:F0210
资助金额:65.00
项目类别:面上项目
3

基于深度学习与统计特征模型的视频重编码检测技术研究

批准号:61572320
批准年份:2015
负责人:孙锬锋
学科分类:F0206
资助金额:66.00
项目类别:面上项目
4

融合先验建模和深度学习的自然场景视觉理解研究

批准号:61672273
批准年份:2016
负责人:路通
学科分类:F0209
资助金额:59.00
项目类别:面上项目