面向全景图像/视频的多维稀疏变换编码

基本信息
批准号:61672066
项目类别:面上项目
资助金额:62.00
负责人:施云惠
学科分类:
依托单位:北京工业大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:石振莲,赵明,齐娜,张敏,李蔷,霍莉杰,朝丹凤,宿建卓,崔应炫
关键词:
帧内编码最优化率失真优化全景图像/视频多维稀疏变换
结项摘要

Panoramic image/video is a new type of interactive and immersive image/video, which includes two characteristic of the collaborative correlations between the spatial domain and the multi-views and the sparsity in the transformation domain. The Image/Video Coding Standard generally removes the correlation and redundancy in the spatiotemporal domain. The two dimensional (2D) transform matrix in the horizontal and vertical direction are always the same. After the horizontal transform, the distribution of the transformed data in the vertical direction will be changed. Thus, the 2D transform cannot efficiently remove the spatial redundancy, and cannot further capture the collaborative correlation of multi-dimensional signal in the spatial and multi-view domain. Thus, this issue aims at studying the compressibility constrained multi-dimensional sparse representation and multi-dimensional sparse-based transform coding. Specifically, this issue will study from the following aspects: 1. exploring the effective representation of the panoramic images and video to satisfy the users’ requirement of switching views to interactively watch the panoramic images/video, and efficiently exploiting the correlation of the video data; 2. proposing a compressively constrained multi-dimensional sparse representation and the corresponding the multi-dimensional dictionary learning algorithms to compactly represent the panoramic pictures in the transformation domain and to further facilitate the entropy coding; 3. utilizing the rate distortion optimization (RDO) technique to propose the tree-structured multi-dimensional sparse-based codec.

全景图像/视频是一类具有交互性和沉浸感的新型图像/视频。全景图像/视频数据有两个特点:1、存在空域和不同视点间的联合相关性,2、在某个变换域是稀疏的。图像视频编码标准中通常采用二维变换去除空域相关性。二维变换的水平和垂直方向采用相同的变换矩阵,由于水平方向变换后, 数据在垂直方向分布发生了改变,因此这类变换不能高效地去除空域冗余,更无法挖掘全景图像/视频这种多维信号的空域和不同视点间的联合相关性。为此本课题拟针对全景图像/视频数据的相关性和稀疏特性,研究可压缩的多维稀疏变换及其多维稀疏变换编码方法。具体包括:1、探索编码输入的全景图像/视频的高效表示,既满足用户切换视点需求又有利于挖掘数据的相关性。2、研究具有压缩特性的多维稀疏表示模型及多维稀疏变换的训练方法,使全景视频信号在变换域不仅紧致而且更便于熵编码处理。3、应用率失真优化技术,提出了树形多维稀疏编码方案。

项目摘要

全景图像/视频是一类具有交互性和沉浸感的新型图像/视频。全景图像/视频数据有两个特点:1、存在空域和不同视点间的联合相关性,2、在某个变换域是稀疏的。图像视频编码标准中通常采用二维变换去除空域相关性。二维变换的水平和垂直方向采用相同的变换矩阵,由于水平方向变换后,数据在垂直方向分布发生了改变,因此这类变换不能高效地去除空域冗余,更无法挖掘全景图像/视频这种多维信号的空域和不同视点间的联合相关性。为此本课题针对全景图像/视频数据的相关性和稀疏特性,研究了可压缩的多维稀疏变换及其多维稀疏变换编码方法。我们的工作包括如下三个方面:.1、在全景图像/视频信号的高效表示方面,提出了一种新的二进制球面图像索引方案,用三维整数坐标体系来对球面三角像元进行索引,获得了全景图像/视频的高效表示。该表达在反映球面测度的基础上,能够像平面图像的索引方式一样,支持全局随机访问,且不需要预先计算并存储球面三角像元间的拓扑结构。基于该二进索引体系,推导出了基于球面测度的球面图像重采样方法,并提出了一种球面图像的SLIC(Simple linear iterative clustering)算法。.2、在多维稀疏表示模型方面,提出了基于张量的多维稀疏表示模型。该模型能够保持多维信号原始结构,通过字典序列刻画各个维度的特性,高效地表达多维信号。随之提出了基于Kronecker product运算的多维稀疏变换的训练方法,使全景视频信号在变换域不仅紧致而且更便于熵编码处理。提出了一种基于非紧框架的稳定稀疏表示模型以及对应的稀疏编码算法和框架学习算法,分别建立了基于Parseval框架和基于等角框架的冗余变换方法。.3、在面向全景图像/视频的多维稀疏变换编码方面,提出了一种基于协同预测的多流自动编码器来压缩相关图像。该方法使用多流自动编码器通过对多流特征实施共参考约束来对多个高度相关的图像进行协同编码。此外,提出了基于多分支空间变换网络视图合成的图像压缩方法,分别提出了一种基于双背景和渐进背景更新的监控视频编码方案。提出了基于分类的全景视频自适应插值和变换以提高编码效率。为了进一步提高解压缩后的图像质量,分别提出了基于多频概率推理模型和基于小波变换注意力模型的压缩图像修复方法。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
2

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
3

坚果破壳取仁与包装生产线控制系统设计

坚果破壳取仁与包装生产线控制系统设计

DOI:10.19554/j.cnki.1001-3563.2018.21.004
发表时间:2018
4

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

DOI:10.3799/dqkx.2020.083
发表时间:2020
5

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018

施云惠的其他基金

批准号:61170103
批准年份:2011
资助金额:56.00
项目类别:面上项目
批准号:61370118
批准年份:2013
资助金额:73.00
项目类别:面上项目
批准号:60973056
批准年份:2009
资助金额:31.00
项目类别:面上项目

相似国自然基金

1

基于稀疏建模的视频图像编码与重建方法研究

批准号:61370114
批准年份:2013
负责人:熊瑞勤
学科分类:F0210
资助金额:80.00
项目类别:面上项目
2

基于统计建模和稀疏表示的图像视频增强表达和高效编码

批准号:61272386
批准年份:2012
负责人:赵德斌
学科分类:F0210
资助金额:81.00
项目类别:面上项目
3

面向光场图像的紧框架多维变换与可分离重建

批准号:61906008
批准年份:2019
负责人:王瑾
学科分类:F0604
资助金额:25.00
项目类别:青年科学基金项目
4

面向图像与视频特征表示的深度编码方法研究

批准号:61272319
批准年份:2012
负责人:常虹
学科分类:F0605
资助金额:80.00
项目类别:面上项目