It is vital in the information field to obtain a compact high-fidelity representation of the observed signal, which can find extensive applications in video image compression, medical imaging analysis, multi-spectrum signal processing and so on. The challenging problem is how to find a small quantity of primitive elements to completely reconstruct the valid information of signals. Current methods represent a multidimensional signal as a combination of multiple independent 2D scalar signals, completely ignoring the inter-relationship among the multiple dimensions and consequently producing structure distortions in the reconstruction results. This project aims to build vector sparse representation of multidimensional signals with the advantage of high structural fidelity, which is hopefully to provide a general and powerful tool for common multidimensional signal processing tasks. The main innovation works include: (1) To reduce the structural distortions among channels, we propose a vector sparse representation of multidimensional signals based on quaternion matrix analysis. (2) To reduce the spatiotemporal structure distortions, we propose a vector sparse representation of multidimensional signals using tensor decomposition. (3) To reduce the distortions in distributed representation, we propose quaternion deep neural network techniques and apply them to achieve an extremely powerful tool for compactly representing multidimensional signals with high fidelity.
多维信号的结构保真与高效表示是信息学科领域的关键技术,在视频图像压缩、医学影像分析、多光谱信号处理等领域有着广泛的应用。其难点在于如何采用少量的基元来获得对原始信号有效信息的完整重建。现有方法通常将多维信号降阶成多个二维标量信号而分别独立表示,由此会导致信号某些维度上的结构失真。结合前期研究基础,本项目拟通过对多维信号的矢量稀疏表示模型的研究,为常见的多维信号处理任务提供一种普适的、结构保真的分析工具。主要创新之处包括:(1)研究和构建基于四元矩阵分析的矢量稀疏表示模型,以解决多维信号通道间结构失真问题;(2)研究和构建基于张量分解的矢量稀疏表示模型,以解决多维信号时空结构失真问题;(3)研究和构建基于四元深度神经网络的多维信号表示模型,以解决多维信号分布式结构失真问题。
多维信号的结构保真与高效表示是信息学科领域的关键技术,在视频图像压缩、医学影像分析、多光谱信号处理等领域有着广泛的应用。其难点在于如何采用少量的基元来获得对原始信号有效信息的完整重建。现有方法通常将多维信号降阶成多个二维标量信号而分别独立表示,由此会导致信号某些维度上的结构失真。结合前期研究基础,本项目拟通过对多维信号的矢量稀疏表示模型的研究,为常见的多维信号处理任务提供一种普适的、结构保真的分析工具。本项目通过四年的研究工作,提出了以下有助于多维信号结构保真的表示方法以及分析工具:.1.提出了一种层级的结合四元Gabor相位特征以及深度语义特征的自然图像表征方法,并将基于该表征空间的相似性度量应用于图像着色过程中,解决了以往基于颜色传播的图像着色算法难以实现涂鸦自动生成以及因图像表征能力不足而导致的色彩渗出和着色不足问题。.该成果可应用于老电影上色、用户自主定义上色等任务中。.2.率先提出四元卷积神经网络,提供了一个先进的彩色自然图像的深度特征提取工具,解决了实数卷积神经网络因忽视自然图像各颜色通道间的相关关系,而出现模型性能下降的问题。.该成果可普遍应用于自然彩色图像的处理与分析任务中,为实数卷积层的标量运算提供了一个可替换的四元卷积的矢量运算操作,在自然彩色图像的细节结构表示方面,表现出更强的保真能力。.3.率先提出基于四元乘积单元的深度学习网络模型,为三维旋转群提供了先进的表征工具,解决了实数网络的代数运算对三维旋转群不是封闭的,难以有效提取三维旋转数据之间相对关系的开放问题。.该成果可普遍应用于三维旋转群的深度特征提取任务中,且这些深度特征可被自动解耦为“旋转不变”特征和“旋转等变”特征,适用于需要旋转鲁棒性的学习任务。
{{i.achievement_title}}
数据更新时间:2023-05-31
内点最大化与冗余点控制的小型无人机遥感图像配准
基于细粒度词表示的命名实体识别研究
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
平行图像:图像生成的一个新型理论框架
基于关系对齐的汉语虚词抽象语义表示与分析
基于张量的结构化稀疏表示理论及多维信号复原方法研究
信号盲处理的稀疏表示方法
基于多维信息稀疏表示的胎儿心功能超声评价方法研究
信号稀疏表示的广义测不准原理研究