Image is the projection of three-dimensional world. Along with the advent and popularization of digital cameras and smart phones, image has increasingly been used as the medium to carry and transmit information and already become an important while sufficient source to get information. To computer applications, image is considered as one kind of principle raw data, with widespread origins. It is a challenge work to acquire information even knowledge from large amount of image data. Generally, image acquisition is relevant to many factors including illumination, viewing angle and distance, which will affect the parameters of image appearance, such as color, shape, texture, brightness, resolution and so on, and even interact among themselves. For the same object or scene, when choosing different factors to acquire images, there will be difference in appearance. In this case, it's hard to establish the correspondence or equivalence between any two images of the same object or scene, which results in difficulty in recognition or retrieval and increases the complexity to make use of images. Thoroughly excavating and describing the invariant features involved in image apparent information in order to realize the effective image description and object or scene recognition, is what we are devoted to. This project is intent to thoroughly analyze the projection and transformation property of images, and research on the method constructing invariant features based on shape, color and texture information when image is under shape, color and scale transformations. Then, these invariants are expected to be applied to image retrieval, object recognition and three-dimensional reconstruction, etc.
图像是三维世界的投影,随着数码相机、智能手机的普及越来越多的作为承载和传递信息的媒介,已经成为重要而丰富的信息源,对计算机应用来说是一类来源广泛的重要的原始数据。从大量图像数据中获取信息甚至知识是一项极具挑战性的工作。 一般图像数据的获取涉及光照、视角和距离等的选择,表现为图像的颜色、形状、纹理或者亮度、分辨率等参数的不同,它们甚至互相影响,使同一物体或者场景在选择不同参数获取的图像的表观信息中呈现出差异,因而难以建立对应或者等价关系,造成识别或者检索的困难,增加了图像数据利用的复杂度。深入发掘和描述这些表观信息中所蕴含的不变特征,从而实现图像内容的有效表达和物体、场景的唯一性判别,是本项目致力于探索的问题。 本项目从理论上深入分析图像的投影和变换性质,研究图像在几何、颜色和尺度等变换下形状、颜色和纹理信息的不变性描述方法,建立相应的不变量表示,并应用于图像检索、目标识别和三维重构等。
本项目依据几何变换群和不变量理论,研究图像的形状、颜色、纹理和尺度等特征在不同成像条件或变换群下的不变量构造方法及其在形状分析中的应用。主要结果包括:..1.发现了几何矩不变量的两个基本生成函数,称之为形状DNA。由其积分生成的不变量具有最简形式,称为本原不变量。目前已知的所有几何矩不变量都是它们的线性组合。这一结果降低了不变量的结构和计算的复杂度,统一了欧氏空间仿射变换群下几何矩不变量的构造框架,并适用于曲线曲面和三维实体等多种流形。..2.证明了上述积分不变量构造方法可直接用于得到仿射微分不变量,即两者除了一个与变换参数有关的函数因子之外是同构的。由于积分不变量可以用形状DNA积分得到,这一发现使得仿射微分不变量的求解变得简单。由于射影变换群包含了仿射变换群,因此,射影的微分不变量包含于仿射微分不变量集合中。由此得到的两个射影微分不变量为国际上首次报道。..3.由微分不变量作为加权函数作积分得到加权矩不变量的定义,由此引出的一个重要结果是获得了射影变换不变量。照相机的针孔成像假设的数学模型是射影几何变换,射影变换不变量一直是几何不变量研究追求的目标之一。国际顶级期刊PAMI 2004文章曾给出用无穷级数展开表示的射影不变量,其方法不具有可行性,并且结果是错的。..4.构造出了高斯模糊与仿射变换的不变量,以及颜色和形状同时发生仿射变换时的混合不变量。在后者情况下,相似性比较的一般做法是分别提取特征再加权融合,但权因子选择困难且不具有一般性。此前的最好结果是颜色的仿射变换与形状的相似变换结合,而这只是一般仿射变换的特例。..5.发现了镜像变换不变量的构造模式,得到了2D 和3D 两组镜像不变量。利用对称点在正交补空间上的投影代数和恒为零的性质,建立了一个适用于任意维欧氏空间的对称性探测和确定的高效稳定算法,即由求解一个三角函数方程(组)得到全部可能的对称轴或对称平面,再由镜像不变量判定其对称性。这使得几何对称性判定问题得到完满解决。
{{i.achievement_title}}
数据更新时间:2023-05-31
内点最大化与冗余点控制的小型无人机遥感图像配准
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于细粒度词表示的命名实体识别研究
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
基于视觉感知模型的图像不变特征提取与遥感应用研究
图像运动模糊不变量特征学习
图像局部不变性特征及模型研究
基于视觉认知的图像不变特征提取