基于关键点图表示的近重复文本图像匹配研究

基本信息
批准号:61603256
项目类别:青年科学基金项目
资助金额:18.00
负责人:刘丽
学科分类:
依托单位:南昌大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:陈胜,蔡轩,王刚,叶剑飞,李酉戌
关键词:
关键点近重复文本图像图像匹配图匹配图表示
结项摘要

Near-duplicate document images refer to the images captured from the same document but under different conditions. They are usually varied in resolution, perspective and illumination, et al. Near-duplicate document image matching plays a significant role in building digital libraries. Besides, it has received a lot of attention in the field of computer vision. Taking into consideration the characteristics of the document image, a near-duplicate document image matching approach is proposed in this project. Hopefully the proposed approach will achieve promising results and be able to give a deep insight into document image representation and matching. Two key issues involved in near-duplicate document image matching, viz. image representation and similarity measurement, will be investigated. To represent a document image, the keypoints will be first detected thanks to their great distinctiveness. Furthermore, the spatial configurations among the keypoints will be fully exploited. More specifically, the keypoints in the image will be clustered based on their distributions, with the number of clusters determined automatically. Afterwards, a graph will be constructed to represent the image, where the nodes in the graph correspond to the clusters and the edges represent the relations between different clusters. Consequently, the measurement of similarity between two images is transformed to graph matching. An inexact graph matching method allowing for many-to-many node mapping is proposed, which is remarkable in coping with the disparities among the near-duplicate images.

近重复文本图像是指从同一个文本在不同条件下拍摄得到的图像,图像之间在分辨率、视角以及光照等多方面均存在差异。近重复文本图像匹配在建立数字图书馆中起着重要作用,并且是计算机视觉领域一项基础研究课题。本项目结合文本图像自身特点,研究近重复文本图像匹配方法,期望通过本研究为文本图像的表示以及匹配提供新思路。本项目围绕近重复文本图像匹配中的两个核心问题开展研究:图像表示以及相似性度量,具体包括:提出一种基于关键点的文本图像表示方法,为了在表示图像过程中充分利用关键点之间的空间位置关系,将图像中的关键点根据其分布特性自动聚类,并且类别数目无需事先确定;研究基于聚类结果将图像表示为一个图,其中图中每个顶点代表一个聚类,图中的边则刻画不同聚类之间的空间位置关系,由此图像相似性度量转化为图匹配问题;研究允许顶点之间多对多映射的非精确图匹配方法,以提高对近重复文本图像的图表示之间所存在差异的鲁棒性。

项目摘要

近重复文本图像是指从同一个文本在不同条件下拍摄得到的图像,图像之间在分辨率、视角以及光照等多方面均存在差异。近重复文本图像匹配不仅是计算机视觉领域一项基础研究课题,而且在很多领域中有实际应用。本项目围绕近重复文本图像匹配中的两个核心问题开展了深入研究:图像表示与相似性度量。具体来说,主要完成了如下五方面的研究工作:1)比较了不同的关键点检测算子与描述算子在刻画文本图像方面的性能,实验结果表明DOG关键点检测算子与SIFT描述算子这一组合取得了最优性能。2)根据文本图像上关键点的分布特性,利用基于密度的聚类算法DBSCAN对其聚类。3)将聚类结果表示为一个图,其中图中顶点代表一个聚类,而图中的边则代表该边所连接两个聚类之间的位置关系。4)借助运输模型实现了允许顶点多对多映射的非精确图匹配。5)建立了一个近重复文本图像数据集。大量实验结果表明本项目所研究的方法对近重复文本图像之间所存在的差异具有很好的鲁棒性。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
2

氯盐环境下钢筋混凝土梁的黏结试验研究

氯盐环境下钢筋混凝土梁的黏结试验研究

DOI:10.3969/j.issn.1001-8360.2019.08.011
发表时间:2019
3

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

DOI:
发表时间:2018
4

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

刘丽的其他基金

批准号:51704075
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:41602145
批准年份:2016
资助金额:22.00
项目类别:青年科学基金项目
批准号:21174066
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:31360016
批准年份:2013
资助金额:49.00
项目类别:地区科学基金项目
批准号:31860028
批准年份:2018
资助金额:40.00
项目类别:地区科学基金项目
批准号:21374047
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:20604012
批准年份:2006
资助金额:25.00
项目类别:青年科学基金项目
批准号:39870881
批准年份:1998
资助金额:8.00
项目类别:面上项目
批准号:61202336
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:51773100
批准年份:2017
资助金额:61.00
项目类别:面上项目
批准号:30271427
批准年份:2002
资助金额:19.00
项目类别:面上项目
批准号:11126234
批准年份:2011
资助金额:3.00
项目类别:数学天元基金项目
批准号:81874271
批准年份:2018
资助金额:57.00
项目类别:面上项目
批准号:31000500
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:31871754
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:61240017
批准年份:2012
资助金额:10.00
项目类别:专项基金项目
批准号:31801487
批准年份:2018
资助金额:26.00
项目类别:青年科学基金项目
批准号:51101133
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:81671119
批准年份:2016
资助金额:58.00
项目类别:面上项目
批准号:61300150
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:51173032
批准年份:2011
资助金额:58.00
项目类别:面上项目
批准号:61370132
批准年份:2013
资助金额:75.00
项目类别:面上项目
批准号:41704147
批准年份:2017
资助金额:24.00
项目类别:青年科学基金项目
批准号:81601150
批准年份:2016
资助金额:17.00
项目类别:青年科学基金项目
批准号:51479046
批准年份:2014
资助金额:82.00
项目类别:面上项目
批准号:31760133
批准年份:2017
资助金额:35.00
项目类别:地区科学基金项目
批准号:31360349
批准年份:2013
资助金额:49.00
项目类别:地区科学基金项目
批准号:21707005
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:31400841
批准年份:2014
资助金额:24.00
项目类别:青年科学基金项目
批准号:30960005
批准年份:2009
资助金额:23.00
项目类别:地区科学基金项目
批准号:81873661
批准年份:2018
资助金额:56.00
项目类别:面上项目
批准号:11201260
批准年份:2012
资助金额:22.00
项目类别:青年科学基金项目
批准号:41471243
批准年份:2014
资助金额:90.00
项目类别:面上项目
批准号:51108375
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:61702310
批准年份:2017
资助金额:22.00
项目类别:青年科学基金项目
批准号:31571155
批准年份:2015
资助金额:64.00
项目类别:面上项目
批准号:11871304
批准年份:2018
资助金额:50.00
项目类别:面上项目
批准号:20874050
批准年份:2008
资助金额:32.00
项目类别:面上项目
批准号:61872379
批准年份:2018
资助金额:67.00
项目类别:面上项目
批准号:40801093
批准年份:2008
资助金额:20.00
项目类别:青年科学基金项目
批准号:50973059
批准年份:2009
资助金额:35.00
项目类别:面上项目
批准号:50603004
批准年份:2006
资助金额:25.00
项目类别:青年科学基金项目
批准号:31601316
批准年份:2016
资助金额:19.00
项目类别:青年科学基金项目
批准号:31371739
批准年份:2013
资助金额:81.00
项目类别:面上项目
批准号:81902976
批准年份:2019
资助金额:20.50
项目类别:青年科学基金项目
批准号:30170692
批准年份:2001
资助金额:19.00
项目类别:面上项目
批准号:60873193
批准年份:2008
资助金额:28.00
项目类别:面上项目
批准号:31060192
批准年份:2010
资助金额:27.00
项目类别:地区科学基金项目
批准号:81302493
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

基于符号决策图的图数据表示和匹配研究

批准号:61572146
批准年份:2015
负责人:古天龙
学科分类:F0202
资助金额:67.00
项目类别:面上项目
2

基于无序多图像的高可靠特征点匹配与最优化方法研究

批准号:60873085
批准年份:2008
负责人:王庆
学科分类:F0210
资助金额:28.00
项目类别:面上项目
3

基于运动迁移的图像非刚性匹配与特征点提取方法研究

批准号:61203254
批准年份:2012
负责人:杨旸
学科分类:F0604
资助金额:25.00
项目类别:青年科学基金项目
4

基于谱图理论和弹性网稀疏表示的荷斯坦牛图像识别研究

批准号:61373004
批准年份:2013
负责人:马燕
学科分类:F0605
资助金额:58.00
项目类别:面上项目