在扫描或用相机拍摄书籍等文档时,由于书脊区域的扭曲变形,得到的图像中会产生亮度不均、图像扭曲以及字迹模糊等非线性失真现象。图像中的这种非线性失真,一方面降低了图像的扫描质量,另一方面,还为后续的文本图像分析与识别带来了很多困难。非线性失真矫正是文本图像分析领域的一个重要研究分支,具有非常广阔的应用前景和重要的研究价值。该技术可广泛的应用于扫描仪、复印机以及便携式相机等图像采集设备上,提高图像采集的质量及其自动化程度。本项目主要研究文本图像采集过程中产生的各种非线性失真现象,包括非均匀阴影、图像扭曲变形以及图像模糊等。通过分析这些失真产生的内在机理,并引入合理的图像假设与先验,来构造合适的图像失真模型,从而揭示图像失真产生的过程。最后,构造实用的算法实现图像失真的鲁棒矫正。本项目的研究成果可望为新一代智能扫描仪、复印机与便携式相机等图像采集设备的嵌入式软件开发提供核心技术支持。
本项目旨在解决书籍等文档图像采集过程中产生的若干非线性失真问题,包括因书籍页面完全和相机透视效应引起的几何畸变、图像光照不均以及相机失焦和抖动引起的文字模糊等。针对这些问题,本项目开展了系列深入的研究,取得了一定的研究成果,较好的完成了项目的预期研究目标。所取得的重要研究进展和研究成果包括:1)针对文本图像几何畸变的矫正问题,通过分析相机与文档页面之间的空间几何约束关系,提出了一种基于等距网格形变的畸变矫正方法。与现有方法相比,该方法首次实现了文本图像几何畸变及透视失真的度量矫正;2)针对文本图像扫描过程中引入的非均匀阴影问题,提出了一种基于凸包重构的无参数化页面阴影估计方法。与传统方法相比,该方法可精确提取书籍页面扫描过程中产生的非均匀阴影并自动去除扫描过程中产生的黑色边框噪声,整个过程无需人工干预和参数设置,非常适合于算法的嵌入式运行;3)针对因相机失焦、抖动产生的图像模糊问题,先后提出了基于图像阶跃边缘引导的运动模糊复原方法和基于区域重构的图像多焦融合等系列方法。这些方法可有效的去除图像中存在的失焦模糊和运动模糊;4)针对因恶劣雾天气象条件引起的图像成像模糊问题,提出了基于边界约束和图像上下文正则化的图像去雾方法。与经典方法相比,该方法适用于图像中存在不均匀分布的雾,且去雾后图像中不会出现常见的去雾痕迹;5)此外,本项目还资助研究了若干相关的课题研究,包括图像插值与超分辨率、基于水平集的图像分割、图像增强等。本项目共资助发表22篇相关学术论文,并资助申请国家技术发明专利6项(3项已获授权)。相关研究成果发表在包括IEEE T-PAMI(2篇)、IEEE TNN(1篇)、IEEE T-CSVT(1篇)、PR(2篇)等在内的本领域国际顶级杂志以及ICCV、ACCV、ICIP、ICASSP等本领域国际知名会议上。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
阵列误差校正中的若干重要问题和技术研究
面向敏感网络图像过滤的原生数字图像文本提取关键技术研究
面向英汉双向跨语言图像检索的文本分析关键技术研究
图像语义自动文本描述技术研究