Unconstrained handwritten document recognition (string recognition) is an important branch of character recognition field, and faces great challenges due to its limited performance for the application of document digitalization. Unlike isolated character recognition, context information is very important for string recognition, however, most systems do not consider context modeling sufficiently, especially high-order context. This project studies context modeling techniques in document recognition to improve recognition performance, which include three main issues: (1) Modeling high-order linguistic context, including statistical and structured language models; (2) Modeling high-order geometric context, including geometric features extraction and statistical modeling; (3) Developing an efficient search algorithm for a huge and ever-expanding search space due to incorporating high-order context information. Based on the developed string recognition techniques and handwriting databases, we will test the proposed methods on a larg-scale of Chiniese handwritten documents via combining statistical and structured models with an efficient search algorithm. Moreover, the context modeling and serach method can also apply to the recognition of the documents of other languages (such as English and Arabic).
自由书写的文档识别(字符串识别)是文字识别领域中的一个重要分支,目前还有很多问题亟待解决,以满足脱机文档电子化的需要。目前中文手写文档识别性能还很低下,其中一个很大原因是上下文信息利用不足,特别是高阶上下文的建模。本项目拟对文档识别中的高阶上下文信息建模进行深入研究,以达到提高识别性能、推动实际应用的目的。主要研究内容包含:(1)高阶语言上下文建模方法的研究,包括统计和结构语言模型的研究与应用;(2)高阶几何上下文建模方法的研究,包括几何特征提取和统计模型表示与学习;(3)融合高阶上下文模型的手写文档识别中高效搜索算法研究。我们将在已有的技术基础和数据基础上,通过结合统计模型和句法结构分析技术,采用快速准确的搜索算法,在大规模的自由书写中文文档识别中检验识别性能。本项目提出的高阶上下文建模和搜索方法与书写语言关系不大,因而可以推广到其他语言的文档识别中,比如英文、阿拉伯文等。
长距离的上下文模型建立能够帮助手写文档识别过程中更好的利用上下文信息,有效的提高了识别精度。本项目系统的研究了文档识别中上下文建模理论和关键技术,通过系统深入的研究,本项目的主要研究贡献在于:(1)语言上下文建模,除了传统的N-gram模型,研究了在文档识别中基于神经网络的语言上下文模型,包括前馈神经网络语言模型 (FNNLM)和递归神经网络语言模型 (RNNLM);(2)非监督的语言模型自适应,通过采用两遍识别策略,提出了模型选择,模型组合以及模型重构三种非监督的语言模型自适应方法,使得文档识别性能得到有效的提升;(3)几何上下文模型,成功的改进了传统的几何模型,提出了结合多元特征的几何模型,并且成功运用与手写数字串识别中,取得了ICFHR2014 手写数字串识别竞赛获得第一名。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于细粒度词表示的命名实体识别研究
自然书写的脱机中文手写文档识别与检索
中文手写文档关键词检索的理论与方法研究
手写中文文本识别的高扩展判别学习理论和方法
基于上下文主动学习的交互式文档识别方法研究