中文手写文档识别中高阶上下文建模方法研究

基本信息
批准号:61305005
项目类别:青年科学基金项目
资助金额:25.00
负责人:王秋锋
学科分类:
依托单位:中国科学院自动化研究所
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:周明可,陈凯,谢国森,邱泉,杨学行
关键词:
搜索算法文档识别语言模型几何模型高阶上下文
结项摘要

Unconstrained handwritten document recognition (string recognition) is an important branch of character recognition field, and faces great challenges due to its limited performance for the application of document digitalization. Unlike isolated character recognition, context information is very important for string recognition, however, most systems do not consider context modeling sufficiently, especially high-order context. This project studies context modeling techniques in document recognition to improve recognition performance, which include three main issues: (1) Modeling high-order linguistic context, including statistical and structured language models; (2) Modeling high-order geometric context, including geometric features extraction and statistical modeling; (3) Developing an efficient search algorithm for a huge and ever-expanding search space due to incorporating high-order context information. Based on the developed string recognition techniques and handwriting databases, we will test the proposed methods on a larg-scale of Chiniese handwritten documents via combining statistical and structured models with an efficient search algorithm. Moreover, the context modeling and serach method can also apply to the recognition of the documents of other languages (such as English and Arabic).

自由书写的文档识别(字符串识别)是文字识别领域中的一个重要分支,目前还有很多问题亟待解决,以满足脱机文档电子化的需要。目前中文手写文档识别性能还很低下,其中一个很大原因是上下文信息利用不足,特别是高阶上下文的建模。本项目拟对文档识别中的高阶上下文信息建模进行深入研究,以达到提高识别性能、推动实际应用的目的。主要研究内容包含:(1)高阶语言上下文建模方法的研究,包括统计和结构语言模型的研究与应用;(2)高阶几何上下文建模方法的研究,包括几何特征提取和统计模型表示与学习;(3)融合高阶上下文模型的手写文档识别中高效搜索算法研究。我们将在已有的技术基础和数据基础上,通过结合统计模型和句法结构分析技术,采用快速准确的搜索算法,在大规模的自由书写中文文档识别中检验识别性能。本项目提出的高阶上下文建模和搜索方法与书写语言关系不大,因而可以推广到其他语言的文档识别中,比如英文、阿拉伯文等。

项目摘要

长距离的上下文模型建立能够帮助手写文档识别过程中更好的利用上下文信息,有效的提高了识别精度。本项目系统的研究了文档识别中上下文建模理论和关键技术,通过系统深入的研究,本项目的主要研究贡献在于:(1)语言上下文建模,除了传统的N-gram模型,研究了在文档识别中基于神经网络的语言上下文模型,包括前馈神经网络语言模型 (FNNLM)和递归神经网络语言模型 (RNNLM);(2)非监督的语言模型自适应,通过采用两遍识别策略,提出了模型选择,模型组合以及模型重构三种非监督的语言模型自适应方法,使得文档识别性能得到有效的提升;(3)几何上下文模型,成功的改进了传统的几何模型,提出了结合多元特征的几何模型,并且成功运用与手写数字串识别中,取得了ICFHR2014 手写数字串识别竞赛获得第一名。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
5

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018

王秋锋的其他基金

批准号:61876154
批准年份:2018
资助金额:62.00
项目类别:面上项目

相似国自然基金

1

自然书写的脱机中文手写文档识别与检索

批准号:60933010
批准年份:2009
负责人:刘成林
学科分类:F0210
资助金额:200.00
项目类别:重点项目
2

中文手写文档关键词检索的理论与方法研究

批准号:61403385
批准年份:2014
负责人:张恒
学科分类:F0605
资助金额:25.00
项目类别:青年科学基金项目
3

手写中文文本识别的高扩展判别学习理论和方法

批准号:61203260
批准年份:2012
负责人:苏统华
学科分类:F0605
资助金额:24.00
项目类别:青年科学基金项目
4

基于上下文主动学习的交互式文档识别方法研究

批准号:61773325
批准年份:2017
负责人:王大寒
学科分类:F0605
资助金额:65.00
项目类别:面上项目