基于合成样本和MCE准则下判别学习的汉字手写文本识别研究

基本信息
批准号:60975020
项目类别:面上项目
资助金额:32.00
负责人:张田文
学科分类:
依托单位:哈尔滨工业大学
批准年份:2009
结题年份:2012
起止时间:2010-01-01 - 2012-12-31
项目状态: 已结题
项目参与者:郭恒业,金胜军,赵巍,刘鹏,陈冬,蔺想红,杨林
关键词:
手写文本库汉字手写文本识别最小分类错误准则的判别学习汉字手写样本合成理论无切分策略
结项摘要

在手写文本库的支持下,从无切分的全新角度研究真实手写环境中的脱机汉字识别,是汉字手写识别从孤立汉字走向真实文本这一新里程的核心技术。无切分策略是把字符切分阶段和识别阶段合二为一,并进行联合优化,旨在充分利用手写文本行的整体信息,这一策略的可行性和有效性,以及与现有切分策略的互补性已经在前期研究工作中得到证实。本项目将在此基础上,研究汉字手写文本识别中的三项关键技术:1).建立中文手写文本库HIT-MW(第二版),并对保证手写文本库的代表性、典型性的方法和验证机制进行研究;2).研究汉字手写样本合成理论,通过建立自学习、自适应的合成样本,有效克服库中存在的数据稀疏问题;3).研究基于最小分类错误准则的判别学习方法,有望解决无切分识别策略的松散训练结构,提高字符模型的区分能力。本项目为进一步研究汉字手写文本识别的系综分类理论奠定坚实的理论基础,并为汉字手写识别的各种应用提供有力的技术支持。

项目摘要

从无切分的全新角度研究真实手写环境中的脱机汉字识别,是汉字手写识别从孤立汉字走向真实文本这一新里程的核心技术。无切分策略是把字符切分阶段和识别阶段合二为一,并进行联合优化,旨在充分利用手写文本行的整体信息,这一策略的可行性和有效性,以及与现有切分策略的互补性已经在前期研究工作汇总得到证实。. 本项目研究汉字手写文本识别中的三项关键技术:1)扩建中文手写文本库HIT-MW;2)研究汉字手写样本合成理论,通过建立合成样本,有效克服库中存在的数据稀疏问题;3)研究基于最小分类错误准则的判别学习方法,提高字符模型的区分能力。本项目为进一步研究汉字手写文本识别的系综分类理论奠定坚实的理论基础,并为汉字手写识别的各种应用提供有力的技术支持。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
2

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
3

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理

适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理

DOI:10.19783/j.cnki.pspc.200521
发表时间:2021

张田文的其他基金

批准号:60475011
批准年份:2004
资助金额:23.00
项目类别:面上项目
批准号:69775007
批准年份:1997
资助金额:9.00
项目类别:面上项目
批准号:60075010
批准年份:2000
资助金额:17.00
项目类别:面上项目
批准号:69175004
批准年份:1991
资助金额:3.50
项目类别:面上项目

相似国自然基金

1

手写中文文本识别的高扩展判别学习理论和方法

批准号:61203260
批准年份:2012
负责人:苏统华
学科分类:F0605
资助金额:24.00
项目类别:青年科学基金项目
2

基于多种知识的脱机手写体汉字文本识别方法研究

批准号:69675004
批准年份:1996
负责人:马少平
学科分类:F0605
资助金额:9.00
项目类别:面上项目
3

基于深度学习的多语种自然手写文本识别理论和方法

批准号:61673140
批准年份:2016
负责人:苏统华
学科分类:F0605
资助金额:62.00
项目类别:面上项目
4

联机行草手写汉字识别的方法研究

批准号:69885006
批准年份:1998
负责人:刘迎建
学科分类:F0605
资助金额:13.00
项目类别:专项基金项目