在手写文本库的支持下,从无切分的全新角度研究真实手写环境中的脱机汉字识别,是汉字手写识别从孤立汉字走向真实文本这一新里程的核心技术。无切分策略是把字符切分阶段和识别阶段合二为一,并进行联合优化,旨在充分利用手写文本行的整体信息,这一策略的可行性和有效性,以及与现有切分策略的互补性已经在前期研究工作中得到证实。本项目将在此基础上,研究汉字手写文本识别中的三项关键技术:1).建立中文手写文本库HIT-MW(第二版),并对保证手写文本库的代表性、典型性的方法和验证机制进行研究;2).研究汉字手写样本合成理论,通过建立自学习、自适应的合成样本,有效克服库中存在的数据稀疏问题;3).研究基于最小分类错误准则的判别学习方法,有望解决无切分识别策略的松散训练结构,提高字符模型的区分能力。本项目为进一步研究汉字手写文本识别的系综分类理论奠定坚实的理论基础,并为汉字手写识别的各种应用提供有力的技术支持。
从无切分的全新角度研究真实手写环境中的脱机汉字识别,是汉字手写识别从孤立汉字走向真实文本这一新里程的核心技术。无切分策略是把字符切分阶段和识别阶段合二为一,并进行联合优化,旨在充分利用手写文本行的整体信息,这一策略的可行性和有效性,以及与现有切分策略的互补性已经在前期研究工作汇总得到证实。. 本项目研究汉字手写文本识别中的三项关键技术:1)扩建中文手写文本库HIT-MW;2)研究汉字手写样本合成理论,通过建立合成样本,有效克服库中存在的数据稀疏问题;3)研究基于最小分类错误准则的判别学习方法,提高字符模型的区分能力。本项目为进一步研究汉字手写文本识别的系综分类理论奠定坚实的理论基础,并为汉字手写识别的各种应用提供有力的技术支持。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于细粒度词表示的命名实体识别研究
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理
手写中文文本识别的高扩展判别学习理论和方法
基于多种知识的脱机手写体汉字文本识别方法研究
基于深度学习的多语种自然手写文本识别理论和方法
联机行草手写汉字识别的方法研究