汉字识别文本自动输入中若干重要问题的进一步研究

基本信息

批准号：69472007

项目类别：面上项目

资助金额：6.00

负责人：丁晓青

学科分类：

依托单位：清华大学

批准年份：1994

结题年份：1997

起止时间：1995-01-01 - 1997-12-31

项目状态：已结题

项目参与者：丁晓青,郭繁夏,郭宏,贾红,张忠,胡庆文,马兵,蔡东辉,黄斐萍,许剑辉

关键词：

汉字识别文本自动输入汉英混合识别

结项摘要

在多字体汉英混排印刷文本识别实用化性能提高若干重要问题的研究获得重要进展，主要在⑴低质量印刷文本识别本的提高：核心在于汉字识别特征的提取，从理论上应提取高有效信息熵的特征，在实际上筛选出适合汉字识别高鲁棒性的特征，极大提高了低质量印刷文本的识别率。在体系结构上，采取多识别方案的综合集成方法，更进一步有效地提高了识别率和鲁棒性。⑵多文种混排文本的识别，最常迁到的是汉英混排队的双语文本识别，最佳识别方案是在混排文本首先进行语种的辨识和然后按不同语种分别进行纠字切分和不同语种的识别和后处理。进行文种的辨识，如汉字和英文的辨识主要依靠不同文字的统计特性的区别。研究成果为THOCR-94和THOCR-97多文种汉字识别系统。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.3778/j.issn.1673-9418.2104120

发表时间：

DOI：10.19693/j.issn.1673-3185.01377

发表时间：2019

DOI：CNKI:SUN:YGXB.0.2018-01-012

发表时间：2018

DOI：

发表时间：2017

丁晓青的其他基金

批准号：61032008

批准年份：2010

资助金额：230.00

项目类别：重点项目

批准号：60472002

批准年份：2004

资助金额：22.00

项目类别：面上项目

批准号：69972024

批准年份：1999

资助金额：13.00

项目类别：面上项目

批准号：69682003

批准年份：1996

资助金额：14.50

项目类别：专项基金项目

批准号：60241005

批准年份：2002

资助金额：15.00

项目类别：专项基金项目

相似国自然基金

汉字识别研究中若干核心问题的新开拓

批准号：69972024

批准年份：1999

负责人：丁晓青

学科分类：F0113

资助金额：13.00

项目类别：面上项目

基于合成样本和MCE准则下判别学习的汉字手写文本识别研究

批准号：60975020

批准年份：2009

负责人：张田文

学科分类：F0605

资助金额：32.00

项目类别：面上项目

基于多种知识的脱机手写体汉字文本识别方法研究

批准号：69675004

批准年份：1996

负责人：马少平

学科分类：F0605

资助金额：9.00

项目类别：面上项目

以知识为基础的文本图像理解和汉字识别及处理的研究

批准号：68872003

批准年份：1988

负责人：吴佑寿

学科分类：F0116

资助金额：5.00

项目类别：面上项目

汉字识别文本自动输入中若干重要问题的进一步研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于直观图的三支概念获取及属性特征分析

基于速变LOS的无人船反步自适应路径跟踪控制

GF-4序列图像的云自动检测

基于小波高阶统计量的数字图像来源取证方法

丁晓青的其他基金

多民族文字识别及理解的理论与方法研究

基于统计模型的机器视觉理论、方法和应用研究

汉字识别研究中若干核心问题的新开拓

汉字识别综合理论和方法的研究

少数民族文字识别的理论和方法的研究

相似国自然基金