汉字识别文本自动输入中若干重要问题的进一步研究

基本信息
批准号:69472007
项目类别:面上项目
资助金额:6.00
负责人:丁晓青
学科分类:
依托单位:清华大学
批准年份:1994
结题年份:1997
起止时间:1995-01-01 - 1997-12-31
项目状态: 已结题
项目参与者:丁晓青,郭繁夏,郭宏,贾红,张忠,胡庆文,马兵,蔡东辉,黄斐萍,许剑辉
关键词:
汉字识别文本自动输入汉英混合识别
结项摘要

在多字体汉英混排印刷文本识别实用化性能提高若干重要问题的研究获得重要进展,主要在⑴低质量印刷文本识别本的提高:核心在于汉字识别特征的提取,从理论上应提取高有效信息熵的特征,在实际上筛选出适合汉字识别高鲁棒性的特征,极大提高了低质量印刷文本的识别率。在体系结构上,采取多识别方案的综合集成方法,更进一步有效地提高了识别率和鲁棒性。⑵多文种混排文本的识别,最常迁到的是汉英混排队的双语文本识别,最佳识别方案是在混排文本首先进行语种的辨识和然后按不同语种分别进行纠字切分和不同语种的识别和后处理。进行文种的辨识,如汉字和英文的辨识主要依靠不同文字的统计特性的区别。研究成果为THOCR-94和THOCR-97多文种汉字识别系统。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
2

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
3

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理

适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理

DOI:10.19783/j.cnki.pspc.200521
发表时间:2021

丁晓青的其他基金

批准号:61032008
批准年份:2010
资助金额:230.00
项目类别:重点项目
批准号:60472002
批准年份:2004
资助金额:22.00
项目类别:面上项目
批准号:69972024
批准年份:1999
资助金额:13.00
项目类别:面上项目
批准号:69682003
批准年份:1996
资助金额:14.50
项目类别:专项基金项目
批准号:60241005
批准年份:2002
资助金额:15.00
项目类别:专项基金项目

相似国自然基金

1

汉字识别研究中若干核心问题的新开拓

批准号:69972024
批准年份:1999
负责人:丁晓青
学科分类:F0113
资助金额:13.00
项目类别:面上项目
2

基于合成样本和MCE准则下判别学习的汉字手写文本识别研究

批准号:60975020
批准年份:2009
负责人:张田文
学科分类:F0605
资助金额:32.00
项目类别:面上项目
3

基于多种知识的脱机手写体汉字文本识别方法研究

批准号:69675004
批准年份:1996
负责人:马少平
学科分类:F0605
资助金额:9.00
项目类别:面上项目
4

以知识为基础的文本图像理解和汉字识别及处理的研究

批准号:68872003
批准年份:1988
负责人:吴佑寿
学科分类:F0116
资助金额:5.00
项目类别:面上项目