脱机手写藏文字符识别研究

基本信息
批准号:61462072
项目类别:地区科学基金项目
资助金额:47.00
负责人:黄鹤鸣
学科分类:
依托单位:青海师范大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:张晓华,辛月兰,多旦,曹鸣,刘卫,邹红艳,蔡晓娟,杨峰,王振东
关键词:
藏文识别字符脱机手写
结项摘要

It is a trend to put handwritten text into computer system automatically, and offline handwritten character recogniton is an important way to realize it. But, up to the present, there is little researches about off-line handwritten Tibetan character recognition both at home and abroad. Therefore, this project team devote itself to this challaging project. Firstly, the project team will further complete the sample database of off-line handwritten Tibetan characters. Secondly, in pre-processing stage, based on the characteristics of Tibetan character, the project team proposes a slant correction method and a size normalization method. Thirdly, the team proposes to extract the features of Tibetan character with such methods as sparse representation, kernel transform, and Zernike moments. Fourthly, in classification stage, the cascaded multiple classifier is used to deal with the problem of large class number of Tibetan characters. And finally, the project team use the restrains between letters of a Tibetan syllable to further improve the recognition rate of the proposed off-line handwritten Tibetan character recognition system. The study of this project will benefit the theory development of character recognition, the researchers training of this field, the informatization of Tibetan script, and the development of the science and technology of Tibetan area.

脱机手写字符识别输入是机器自动识别输入的一种重要方式,能克服人工键盘输入的固有缺陷,将成为计算机输入的主流,但通过专业机构的检索发现:几乎无人从事脱机手写藏文字符识别的研究工作,因此,项目组拟对这一课题展开研究。首先,进一步完善已有的脱机手写藏文字符样本数据库;其次,在预处理阶段,提出符合藏文字符特点的字符倾斜角度归一方法和尺寸归一方法;第三,提出基于稀疏表示和核主成分分析的藏文字符特征提取方法,提高系统对藏文字符的分类性能;第四,利用级联了K-NN和稀疏表示的两阶段分类器对藏文字符进行分类,解决藏文字符类别数过多和每类样本规模过大的问题;最后,根据藏文音节中各个字符间的语法制约关系建立语言模型进行识别后处理,从而进一步提高字符识别率。本项目的研究成功将对丰富文字识别理论、推动藏语言文字信息化、促进藏族地区科技发展、培养藏文信息处理领域科研骨干具有重要意义。

项目摘要

项目背景:. 准确高效地将藏文文字输入到智能设备是藏文信息化的一个重要基础。藏文的计算机输入可分为人工键盘输入和机器自动识别输入两种。人工键盘输入虽然有自身的优势但也有自身不可克服的缺陷,而机器自动识别输入能克服人工键盘输入的固有缺陷,并且随着模式识别理论和技术的不断发展,机器自动识别输入将成为计算机输入的主流。脱机手写藏文字符识别是对藏文进行机器自动识别输入的一种重要方式。.主要内容:. 建立了脱机手写藏文字符样本数据库;在深入研究符合藏文书写特点的预处理、特征提取、分类以及后处理等关键技术的基础上,设计了一个高效的脱机手写藏文字符识别系统;最后,对构成音节的各个字符(母)间的相互制约关系进行了研究,并将研究结果用于识别后处理,进一步提高了字符识别率。.重要结果:. 项目组对特征提取技术进行了较充分的研究,先后提出了基于LBP和PCA的特征提取方法、基于梯度的特征提取方法、基于不变矩和小波变换的特征提取方法、基于不变矩和梯度方向直方图的特征提取方法、基于字典学习和核主成分分析的特征提取方法;项目组对分类技术进行了研究,提出了基于K-近邻和稀疏表示的两阶段分类算法等分类技术;项目组提出了一种通用的藏文音节结构,利用项目组提出的藏文音节结构判定算法,能方便地得到藏文音节中字母间的约束关系。.关键数据:. 建立了联机手写藏文字符样本库和脱机手写藏文字符样本库。.研究意义:. 第一,脱机手写藏文识别输入能实现藏文的计算机智能输入;第二,有利于检测网络中以图像形式传播的手写藏文字符,保证网络中传输的藏文信息内容的安全;第三,有助于培养藏文信息处理领域的科研骨干。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
2

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
3

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
4

适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理

适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理

DOI:10.19783/j.cnki.pspc.200521
发表时间:2021
5

基于Pickering 乳液的分子印迹技术

基于Pickering 乳液的分子印迹技术

DOI:10.1360/N972018-00955
发表时间:2019

黄鹤鸣的其他基金

批准号:60963016
批准年份:2009
资助金额:22.00
项目类别:地区科学基金项目

相似国自然基金

1

脱机汉字手写行书的识别方法

批准号:69173307
批准年份:1991
负责人:夏莹
学科分类:F0605
资助金额:3.50
项目类别:面上项目
2

联机手写新疆维吾尔文字符识别研究

批准号:60863009
批准年份:2008
负责人:哈力木拉提·买买提
学科分类:F0211
资助金额:22.00
项目类别:地区科学基金项目
3

自然书写的脱机中文手写文档识别与检索

批准号:60933010
批准年份:2009
负责人:刘成林
学科分类:F0210
资助金额:200.00
项目类别:重点项目
4

手写体字符识别中的机器学习研究

批准号:68800501
批准年份:1988
负责人:周力嘉
学科分类:F0603
资助金额:1.50
项目类别:青年科学基金项目