在大类别无约束的联机中文手写识别中,由于模型自适技术能有效提升识别性能和改善个性化用户体验,因此这项技术是目前文字识别领域内一个重要且难解决的研究课题,受到了不少研究者的关注。本项目研究基于增量学习的模型自适应技术及其在无约束联机文字识别中的应用。主要研究内容包括:(1)线性鉴别子空间增量学习书写者自适应模型及方法;(2)改进二次鉴别函数(MQDF)增量学习模型及技术;(3)鉴别增量MQDF模型自适应方法及其应用;(4)基于增量格子支持向量机(LATTICE SVM)和增量混合高斯模型(GMM)的书写者自适应方法;(5)结合实际应用,实现一个高性能个性化的云手写输入应用示范系统。该项目在前期较好的研究工作基础上开展,针对大部分技术难点及研究问题设计了明确可行的技术路线,所提出研制的多个模型自适应技术及方法有创新,具有很好的理论及应用研究价值。
中文手写文字识别一直以来都是模式识别领域的一个热点研究方向。同时,无约束的中文手写识别由于其用户书写风格的多样性及手写样本的多变性,长期成为模式识别领域的一大难题。虽然规范的有约束的中文手写识别技术已经取得了非常大的发展,识别率已经达到98%以上,然而无约束的中文手写识别的识别率却远远低于规范的有约束的中文手写识别,识别率仅能达到93%左右。因此,使无约束的中文手写识别达到令人满意的识别性能就是一个急需解决的重要问题。随着智能手机、电纸书和平板电脑等带有触摸屏幕的手持电子设备非常流行和普及,这使得在这些电子设备上手写输入方法变得越来越重要。然而由于在实验室采集的手写数据非常有限而不能涵盖所有书写风格,导致在实际应用中手写识别率并不能达到令人满意的效果。尤其是对于某些特定用户,由于其特殊的书写风格,导致对这些用户的识别性能不够好。..针对以上的问题,课题组研究了基于大规模无约束手写数据的书写者自适应的中文手写识别技术,这种技术采用大规模的无约束的手写数据来训练分类器,保证了训练样本中含有尽可能多的书写风格,进而满足大部分书写者的书写体验。同时,我们提出的用户自适应算法可以对特定用户的书写风格进行自适应学习,从而提高该用户的识别率,使该用户获得“越写越准”的用户体验。然而这项研究工作面临许多技术难题,包括,汉字书写风格多变的问题,汉字结构复杂并具有许多难以区分的相似字的问题,数据库的采集与整理的问题,增量学习中原始分类器词典的压缩问题,增量学习中对普通用户的识别率有所降低的问题,以及在鉴别特征空间进行增量学习的问题,手写交互及手写美化问题,云计算环境下的个性化手写识别及应用问题,以及相关机器学习。课题组围绕着这些难点对基于大规模无约束手写数据的书写者自适应的中文手写识别技术展开了一系列的研究,通过对特定用户的书写风格的增量学习,可以大大提高对该用户的书写样本的识别率,同时可以不降低对于其他普通用户的识别率,这可以让所有用户获得更人性化的用户体验。..课题组共发表论文35篇,其中SCI 期刊论文19篇,IEEE Transaction论文(长文)5篇; EI期刊论文5篇,核心期刊论文3篇,国际会议论文12篇(全部为EI或ISTP检索)。获得18项发明专利授权;申请了14项发明专利并已通过初审。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种基于多层设计空间缩减策略的近似高维优化方法
基于改进LinkNet的寒旱区遥感图像河流识别方法
智能煤矿建设路线与工程实践
二维FM系统的同时故障检测与控制
扶贫资源输入对贫困地区分配公平的影响
联机手写蒙文字识别的研究
联机手写新疆维吾尔文字符识别研究
脱机手写藏文字符识别研究
联机手写化学公式识别研究