木刻印刷蒙古文古籍文献资料,内容涉及宗教、历史、文化、艺术、天文地理、民族、医学等诸多方面,是人类文化的宝贵遗产。这些文献中以清代(1720年)在北京木刻印刷的《御制蒙古文甘珠尔经》是最有代表性的、有世界影响的蒙古文古籍文献资料。本项目主要以《御制蒙古文甘珠尔经》为对象,首先运用文字识别技术将扫描图像中的蒙古文识别后形成用编码保存的电子文档,再运用信息检索技术根据用户提供的查询关键词找到相关电子文档及其对应的文档图像,以便对其进行挖掘与利用。我们将从文字识别和信息检索的角度,系统地研究和解决所涉及的古典蒙古文字特征分析、字形基元的分割与特征提取、分类算法、古典蒙古文到现代蒙古文的转换规则,要总结识别系统出现错误的规律,从错误校正和查询扩展两方面入手,提高识别后文档的检索准确度。这些工作对现存的蒙古文古籍文献资料的抢救、挖掘和利用都有重要的现实意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种基于多层设计空间缩减策略的近似高维优化方法
基于改进LinkNet的寒旱区遥感图像河流识别方法
二维FM系统的同时故障检测与控制
扶贫资源输入对贫困地区分配公平的影响
高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析
多方法融合的蒙古文古籍图像检索技术研究
面向传真报文分类检索的中亚印刷体文种识别研究
跨汉斯拉夫蒙古文的信息检索关键技术研究
乌金体藏文古籍文档分析与识别研究