木刻印刷蒙古文古籍文献资料,内容涉及宗教、历史、文化、艺术、天文地理、民族、医学等诸多方面,是人类文化的宝贵遗产。这些文献中以清代(1720年)在北京木刻印刷的《御制蒙古文甘珠尔经》是最有代表性的、有世界影响的蒙古文古籍文献资料。本项目主要以《御制蒙古文甘珠尔经》为对象,首先运用文字识别技术将扫描图像中的蒙古文识别后形成用编码保存的电子文档,再运用信息检索技术根据用户提供的查询关键词找到相关电子文档及其对应的文档图像,以便对其进行挖掘与利用。我们将从文字识别和信息检索的角度,系统地研究和解决所涉及的古典蒙古文字特征分析、字形基元的分割与特征提取、分类算法、古典蒙古文到现代蒙古文的转换规则,要总结识别系统出现错误的规律,从错误校正和查询扩展两方面入手,提高识别后文档的检索准确度。这些工作对现存的蒙古文古籍文献资料的抢救、挖掘和利用都有重要的现实意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于细粒度词表示的命名实体识别研究
多方法融合的蒙古文古籍图像检索技术研究
面向传真报文分类检索的中亚印刷体文种识别研究
跨汉斯拉夫蒙古文的信息检索关键技术研究
乌金体藏文古籍文档分析与识别研究