基于深度学习的水书古籍文字识别关键技术研究

基本信息
批准号:61772575
项目类别:面上项目
资助金额:65.00
负责人:翁彧
学科分类:
依托单位:中央民族大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:林原,吴贵飙,黄建明,孙娜,崔德志,董玉双,蒲秋梅,贾晓栋,胡中泽
关键词:
机器学习方法神经网络无监督学习
结项摘要

In this study, the theory of deep learning is introduced into the ancient book recognition technology of “Shui Shu”, aiming at the instability of high-dimensional and multi-pixel "water book" ancient image training model and the problem of large-scale handwritten text data labeling, by constructing the Multi - layer confrontation neural network of Laplace structure, establish a clear generation model for the original image data of "Shui Shu", The stability Multi - layer confrontation neural network model from the rough to the fine level is formed. Based on the feature distance analysis of the "Shui Shu" sample character images, this paper calculates the intra-class spacing minimum value and the clustering number optimal value of the clustering model. Combined with the classifier model feedback, we adjust the optimal clustering number, constructs an evaluation function with information entropy adjustment clustering threshold convergence, and realize unsupervised data labeling of "Shui Shu" sample character images. In this paper, we use the feedback of convolution neural network to determine the algorithm model of super-parameters in clustering data labeling, and design and optimize the structure of convolution neural network to improve the recognition rate of handwritten characters in "Shui Shu

本研究将深度学习理论引入水书古籍文字识别技术中,针对高像素水书古籍图像训练生成模型的不稳定性和大规模的手写文字数据标注等问题,通过构造拉普拉斯结构的多层对抗神经网络,建立针对水书原始图像数据的清晰化生成模型,形成由粗糙到精细多映射关系层次的对抗神经网络稳定性模型。基于对水书文字图像样本特征距离的分析,计算聚类模型的类内间距最小值与聚类个数最优值。结合分类器模型反馈调节聚类模型最优聚类个数,构建带有信息熵调节聚类阈值收敛的评估函数,实现对水书文字图像样本的无监督标注。研究使用卷积神经网络的反馈来确定聚类标注中超参数的算法模型,设计并优化卷积神经网络结构以提高水书古籍手写文字的识别率。

项目摘要

水书是由“水文”(水族文字)写成的中华古籍,是我国古老的象形文字,其传承只依靠特定人群口传、手抄形式,现存水书大多字迹模糊、书品残破。因此,利用机器学习、大数据分析等先进的信息处理手段,突破古籍文献传统数字化保护方法,有效解决水书古籍文献数字化保护过程中图像清晰化处理、图像类别标注、手写文字识别等关键问题,推进我国古籍文献智能化数字化处理水平,逐步成为众多专家、学者的研究热点与探索方向。本项目将深度学习理论引入水书古籍文字识别技术中,针对高像素水书古籍图像训练生成模型的不稳定性和大规模的手写文字数据标注等问题,通过构造拉普拉斯结构的多层对抗神经网络,建立针对水书原始图像数据的清晰化生成模型,形成由粗糙到精细多映射关系层次的对抗神经网络稳定性模型。基于对水书文字图像样本特征距离的分析,计算聚类模型的类内间距最小值与聚类个数最优值。结合分类器模型反馈调节聚类模型最优聚类个数,构建带有信息熵调节聚类阈值收敛的评估函数,实现对水书文字图像样本的无监督标注。研究使用卷积神经网络的反馈来确定聚类标注中超参数的算法模型,设计并优化卷积神经网络结构以提高水书古籍手写文字的识别率。经过试验验证,项目组提出的方法最终得到的识别率为98.3%,该结果在大多数情况下可以满足文字识别的需求,错误分类的概率很低,证明方法的有效性,项目组设计了将图像识别技术应用于移动终端的水书文字识别系统,极大地方便了水书学习和水族文化的传播。项目资助发表核心论文13篇。培养硕士生7名均已经取得硕士学位。项目投入经费78万元,总支出68.22148万元,各项支出基本与预算相符。剩余经费9.77852万元,剩余经费计划用于本项目研究后续支出。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
4

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019
5

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021

翁彧的其他基金

相似国自然基金

1

基于深度学习的人脸识别关键技术研究

批准号:61571379
批准年份:2015
负责人:严严
学科分类:F0116
资助金额:60.00
项目类别:面上项目
2

基于深度信息的复杂场景文字识别研究

批准号:61501192
批准年份:2015
负责人:李南希
学科分类:F0116
资助金额:19.00
项目类别:青年科学基金项目
3

基于扰动的文字识别理论和关键技术研究

批准号:61175021
批准年份:2011
负责人:殷飞
学科分类:F0605
资助金额:59.00
项目类别:面上项目
4

基于弱监督学习的中文古籍识别方法研究

批准号:61573355
批准年份:2015
负责人:殷飞
学科分类:F0605
资助金额:67.00
项目类别:面上项目