联机手写化学公式识别研究

基本信息
批准号:61301238
项目类别:青年科学基金项目
资助金额:24.00
负责人:杨巨峰
学科分类:
依托单位:南开大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:许静,姬秀娟,刘磊,常立志,籍京娜,葛恒亮,封磊,任雪雪
关键词:
化学公式识别手写识别结构模式分析
结项摘要

Chemical formulas and expressions are an essential means of communicating information and structure in domain of chemistry. Despite the ubiquity of formulas, there is still a large gap between how people naturally interact with formulas and how computers understand them today. Our goal is to develop an intelligent formulas understanding system that provides a more natural way to specify chemical structures to a computer. In our research, we will study a new recognition framework and apply it to online handwritten chemical formulas. The framework combines a hierarchy of visual features into a joint model using a discriminatively trained conditional random field. This joint model of appearance makes our framework less sensitive to noise and drawing variations, improving accuracy and robustness. The key research contributions of this research are: 1)A symbol recognition architecture that combines vision-based features at multiple levels of detail. 2) A discriminatively trained graphical model that unifies the predictions at each level and captures the relationships between symbols. 3) An energy function denoting the recognition results of chemical formulas which may typically avoid subjectivity and improve acurrency. 4) A real-time formulas recognition interface that will be evaluated by intended end-users and compared against the most popular existing technique for chemical formulas authoring.

作为一种通用的国际科学语言,化学公式应用广泛。但到目前为止,如何快速准确地识别联机输入的化学公式还是一个难题。本研究设计一种针对联机手写化学公式的自动识别、分析和理解体系。从优化求解角度考虑联机手写化学公式识别问题,选用SIFT、SURF等特征,结合传统的局部特征和全局特征,从多个角度反映化学公式的本质特性。利用多级CRF模型进行问题建模,使得识别结果能体现不同层次的公式特征。充分利用化学规则和规律辅助公式的理解过程,提出化学公式版面结构分析的算法,利用空间位置信息、时序信息和化学领域专有知识实现对化学公式的自动处理,同时解决各种书写异常问题。最终构建一个涵盖无机和有机化学领域的联机手写公式识别系统。

项目摘要

该项目以基于深度学习技术的计算机视觉及图像处理为研究方向,以联机手写化学符号和公式的自动识别为具体研究问题,针对卷积神经网络结构、局部特征、时序特征及深度特征的融合等问题进行了比较深入和细致的探索。主要研究内容及成果包括:1)提出了一种基于支持向量机和隐马尔科夫模型的联机手写化学符号识别算法,该算法可在较短时间内自动识别出102种无机和有机化学符号(含10种阿拉伯数字、24种大写英文字母、20种小写英文字母、10种化学操作符以及38种有机化学符号),进而利用深度学习框架及多层深度特征识别上述符号,准确率达到了90%以上。2)针对目前在计算机视觉和图像处理领域广泛使用的深度学习框架展开研究,力图优化学习过程,提取出更有表示性的特征。提出基于先验信息的图像前景分割算法,改进了GrabCut的分割结果并有助于提升图像兴趣区域的定位精度。提出了一种基于卷积神经网络的全局和局部信息融合方案,利用迁移学习技术在一个通用分类网络中定位和抽取有价值的局部信息。提出了一种增广式二值化条件概率神经网络,利用标签分布学习技术预测单标签类别,提升了预测的准确率。3)基于上述研究成果,进一步将符号及公式的识别引擎应用于多种化学场景,研究了面向自然人机交互的笔手势识别算法,对于Rubine和$1算法进行了重抽样和象限筛选的改进,提高了笔手势识别准确率。基于笔式人机交互方式设计并实现了一套化学实验演示系统。首先从用户手写输入的数字墨水中提取笔迹特征,然后分类识别不同的化学仪器和物质,最后理解用户的手势意图,完整辨识出反应物和反应条件。根据预先存储的字典,查找对应的化学反应式,在交互界面中予以呈现。基于上述研究申请国家发明专利1项,发表英文学术论文6篇,在投论文4篇。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
3

基于一维TiO2纳米管阵列薄膜的β伏特效应研究

基于一维TiO2纳米管阵列薄膜的β伏特效应研究

DOI:10.7498/aps.67.20171903
发表时间:2018
4

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
5

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021

杨巨峰的其他基金

批准号:61876094
批准年份:2018
资助金额:64.00
项目类别:面上项目
批准号:U1933114
批准年份:2019
资助金额:36.00
项目类别:联合基金项目

相似国自然基金

1

联机行草手写汉字识别的方法研究

批准号:69885006
批准年份:1998
负责人:刘迎建
学科分类:F0605
资助金额:13.00
项目类别:专项基金项目
2

联机手写蒙文字识别的研究

批准号:60365001
批准年份:2003
负责人:高光来
学科分类:F0605
资助金额:18.00
项目类别:地区科学基金项目
3

联机行书手写汉字识别的方法与应用

批准号:69575020
批准年份:1995
负责人:刘迎建
学科分类:F0605
资助金额:32.00
项目类别:面上项目
4

联机手写新疆维吾尔文字符识别研究

批准号:60863009
批准年份:2008
负责人:哈力木拉提·买买提
学科分类:F0211
资助金额:22.00
项目类别:地区科学基金项目