本项目主要研究以数学公式为基础的信息检索方法,构建一个数学搜索引擎系统MathSearch,实现在WWW上对含有数学公式、数学符号及数学相关内容的网页、文档、资料的搜索。本项目具体包含:1. 数学搜索数据源的界定及表达方式之间的转换研究; 2. 公式输入方法和用户界面的建立与研究; 3. 数学公式查询语言规范的建立与研究; 4. 数学公式索引的建立与研究; 5. 数学搜索系统性能与质量的研究; 6.搜索结果排序及显示研究。总体而言,数学搜索引擎MathSearch拟对数学公式进行细粒度搜索,该方法比通用文本搜索引擎系统在数学内容搜索上具有更强的功能和更高的效率。本项目还拟将细粒度的数学搜索与计算机代数系统( CAS)相结合,并建立高效的数学公式查询语言,对数学公式建立更为行之有效的索引,来实现基于公式的数学搜索。
本项目主要研究在Internet上搜索数学公式、数学符号及数学相关内容的实现方法,构建了一个搜索引擎系统MathSearch,能够实现对含有数学公式的网页、文档、资料进行搜索。有效地为学习、工作与科研建立了更加便利的服务环境,提供了更加有力的帮助。.本项目主要完成了以下5个方面的工作:(1)Web数学公式提取方法的研究;本课题对网页中的数学公式提取进行了探索,实现了网页中MathML、LaTex、Infix、OpenMath、OMML等格式的数学公式识别和提取,提出了基于特征和启发式规则的公式识别和提取方法,实验表明该方法对MathML提取的准确率可达99.28%。(2)数学公式格式转换研究;本课题研究了各种数学公式描述语言的语法特征,建立了一个通用的数学公式转换架构;分析了MathML Presentation到MathML Content转换的关键问题,提出了一种基于类型系统的公式歧义解决方法;针对几种常见数学格式的转换,给出并实现了具体转换算法和实现步骤,建立了一个数学公式格式转换Web Service。(3)数学公式查询语言的建立与研究;本课题研究实现了一种数学公式查询语言---MQL,提出来了具体的语言解析与实现方案。MQL可以实现基本查询、语义查询、通配符查询和组合查询,MQL具有语法简洁清晰等优点。(4)数学公式索引的建立与研究;本课题提出了一种抽象树与倒排表结合的索引方法。索引建立时首先进行规范化预处理,利用CAS系统对预处理结果进行计算,最后对公式的标准形式及其计算结果进行索引。该方法能够解决等价公式等问题,提高了系统的智能性;(5)数学搜索排序算法研究。本课题提出了一个基于数学公式相关度的新排序算法,提出了子公式权重计算方法,该算法能够有效的提高查询结果排序效果。.本课题发表学术论文11篇,投稿论文2篇,参加学术会议9次,培养毕业博士生5名、硕士生8名、本科生5名,构建了课题网站MathSearch,完成了数学公式格式转换Web Service,制定了查询语言规范MQL,提交软件著作权申请3个,指导完成“君政基金”、国家大学生创新性实验计划、甘肃省大学生创业计划等项目。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
基于SSVEP 直接脑控机器人方向和速度研究
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
引入模糊逻辑的数学公式结构分析与理解研究
数学公式的全景式检索技术研究
面向PDF文档的数学公式搜索技术研究
Fox-Wright函数求和公式与变换公式的研究