基于公式的数学搜索引擎的研究与开发

基本信息
批准号:60903102
项目类别:青年科学基金项目
资助金额:17.00
负责人:苏伟
学科分类:
依托单位:兰州大学
批准年份:2009
结题年份:2012
起止时间:2010-01-01 - 2012-12-31
项目状态: 已结题
项目参与者:PaulS·Wang,邹霄,蔡川,赵晨阳,常宝方,景珂,张婷
关键词:
PageRank算法。相关度数学搜索引擎数学公式索引数学公式查询语言
结项摘要

本项目主要研究以数学公式为基础的信息检索方法,构建一个数学搜索引擎系统MathSearch,实现在WWW上对含有数学公式、数学符号及数学相关内容的网页、文档、资料的搜索。本项目具体包含:1. 数学搜索数据源的界定及表达方式之间的转换研究; 2. 公式输入方法和用户界面的建立与研究; 3. 数学公式查询语言规范的建立与研究; 4. 数学公式索引的建立与研究; 5. 数学搜索系统性能与质量的研究; 6.搜索结果排序及显示研究。总体而言,数学搜索引擎MathSearch拟对数学公式进行细粒度搜索,该方法比通用文本搜索引擎系统在数学内容搜索上具有更强的功能和更高的效率。本项目还拟将细粒度的数学搜索与计算机代数系统( CAS)相结合,并建立高效的数学公式查询语言,对数学公式建立更为行之有效的索引,来实现基于公式的数学搜索。

项目摘要

本项目主要研究在Internet上搜索数学公式、数学符号及数学相关内容的实现方法,构建了一个搜索引擎系统MathSearch,能够实现对含有数学公式的网页、文档、资料进行搜索。有效地为学习、工作与科研建立了更加便利的服务环境,提供了更加有力的帮助。.本项目主要完成了以下5个方面的工作:(1)Web数学公式提取方法的研究;本课题对网页中的数学公式提取进行了探索,实现了网页中MathML、LaTex、Infix、OpenMath、OMML等格式的数学公式识别和提取,提出了基于特征和启发式规则的公式识别和提取方法,实验表明该方法对MathML提取的准确率可达99.28%。(2)数学公式格式转换研究;本课题研究了各种数学公式描述语言的语法特征,建立了一个通用的数学公式转换架构;分析了MathML Presentation到MathML Content转换的关键问题,提出了一种基于类型系统的公式歧义解决方法;针对几种常见数学格式的转换,给出并实现了具体转换算法和实现步骤,建立了一个数学公式格式转换Web Service。(3)数学公式查询语言的建立与研究;本课题研究实现了一种数学公式查询语言---MQL,提出来了具体的语言解析与实现方案。MQL可以实现基本查询、语义查询、通配符查询和组合查询,MQL具有语法简洁清晰等优点。(4)数学公式索引的建立与研究;本课题提出了一种抽象树与倒排表结合的索引方法。索引建立时首先进行规范化预处理,利用CAS系统对预处理结果进行计算,最后对公式的标准形式及其计算结果进行索引。该方法能够解决等价公式等问题,提高了系统的智能性;(5)数学搜索排序算法研究。本课题提出了一个基于数学公式相关度的新排序算法,提出了子公式权重计算方法,该算法能够有效的提高查询结果排序效果。.本课题发表学术论文11篇,投稿论文2篇,参加学术会议9次,培养毕业博士生5名、硕士生8名、本科生5名,构建了课题网站MathSearch,完成了数学公式格式转换Web Service,制定了查询语言规范MQL,提交软件著作权申请3个,指导完成“君政基金”、国家大学生创新性实验计划、甘肃省大学生创业计划等项目。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
4

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

DOI:10.11999/JEIT210095
发表时间:2021
5

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022

苏伟的其他基金

批准号:31371231
批准年份:2013
资助金额:85.00
项目类别:面上项目
批准号:41371327
批准年份:2013
资助金额:75.00
项目类别:面上项目
批准号:31860441
批准年份:2018
资助金额:40.00
项目类别:地区科学基金项目
批准号:30860078
批准年份:2008
资助金额:23.00
项目类别:地区科学基金项目
批准号:61803024
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:40801128
批准年份:2008
资助金额:19.00
项目类别:青年科学基金项目
批准号:40874042
批准年份:2008
资助金额:30.00
项目类别:面上项目
批准号:51764017
批准年份:2017
资助金额:38.00
项目类别:地区科学基金项目
批准号:60903150
批准年份:2009
资助金额:19.00
项目类别:青年科学基金项目
批准号:21901059
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:31671263
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:41671433
批准年份:2016
资助金额:65.00
项目类别:面上项目
批准号:21707007
批准年份:2017
资助金额:24.00
项目类别:青年科学基金项目

相似国自然基金

1

引入模糊逻辑的数学公式结构分析与理解研究

批准号:60772073
批准年份:2007
负责人:田学东
学科分类:F0116
资助金额:8.00
项目类别:面上项目
2

数学公式的全景式检索技术研究

批准号:61876003
批准年份:2018
负责人:汤帜
学科分类:F0605
资助金额:64.00
项目类别:面上项目
3

面向PDF文档的数学公式搜索技术研究

批准号:61472014
批准年份:2014
负责人:汤帜
学科分类:F0211
资助金额:80.00
项目类别:面上项目
4

Fox-Wright函数求和公式与变换公式的研究

批准号:11661032
批准年份:2016
负责人:魏传安
学科分类:A0408
资助金额:38.00
项目类别:地区科学基金项目