基于Wiki的垂直搜索语义技术研究

基本信息
批准号:61202169
项目类别:青年科学基金项目
资助金额:22.00
负责人:赵德新
学科分类:
依托单位:天津理工大学
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:张德干,李文杰,韩盛磊,佟丽,张美珍,魏军,何锦群
关键词:
维基百科垂直搜索信息检索语义Web
结项摘要

The current Web search technology is partially solved the discovery problem of vast information resources, and the recall and precision of information can not meet the needs of users. According to the feature of vertical search engine in the Web environment, and using the rich semantic resources in Wikipedia, we will optimize the information retrieval process by combining the traditional information retrieval technology with semantic Web technologies. Include: proposing semantic representation method of knowledge units, mining the structured semantic relations in Wiki, constructing semantic relation matrix of concepts; proposing the relevance measure means of Web pages' Crawer topics,building dynamic themes semantic dictionary, proposing the automatic query classification algorithm of vertical search engine; constructing 3-layer index model by parsing semantic information on different granularity for the document indexing of semantic data format; enhancing ontolgy the ability to express fuzzy concept by extending Description Logic on fuzziness, discussing satisfaction reasoning algorithm on fuzzy Tableaux.This study will have important practical values for exploring the intelligent search engine.

目前的Web搜索技术只是部分地解决海量信息资源的发现问题,信息的查全率和精确度仍然不能满足用户的需求。本项目针对当前的万维网环境下垂直搜索引擎的特点,利用维基百科丰富的语义资源,将传统信息检索技术与语义Web技术相结合,优化信息检索过程。具体内容包括:提出知识单元的语义表示方法,挖掘Wiki丰富的结构化语义关系,构建概念间的语义关联矩阵;给出主题爬虫的网页主题相关性度量方法,构建动态主题语义词典,提出垂直搜索引擎的查询自动分类算法;针对具有语义数据格式的文档索引,对语义信息进行不同粒度的解析,建立语义三层索引模型;提出语义搜索模型及其结构框架,对描述逻辑进行模糊扩展,以增加本体描述语言的模糊概念表达能力,探讨基于模糊Tableaux的可满足性推理算法。本项目的研究对探索实现智能搜索引擎具有重要的实际应用价值。

项目摘要

目前的Web搜索技术只是部分地解决海量信息资源的发现问题,信息的查全率和精确度仍然不能满足用户的需求。本项目针对当前的万维网环境下垂直搜索引擎的特点,利用维基百科丰富的语义资源,将传统信息检索技术与语义Web技术相结合,优化信息检索过程。研究取得了以下成果:.1)提出了基于Wiki的语义相似度计算方法WLA,挖掘Wiki丰富的结构化语义关系,构建概念间的语义关联矩阵,基于网页主题相关性度量方法,构建了动态主题语义词典;.2)提出了垂直搜索引擎的查询自动分类算法Bagging_BSJ,该算法集成了三种基分类器,提高了查询的准确率和召回率;.3)针对具有语义数据格式的文档索引,根据索引对象特征对语义信息进行不同粒度的解析,建立语义三层索引模型来满足用户的多种查询需求;.4)建立了语义搜索模型并开发了原型系统,提出基于用户查询意图的主题搜索排序算法,对描述逻辑进行模糊扩展,以增加本体描述语言的模糊概念表达能力。实验测试了多个数据集上前50条命中记录的查准率和查全率,我们系统的查准率不低于86%,查全率不低于80%,响应时间小于1秒。.总之,本项目的研究对探索实现智能搜索引擎具有重要的实际应用价值,达到了预期的目标,取得了一系列科研成果,其中SCI检索论文1篇,5篇EI检索论文,2篇国际会议论文(EI检索周期中),软件著作权2项,申请专利1项,培养了6名硕士研究生。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
2

滚动直线导轨副静刚度试验装置设计

滚动直线导轨副静刚度试验装置设计

DOI:
发表时间:2017
3

中外学术论文与期刊的宏观差距分析及改进建议

中外学术论文与期刊的宏观差距分析及改进建议

DOI:
发表时间:2021
4

环境信息披露会影响分析师盈余预测吗?

环境信息披露会影响分析师盈余预测吗?

DOI:
发表时间:2017
5

基于关系对齐的汉语虚词抽象语义表示与分析

基于关系对齐的汉语虚词抽象语义表示与分析

DOI:
发表时间:2020

赵德新的其他基金

相似国自然基金

1

面向Wiki的多维动态语义计算模型及关键技术研究

批准号:61070202
批准年份:2010
负责人:冯志勇
学科分类:F0207
资助金额:32.00
项目类别:面上项目
2

基于语义Web的实体关联搜索方法与技术研究

批准号:61572247
批准年份:2015
负责人:程龚
学科分类:F0202
资助金额:65.00
项目类别:面上项目
3

基于可信语义Wiki的知识库构建方法与应用研究

批准号:71203173
批准年份:2012
负责人:李慧
学科分类:G0414
资助金额:18.00
项目类别:青年科学基金项目
4

基于新型检索模型和查询语义分类的搜索技术研究

批准号:60775030
批准年份:2007
负责人:孙斌
学科分类:F0305
资助金额:26.00
项目类别:面上项目