The current Web search technology is partially solved the discovery problem of vast information resources, and the recall and precision of information can not meet the needs of users. According to the feature of vertical search engine in the Web environment, and using the rich semantic resources in Wikipedia, we will optimize the information retrieval process by combining the traditional information retrieval technology with semantic Web technologies. Include: proposing semantic representation method of knowledge units, mining the structured semantic relations in Wiki, constructing semantic relation matrix of concepts; proposing the relevance measure means of Web pages' Crawer topics,building dynamic themes semantic dictionary, proposing the automatic query classification algorithm of vertical search engine; constructing 3-layer index model by parsing semantic information on different granularity for the document indexing of semantic data format; enhancing ontolgy the ability to express fuzzy concept by extending Description Logic on fuzziness, discussing satisfaction reasoning algorithm on fuzzy Tableaux.This study will have important practical values for exploring the intelligent search engine.
目前的Web搜索技术只是部分地解决海量信息资源的发现问题,信息的查全率和精确度仍然不能满足用户的需求。本项目针对当前的万维网环境下垂直搜索引擎的特点,利用维基百科丰富的语义资源,将传统信息检索技术与语义Web技术相结合,优化信息检索过程。具体内容包括:提出知识单元的语义表示方法,挖掘Wiki丰富的结构化语义关系,构建概念间的语义关联矩阵;给出主题爬虫的网页主题相关性度量方法,构建动态主题语义词典,提出垂直搜索引擎的查询自动分类算法;针对具有语义数据格式的文档索引,对语义信息进行不同粒度的解析,建立语义三层索引模型;提出语义搜索模型及其结构框架,对描述逻辑进行模糊扩展,以增加本体描述语言的模糊概念表达能力,探讨基于模糊Tableaux的可满足性推理算法。本项目的研究对探索实现智能搜索引擎具有重要的实际应用价值。
目前的Web搜索技术只是部分地解决海量信息资源的发现问题,信息的查全率和精确度仍然不能满足用户的需求。本项目针对当前的万维网环境下垂直搜索引擎的特点,利用维基百科丰富的语义资源,将传统信息检索技术与语义Web技术相结合,优化信息检索过程。研究取得了以下成果:.1)提出了基于Wiki的语义相似度计算方法WLA,挖掘Wiki丰富的结构化语义关系,构建概念间的语义关联矩阵,基于网页主题相关性度量方法,构建了动态主题语义词典;.2)提出了垂直搜索引擎的查询自动分类算法Bagging_BSJ,该算法集成了三种基分类器,提高了查询的准确率和召回率;.3)针对具有语义数据格式的文档索引,根据索引对象特征对语义信息进行不同粒度的解析,建立语义三层索引模型来满足用户的多种查询需求;.4)建立了语义搜索模型并开发了原型系统,提出基于用户查询意图的主题搜索排序算法,对描述逻辑进行模糊扩展,以增加本体描述语言的模糊概念表达能力。实验测试了多个数据集上前50条命中记录的查准率和查全率,我们系统的查准率不低于86%,查全率不低于80%,响应时间小于1秒。.总之,本项目的研究对探索实现智能搜索引擎具有重要的实际应用价值,达到了预期的目标,取得了一系列科研成果,其中SCI检索论文1篇,5篇EI检索论文,2篇国际会议论文(EI检索周期中),软件著作权2项,申请专利1项,培养了6名硕士研究生。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
滚动直线导轨副静刚度试验装置设计
中外学术论文与期刊的宏观差距分析及改进建议
环境信息披露会影响分析师盈余预测吗?
基于关系对齐的汉语虚词抽象语义表示与分析
面向Wiki的多维动态语义计算模型及关键技术研究
基于语义Web的实体关联搜索方法与技术研究
基于可信语义Wiki的知识库构建方法与应用研究
基于新型检索模型和查询语义分类的搜索技术研究