The amount of graph-structured RDF data describing entities and associations between them rises continuously on the Semantic Web. An increasingly strong information need over graph-structured data is to search for associations between entities. However, existing research and systems are weak in the representation, search, and organization of entity associations. In light of this, this project studies methods and techniques for entity association search on the Semantic Web. It mainly studies representation and discovery of semantic associations between entities, searching of semantic associations, mining of semantic association patterns, fusion of semantic associations, etc. It aims to produce novel techniques for searching semantically labelled graphs, mining semantically labelled graph patterns, presenting and interacting with graph-structured data, as well as semantic data fusion in the context of entity association search. Through research on these models, methods, and techniques, it is expected to promote the development of Semantic Web, information retrieval, graph mining, data fusion, and related research fields, to facilitate and direct the research and development of entity association search engines, and to improve information services provided by the Semantic Web.
语义Web上描述实体及其关联的RDF图数据正在不断增长,面向图数据搜索实体之间关联的需求愈发强烈。然而,现有研究及系统在实体关联的表达能力、搜索性能和结果组织等方面均不能令人满意。为此,本项目开展语义Web上实体关联搜索方法与技术的研究,主要研究实体间语义关联的表示与发现、语义关联的搜索、语义关联模式的挖掘、语义关联的融合等内容。项目力图提出语义关联的表示模型,创造出新型的实体语义关联搜索方法,并在带语义标签的图搜索、带语义标签的图模式挖掘、图数据的组织呈现与用户交互、实体关联搜索环境下的语义数据融合等关键技术方面有所创新。通过这些模型、方法与技术的研究,推动语义Web以及信息检索、图挖掘、数据融合等相关领域研究的发展,促进和指导实体关联搜索引擎的研发,提升语义Web的信息服务水平。
语义网的发展催生了大量的图结构的RDF数据,为实现更加有效的实体关联搜索提供了可能。针对现有研究的局限性,本项目围绕实体语义关联的表示与发现、搜索、模式挖掘、融合等问题开展研究,形成了一系列具有创新性的技术成果。..在语义关联表示与发现方面,项目组提出了两种语义关联表示模型,提出了一种基于距离剪枝的语义关联发现算法,并应用于新闻浏览领域。在语义关联搜索方面,项目组提出了多种基于语义映射和激活传播的关键词查询解释方法,提出了基于语义连贯性、数据覆盖性和查询覆盖性的语义关联排序算法,并构建了实验评价体系,提出了基于LDA生成实体摘要的语义关联组织呈现方法,构建了标准测试集并对相关问题进行了综述分析。在语义关联模式挖掘方面,提出了一种通用高效的层次化挖掘方法,提出了一种高频率低冗余语义关联模式的排序选取方法,提出了基于语义关联模式的交互迭代式导航方法和实体搜索方法。在语义关联融合方面,提出了三种实体相似性度量方法和一种基于嵌入的跨语言实体匹配方法,提出了一种基于神经网络模型的实体属性匹配方法,提出了一种复杂事件实体关联融合方法并应用于机器阅读理解任务。..项目发表论文26篇,其中期刊论文6篇、会议论文20篇,CCF推荐国际会议或期刊论文A类4篇、B类8篇、C类3篇,SCI收录5篇、EI收录22篇,其中1篇论文获CCF-B类国际会议COLING最佳论文提名奖,体现了一定的学术价值。项目申请国家发明专利1项、登记计算机软件著作权2项,实现了语义关联搜索系统MEAST和MiCRon、语义关联排序系统IlluSnip、语义关联模式挖掘系统HIEDS、基于语义关联模式的交互式搜索系统RelSUE等原型系统,具有一定的应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
内质网应激在抗肿瘤治疗中的作用及研究进展
基于关系对齐的汉语虚词抽象语义表示与分析
基于语义分析的评价对象-情感词对抽取
融合语义信息的汉老双语句子对其方法
语义Web本体的搜索方法与技术
基于大众参与的语义Web实体链接方法研究
面向语义Web的探索式搜索方法研究
时空专题语义Web建设方法与技术研究