随着语义Web的发展,语义Web数据正在不断增长。语义Web的链接结构分析不仅对于理解语义Web的宏观结构具有重要意义,而且对于语义Web数据的搜索和数据管理具有指导作用。传统的Web链接分析已经取得了很大的成功,而语义Web的链接结构分析仍处于初始阶段。本项目研究语义Web文档的链接模型及结构分析、语义Web实体的链接模型及结构分析、语义Web复杂网络模型、语义Web链接结构分析的支撑技术。本项目力图在语义Web文档的链接模型、语义Web实体的链接模型、语义Web复杂网络模型以及大规模语义Web数据的结构分析方法等方面有所创新。这些面向语义Web链接结构分析的新模型、方法和技术对于语义Web的发展具有重要作用。
项目组就语义Web中对象链接图模型及分析、语义Web中对象共指发现、本体相关性的宏观结构分析、本体相关性度量方法、面向本体搜索的结构分析方法等进行深入研究,主要研究成果如下:. 我们提出语义Web中对象链接图(OLG)这一新概念,以Falcons搜索系统收集的一个大规模数据集作为样例,分析OLG的复杂网络结构,实验表明OLG有无标度特性,且其有效直径较小。这个结论在另一个数据集上得到了验证。这个结论对于理解语义Web的宏观结构具有重要意义,且对于语义Web的搜索具有指导作用。. 我们发现语义Web上URI共指现象比较普遍,而机器学习是发现URI共指的一个重要途径。但是,构建理想的训练集比较困难。为此,我们提出一种自训练的方法来发现语义Web中的对象共指,并实现了一个可伸缩的系统,在基准测试集和大规模数据集上的实验都展示出较高的准确度和召回率。. 我们开展了本体相关性的宏观结构分析。对于收集到的4千多个本体,我们实施了大规模的成对匹配,在本体中的术语(类和属性)间创建了大约3百万个映射,然后以术语为顶点、映射为边构建出一个复杂的术语映射图,并根据术语映射图导出本体映射图。这些映射及分析结果有助于开发者更好地创建、集成和维护本体。. 对于本体搜索和本体推荐,本体之间的相关性度量是一个重要问题。现有工作主要分析它们的相似性。我们检查了更加一般的相关性概念,从四个角度加以刻画:良好定义的语义相关性、内容上的词法相关性、表达上的亲密性以及分布相关性。我们在一个真实的大数据集对这些度量进行实证研究。基于上述研究,我们实现了一个推荐服务,基于手工构造的黄金标准验证了它的有效性。. 本体排序及摘要对于本体搜索系统来说十分重要,我们分析了本体之间的引用结构以及本体内部的基于RDF句子的链接结构,以此来研究其结构上的重要性。特别地,我们提出了多个结构模型,以完善本体摘要方法。有关方法在Falcons本体搜索系统中得到了实现,实验结果表明,我们的本体排序方法与本体摘要具有明显的效果。. 总的来说,本项目的研究达到了预期的目标。项目组共发表学术论文12篇,其中,3篇发表在SCI源期刊上,4篇发表在国际万维网会议和国际语义Web会议等本领域顶级学术会议上。项目组研发的语义Web本体搜索系统在本领域具有较强的国际影响力。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
玉米叶向值的全基因组关联分析
跨社交网络用户对齐技术综述
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于大众参与的语义Web实体链接方法研究
语义Web浏览方法与技术的研究
语义Web本体的搜索方法与技术
融合链接结构与语义信息的异构网络分析