With the explosive growth of geospatial data in web environments, how to find and share them which user are desired more accurately and intelligently across the web is an urgent issue to be solved at present in geography information (GI) sharing domain. The key for resolving this problem is to establish semantic association among datasets and the difficult part is how to discover the semantics of these datasets automatically and realize automatic link. With respect to the problems mentioned above, this study uses metadata as corpus and takes advantage of frontier theory of linked data to carry out a research on methodology of geospatial data semantic association. We focus on the following aspects: (1)geospatial data hierarchical semantic expression model oriented to linked data, (2)metadata- based methodology of automatic semantics discovery, (3)methodology of geospatial data semantic reasoning and automatic correlation. All the research achievements will be applied on Data Sharing Platform of Earth System Science, one of National Science and Technology Infrastructure, to validate and evaluate the key technologies proposed in this study. Through this research, it aims to provide feasible techniques for linked geospatial data network construction, then promote the integration and then value-added exploitation of geospatial data. It can also provide a reference to linked data practices in other fields.
网络环境下地理空间数据急骤增长,如何精确发现用户需要的地理空间数据,并把相关的地理空间数据智能推荐给用户,是当前地理信息共享急迫需要解决的问题。解决这一问题的关键是建立数据间的语义关联,难点是如何自动抽取数据的语义并实现自动关联。针对这一问题,本项目以元数据为语料,利用"关联数据"前沿理论方法,开展地理空间数据语义关联方法的研究,重点包括:面向关联数据的地理空间数据分层语义表达模型,基于元数据的语义自动抽取方法,地理空间数据语义推理及自动关联方法研究。最终在国家科技基础条件平台-地球系统科学数据共享平台中进行应用实践,对项目关键技术方法进行验证评价。通过本项目研究,为地理空间关联数据网络的构建提供可行的技术方法,推动地理空间数据的集成共享和增值利用,并为其他领域关联数据的实践提供借鉴。
关联数据旨在通过明确的语义表达,利用机器可读的方式描述数据及其相互关系,建立多源异构数据间的相互链接,从而构建一个语义丰富的、相互连通的数据网络。因其可以解决大数据背景下网络共享数据集成与发现之多源异构问题,所以它成为计算机等多个领域的研究热点。本项目聚焦在关联数据在地理学领域的研究和应用,重点突破地理空间数据语义关联构建中数据语义信息的表达和抽取,以及语义相关度的度量等理论与技术难点。项目主要研究内容包括:(1)面向关联数据的地理空间数据语义表达模型研究;(2)基于元数据的地理空间数据语义抽取方法研究;(3)基于语义推理的地理空间数据关联方法研究;(4)地理空间数据关联化应用评价。取得的主要成果:(1)以地理空间数据特征为出发点,提出并构建了由通用基础本体和领域支撑本体为主要内容的地学数据本体。其中,通用基础本体包含地学数据空间本体、时间本体、形态本体和来源本体;(2)提出由主题、类别、空间拓扑、时间拓扑、空间精度、时间粒度、数据类型和数据格式构成的地理空间数据关联指标体系,并研究其相似度计算方法,形成了由RDF生成、特征抽取与标准化、相似度计算和关联数据可视化四步构成的多维定量数据关联方法;(3)研发了基于地学数据本体或关联数据的地理空间数据检索系统,开展了地理空间数据语义检索、多维定量空间数据关联、多源数据集成建库等应用评价。应用结果表明,本项目的地学数据本体,能够为地理空间数据提供明确的、机器可读的形式化描述,通过基于本体的语义抽取和标注,可实现基于语义推理的数据精准发现和智能推荐,有效提升了数据发现的查全率和查准率;本项目的多维定量数据关联方法能够实现数据间相关度的定量化描述,建立数据间的语义关联网络。总之,本项目为基于元数据语义的地理空间数据关联网络构建提供了切实可行的理论与方法。项目共发表期刊论文11篇,其中4篇为SCI论文,7篇为中文核心期刊论文,发表会议论文3篇,出版2部学术专著,申请1项专利和4项软件著作权,培养11名研究生。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
跨社交网络用户对齐技术综述
农超对接模式中利益分配问题研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
语义关联的地理视频数据自适应组织方法
基于空间-语义模式的多源地理空间数据一致性整合方法
语义辅助的多维空间数据智能集成方法
基于多重关系约束的地理空间数据自协调综合模型与方法研究