Web texts contain a great amount of geo-related information, which provides advantageous conditions for geographic knowledge acquisition and geographic knowledge services. However, how to understand web texts from a perspective of spatial cognition, as well as to integrate them into the spatial computational model traditionally focusing on measurable geometric data, becomes a big challenging research question for geographic information science in new geographic information era. By interdisciplinary researches combining geographic information science and computational linguistics, this project focuses on geographic information understanding and knowledge graph building with web texts. In particular, its research content is mainly divided into four parts, including quantity and quality assessment of implied geographic information in web texts, semantic understanding and spatial computational model for vague geographic information, heterogeneous geographical semantic web alignment and large-scale geographical knowledge graph building. This project aims to theoretically and methodologically improve dynamic geographic information extraction and knowledge fusion from web texts, and break the bottleneck of traditional GIS on representing and processing vague geographic information. A geographic knowledge graph search engine prototype will be technologically developed to promote the capability of geographic information and knowledge services for professional applications, as well as to help both of geographers, social governors and public to better understand geographical environment and share geographical value.
网络文本蕴含大量隐式地理空间信息,为地理知识获取与知识服务提供了巨大潜能。如何从空间认知的视角理解网络文本,并将其纳入传统上以可量测几何数据为对象的空间计算模型中,是地理信息科学在新地理信息时代面临的挑战。本项目以网络文本蕴含地理信息理解与知识图构建为主题,通过地理信息科学与计算语言学的学科交叉,开展网络文本蕴含地理空间信息量与质量评估、模糊地理信息语义理解、文本描述地理信息空间计算模型、异构地理语义网对齐与大规模地理知识图构建方法等研究,完善网络文本蕴含地理信息实时抽取与知识融合的理论方法体系,突破传统地理信息系统无法表达与处理网络文本描述模糊地理信息的瓶颈,实现泛在地理信息集成与质量评估方面的原始创新,并构建地理知识图搜索引擎原型,增强地理信息与知识服务能力,帮助地学研究者、社会治理者、社会公众更好地认识地理环境、分享地理价值。
如何从空间认知的视角理解网络文本,产生地理空间相关知识,是地理信息科学面临的挑战。本项目围绕网络文本描述地理信息语义理解与计算、地理语义网对齐与地理知识图谱构建等关键科学问题与技术瓶颈,研究了网络文本蕴含地理信息标注规范与标注语料库构建技术,发展了多源数据融合的地名数据库构建方法;研究了顾及上下文语境的网络文本蕴含地理信息质量评估方法,实现了网络文本蕴含地理信息相关性、新颖性和可靠性评价;基于深度学习模型、通用知识库和语境增强方法,发展了网络文本蕴含地理实体识别与语义消歧、空间与语义关系抽取、开放关系过滤、事件信息抽取技术;提出了基于几何代数的地理对象语义表达与解析方法、基于知识图谱与语境相结合的网络文本描述地理信息空间范围推断方法;提出了异构地理语义网整体对齐框架,及其基于词嵌入增强与空间映射变换的地理实体对齐方法;提出了地理知识形式化描述框架和表示模型,发展了地理知识自动生成与地理知识图谱嵌入表达方法;建立了基于网络开放资源、领域本体模型与迁移学习的行业知识图谱。.项目首次提出了网络文本蕴含地理信息质量评估技术流程;通过时空数据挖掘、机器学习和几何代数方法相结合,提高了网络文本蕴含地理信息获取的质量,并将定性模糊表达的网络文本蕴含地理空间位置及关系解析为精确的几何表达;实现了异构地理语义网的自动融合;首次提出了地理知识图谱的统一表达模型,发展了基于行业本体模型与机器学习模型的地理知识图谱生成与知识补全方法,并通过城市交通流空间交互分析、地名信息服务、地球系统科学数据共享、旅游市场分析与目的地推荐等应用,全面展示了研究成果的应用价值。.项目研究成果完善了网络文本蕴含地理信息实时抽取与知识融合的理论方法体系,突破了传统地理信息系统无法表达与处理网络文本描述模糊地理信息的瓶颈,实现了泛在地理信息集成与质量评估方面的原始创新,增强了网络文本蕴含地理信息智能提取与地理知识服务能力。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
跨社交网络用户对齐技术综述
粗颗粒土的静止土压力系数非线性分析与计算方法
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
中国参与全球价值链的环境效应分析
矿床领域文本数据挖掘与知识图谱构建
基于浅层文本理解的社会关系网络构建研究
面向词汇功能的学术文本语义识别与知识图谱构建
中文语言文本理解