中文网络文本的地理实体语义关系标注与评价

基本信息
批准号:41801320
项目类别:青年科学基金项目
资助金额:23.40
负责人:余丽
学科分类:
依托单位:北京理工大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:付常雷,李涵昱,庞娜,邱韵霏,徐红霞
关键词:
语料标注体系地理信息抽取语义关系标注机器学习质量评价
结项摘要

Web texts contain mass of geo-semantic information, which provide opportunity for geographic knowledge services. Besides, the semantic relation corpus of geo-entities is an indispensable resource for geo-semantic understanding. For the web texts with a lot of noises, building a semantic relation corpus of geo-entities effectively and efficiently becomes a big challenging research question for geographic information science. By combining geographic information science and computational linguistics, this project focuses on building and evaluating a semantic relation corpus of geo-entities with Chinese web texts. In particular, the research content is composed of three parts, including the annotation schema, intelligent annotation algorithm and automatic assessment method of the semantic relation corpus of geo-entities. This project aims to theoretically and methodologically improve building semantic relation corpus of geo-entities with Chinese web texts, and break the limitation of traditional GIS on geo-semantic understanding for web texts with noises, as well as achieve the original innovation of corpus automatic assessing, so as to promote the capability of geographic knowledge services.

网络文本蕴含大量的地理语义信息,为地理知识服务提供了巨大潜能。地理实体语义关系语料库是实现地理语义理解的先决条件。针对多噪声的网络文本,快速构建高质量的地理实体语义关系语料库,对地理信息科学的理论与方法提出了严峻挑战。本项目以中文网络文本的地理实体语义关系语料库构建与评价为主题,通过地理信息科学与计算语言学的学科交叉,开展地理实体语义关系的标注体系、智能化构建方法、自动质量评价的研究,完善中文网络文本的地理实体语义关系语料库构建的理论方法体系,突破传统GIS理论与方法无法快速处理网络噪声文本蕴含地理语义理解的局限,实现定量与定性相结合的语料库自动评价方法的原始创新,增强地理信息语义理解能力。

项目摘要

地理实体语义关系是地理信息的重要组成部分,是支撑地理知识服务的关键数据,可形成以位置为关联的地理语义网络,帮助地理知识的传播、交流与共享。本项目围绕“地理实体语义关系的标注体系”“地理实体语义的评价体系”“标注语料库的构建方法”“标注语料库的质量评价方法”等关键基础问题开展了体系化研究,设计了经典语义关系与空间关系兼顾的标注准则,提出了实体语义标注的系列优化方法,为语料匮乏情况下的监督机器学习模型训练提供了一种有效的解决思路。按照既定的研究计划,本项目圆满完成了既定的研究内容,并进行了扩展应用。在项目资助下,发表学术论文9篇,申请国家发明专利1项,支撑研发平台2个,培养研究生3名,参加国际学术会议6人次。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015
4

肉苁蓉种子质量评价及药材初加工研究

肉苁蓉种子质量评价及药材初加工研究

DOI:10.11842/wst.2017.02.019
发表时间:2017
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

余丽的其他基金

批准号:41601203
批准年份:2016
资助金额:22.00
项目类别:青年科学基金项目

相似国自然基金

1

基于复杂网络的中文文本语义相似度研究

批准号:71373200
批准年份:2013
负责人:刘怀亮
学科分类:G0414
资助金额:56.00
项目类别:面上项目
2

基于语义的中文文本聚类研究

批准号:60772081
批准年份:2007
负责人:施水才
学科分类:F0113
资助金额:30.00
项目类别:面上项目
3

社交媒体中文本情感语义计算理论和方法

批准号:61632011
批准年份:2016
负责人:秦兵
学科分类:F0211
资助金额:265.00
项目类别:重点项目
4

中文句法分析与语义角色标注的联合学习机制研究

批准号:60970056
批准年份:2009
负责人:朱巧明
学科分类:F0211
资助金额:32.00
项目类别:面上项目