面向词汇功能的学术文本语义识别与知识图谱构建

基本信息
批准号:71473183
项目类别:面上项目
资助金额:66.00
负责人:陆伟
学科分类:
依托单位:武汉大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:孙永强,曾子明,王平,程齐凯,黄永,武川,杨海峰
关键词:
信息检索文本挖掘数字图书馆知识工程信息组织
结项摘要

Nowadays,scientists take use of scholar search engine (Google Scholar, SCI, etc.) and informatics tools to find scholar information. However, these tools and the methods behind them cannot address some basic but also important questions such as: "Is term 'Data Mining' a kind of technique the paper takes or topic the paper focus on?", "What methods were developed to solve a particular problem according to these papers?", "Who is the one proposed this research topic for the first time?", "What does the term 'state of the art' in a paper refer to?". This subject aims to develop a suit of theories, methods and tools to help scientists to find the answers of the questions listed above in a fast and convenient way. The core component of this subject is to identify the functionality of mentions in research paper. We try to build a semantic framework to define the functions of term and the relations between terms, and propose some methods to address problems such as term function identification, relation extraction, coreference resolution, concept evolution identification. Thus this subject chooses some research domain to build a functionality oriented scientific research knowledge graph. This subject is of significant academic and practical value. The methods and knowledge graph can be used to improve the performace of scholar search engine and enhance the semantic leve of academic text analysis. This subject have also potential value in automatic summarization, knowledge management, et.al.

当前,科研人员难以通过学术搜索引擎和科学计量工具快速回答一些基本但重要的问题,如:"数据挖掘在某文献中是方法还是主题?"、"某问题有哪些技术可解决"、"某问题最早由哪篇文献提出"、"文献中所指的state of the art具体是什么?" 本课题着眼于学术文本词汇功能识别这一核心任务,构建一套理论、方法和工具,帮助科研人员快速回答上述问题。本课题试图对学术文本中词汇功能及词汇间语义关系进行建模,探索自动化方法以识别词汇的功能(技术、主题、领域等);建立词汇语义关联;实现学术词汇的指代消解,分析概念的演化脉络;在此基础上,构建面向词汇功能的知识图谱。 本研究具有较大的理论与应用价值。提出的技术方法及构建的知识图谱可以用于提升学术搜素引擎搜索结果的质量,改进学术文本分析效果,提升相关应用的语义化水平,还可以广泛应用于自动摘要、知识管理等各个领域。

项目摘要

本课题着眼于学术文本词汇功能识别这一核心任务,构建一套理论、方法和工具,帮助科研人员快速回答上述问题。本课题试图对学术文本中词汇功能及词汇间语义关系进行建模,探索自动化方法以识别词汇的功能(技术、主题、领域等);建立词汇语义关联;实现学术词汇的指代消解,分析概念的演化脉络;在此基础上,构建面向词汇功能的知识图谱。本研究提出的技术方法及构建的知识图谱可以用于提升学术搜索引擎搜索结果的质量,改进学术文本分析效果,提升相关应用的语义化水平,还可以广泛应用于自动摘要、知识管理等各个领域。. 围绕学术文本的词汇功能语义、多粒度概念抽取、词汇功能识别和词汇功能维度的知识图谱等专题,发表论文被SSCI/SCIE索引1篇,EI索引1篇;领域权威期刊论文、核心期刊论文18篇左右;完成了专著1本;构建了计算机领域词汇语料库1个,开发了学术文本语义分析工具集4个;申请相关专利4项;获得国家级奖励1项,省部级奖励1项。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

DOI:10.3969/j.issn.1002-0268.2020.03.007
发表时间:2020
2

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017
3

敏感性水利工程社会稳定风险演化SD模型

敏感性水利工程社会稳定风险演化SD模型

DOI:10.16265/j.cnki.issn1003-3033.2021.04.003
发表时间:2021
4

卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比

卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比

DOI:10.13249/j.cnki.sgs.2020.08.003
发表时间:2020
5

结直肠癌肝转移患者预后影响

结直肠癌肝转移患者预后影响

DOI:10.3969 /j.issn.1002-266X.2016.23.023
发表时间:2016

陆伟的其他基金

批准号:51574279
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:50804022
批准年份:2008
资助金额:20.00
项目类别:青年科学基金项目
批准号:81673018
批准年份:2016
资助金额:61.00
项目类别:面上项目
批准号:51671146
批准年份:2016
资助金额:60.00
项目类别:面上项目
批准号:31560652
批准年份:2015
资助金额:42.00
项目类别:地区科学基金项目
批准号:U1933112
批准年份:2019
资助金额:37.00
项目类别:联合基金项目
批准号:30901348
批准年份:2009
资助金额:27.00
项目类别:青年科学基金项目
批准号:91859110
批准年份:2018
资助金额:70.00
项目类别:重大研究计划
批准号:71173164
批准年份:2011
资助金额:45.00
项目类别:面上项目
批准号:71673211
批准年份:2016
资助金额:51.00
项目类别:面上项目
批准号:31570081
批准年份:2015
资助金额:25.00
项目类别:面上项目
批准号:50901052
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:51071109
批准年份:2010
资助金额:40.00
项目类别:面上项目

相似国自然基金

1

矿床领域文本数据挖掘与知识图谱构建

批准号:41902305
批准年份:2019
负责人:王成彬
学科分类:D0215
资助金额:27.00
项目类别:青年科学基金项目
2

面向甲骨学知识图谱的实体发现及语义关系挖掘研究

批准号:U1504612
批准年份:2015
负责人:熊晶
学科分类:F0607
资助金额:27.00
项目类别:联合基金项目
3

面向特定领域的知识图谱构建与应用关键技术研究

批准号:U1836118
批准年份:2018
负责人:程军军
学科分类:F0606
资助金额:65.00
项目类别:联合基金项目
4

面向资源型社交网站的知识图谱构建方法研究

批准号:61402220
批准年份:2014
负责人:欧阳纯萍
学科分类:F0607
资助金额:24.00
项目类别:青年科学基金项目