汉语篇章话题结构:形式化表示体系、语料库构建及其关键技术研究

基本信息
批准号:61673290
项目类别:面上项目
资助金额:65.00
负责人:周国栋
学科分类:
依托单位:苏州大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:奚雪峰,顾静航,孙静,王礼敏,陈敬,朱珠,汪蓉
关键词:
篇章话题结构理论计算模型汉语篇章话题结构语料库标注
结项摘要

The analysis of discourse topic structure focuses on the discourse intension and plays a fundamental role to discourse-level semantic analysis. Currently, most of research in NLP focuses on morphological and syntactic levels and there is much less research on the inherent regulations in discourse. This results in the lack of theoretical and computational methodologies towards effective discourse topic analysis and severely restricts its wide applications. This project addresses Chinese discourse topic structure analysis from following aspects:.1) Studying the general regulations and special characteristics in the structure organization of Chinese discourse topic and building a theoretical framework suitable to the representation and analysis of Chinese discourse topic structure. Specially, a micro-topic scheme based on theme-rheme theory is proposed to represent Chinese discourse topic structure and a Chinese discourse topic framework will be constructed on micro-topic chains..2) Proposing an annotation scheme for Chinese discourse topic structure and semi-automatically building a certain-scale Chinese discourse topic corpus of high quality via integrating bootstrapping and active learning methods..3) Studying the dynamic forming process of discourse topic structure. Based on the thematic progression theory, a dynamic computational model to implement Chinese discourse topic analysis is proposed.

篇章话题结构分析针对篇章的意图性,是篇章级语义分析的基础。目前自然语言处理研究的重点聚焦在词法和句法层面,对篇章内在规律的研究相对较少,缺乏对篇章话题进行有效分析的理论方法体系,严重制约了基于篇章级语义分析的相关应用。本项目将从理论体系探索、语料库构建和计算模型研究等方面系统深入开展汉语篇章话题结构分析的研究:1)研究汉语篇章话题结构组织的规律和特点,建立一套适用于汉语篇章话题结构表示与分析的理论体系,拟采用一种基于主述位理论的汉语篇章话题结构表示方式,基于微观话题链构建汉语篇章话题结构表示体系;2)提出一套汉语篇章微观话题结构标注规范,并结合自举学习和主动学习方法半自动构建一定规模的高质量汉语篇章话题结构标注语料库资源;3)研究篇章话题结构的动态生成过程,提出并实现一套基于主位推进理论的汉语篇章话题结构分析动态计算模型。

项目摘要

篇章话题结构分析针对篇章的意图性,是篇章级语义分析的基础。目前自然语言处理研究的重点聚焦在词法和句法层面,对篇章内在规律的研究相对较少,缺乏对篇章话题进行有效分析的理论方法体系,严重制约了基于篇章级语义分析的相关应用。..本项目从理论体系探索、语料库构建和计算模型研究等方面系统深入开展了汉语篇章话题结构分析的研究:.1)研究汉语篇章话题结构组织的规律和特点,建立了一套适用于汉语篇章话题结构表示与分析的理论体系,并采用一种基于主述位理论的汉语篇章话题结构表示方式,基于微观话题链,构建了汉语篇章话题结构表示体系。.2)提出了一套汉语篇章微观话题结构标注规范,并构建了相关标注语料库资源。目前,已经手工标注了一个一定规模高质量(500个文本2200多个篇章)的语料库资源,已有20多家国内外研究机构试用。另外,正在结合自举学习和主动学习方法半自动构建一个较大规模一定质量(2000个文本10000多个篇章)的标注语料库资源,以扩大其影响力和实用性。.3)研究篇章话题结构的动态生成过程,提出并实现了一套基于主位推进理论的汉语篇章话题结构分析动态计算模型和实验平台。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018

周国栋的其他基金

批准号:60873150
批准年份:2008
资助金额:30.00
项目类别:面上项目
批准号:11301186
批准年份:2013
资助金额:22.00
项目类别:青年科学基金项目
批准号:11671139
批准年份:2016
资助金额:48.00
项目类别:面上项目
批准号:61273320
批准年份:2012
资助金额:81.00
项目类别:面上项目
批准号:90920004
批准年份:2009
资助金额:50.00
项目类别:重大研究计划
批准号:60673041
批准年份:2006
资助金额:27.00
项目类别:面上项目
批准号:61331011
批准年份:2013
资助金额:285.00
项目类别:重点项目

相似国自然基金

1

基于广义话题的汉语篇章结构研究

批准号:61171129
批准年份:2011
负责人:宋柔
学科分类:F0113
资助金额:62.00
项目类别:面上项目
2

汉语篇章连贯性分析:话题结构、逻辑语义结构及其联合学习研究

批准号:61472264
批准年份:2014
负责人:孔芳
学科分类:F0211
资助金额:81.00
项目类别:面上项目
3

赣方言篇章平行语料库构建及计算模型研究

批准号:61772246
批准年份:2017
负责人:徐凡
学科分类:F0211
资助金额:59.00
项目类别:面上项目
4

汉语抽象意义表示关键技术研究

批准号:61772278
批准年份:2017
负责人:曲维光
学科分类:F0211
资助金额:65.00
项目类别:面上项目