This proposal proposes the research on key technologies of automated rhetoric analysis, emphasizes the joint analysis of the use of rhetorical devices and their effects and applies them to automated essay scoring for Chinese language. Propose neural multitask learning framework to investigate the recognition and evaluation of several key rhetorical aspects and develop effective automated essay scoring models to integrate multi-level rhetorical analysis. The main research contents include:(1) On language presentation aspect, a joint model is presented for discourse mode recognition and evaluation by considering literary grace analysis simultaneously; (2) On rhetorical device aspect, a multitask learning based approach is proposed to jointly recognize simile sentences and extract simile structures; (3) On text organization aspect, a topic adaptive multitask learning model is proposed to simultaneously identify discourse roles and evaluate organization quality; (4) A deep multi-task learning framework is designed to integrate multiple level rhetoric analysis for automated essay scoring, which can improve representation learning, appreciation ability and interpretability of an automated scoring system. The proposal together with previous work of our group can build a relatively complete architecture of rhetorical analysis, make contributions on the aspects of data construction, computational models and applications to drive the development of automated rhetoric analysis and text quality evaluation technologies for Chinese.
本项目研究文本自动修辞分析的关键技术,强调对语言运用手段和效果的联合分析,将其应用于汉语作文自动评分。提出基于神经网络多任务学习的算法框架,研究多个修辞方面的识别与评价以及融合多层次修辞分析的作文自动评分模型。研究的主要内容包括:(1)在语言表达方面,提出表达方式识别与文采分析的联合模型,同时实现表达方式的识别与质量评估;(2)在修辞手法方面,提出比喻句识别与本体喻体抽取相结合的多任务学习策略,促进比喻的结构化分析;(3)在篇章结构方面,提出主题自适应的篇章角色识别与篇章结构质量评价的联合分析方法;(4)采用深度多任务学习框架,将不同层次修辞分析与作文评分结合,增强表示学习能力,提高作文评分系统的赏析能力和评分预测的可解释性。本项目研究内容结合前期工作可实现较为完整的修辞分析体系,将在数据构建、计算模型与实际应用等方面推动汉语自动修辞分析和文本质量评价技术的发展。
本项目研究文本自动修辞分析关键技术,强调对语言运用手段和效果的联合分析,重点在于突破多层次修辞分析、篇章表示学习等难点,探索多任务学习技术的理论和应用,提高中文作文自动评分模型的鉴赏能力、迁移能力和可解释性。项目取得以下相关进展和成果。.(1)构建了一定规模的中文修辞和篇章分析人工标注数据集,包括:明喻自动识别数据集、隐喻关系与概念属性知识库、议论文篇章要素识别和篇章结构评分数据集等,推动了中文自动修辞分析的研究。.(2)提出了一系列面向修辞分析的计算模型,包括:基于上下文关系学习的隐喻识别模型、基于知识图谱表示学习的一体化隐喻计算框架,系统研究了以隐喻为代表的创造性语言修辞识别方法。.(3)提出了一系列面向篇章表示学习与评价的计算模型,包括:基于篇章自注意力机制的议论文篇章要素识别方法,利用典型论辩元素有效描述作文的篇章结构并作为篇章结构的评价依据,并提出了基于层次多任务学习的议论文篇章结构评分方法。.(4)提出了融合深层语言分析结构的汉语作文自动评分系统以及基于多阶段预训练的可迁移作文评分模型,相关技术应用于科大讯飞中高考语文作文智能评分系统,机器评分一致率达到或超过人人水平,具有较大的科学意义和社会价值。.项目发表CCF推荐A、B类国际顶级会议和期刊论文5篇,包括ACL、IJCAI、EMNLP、TASLP等,SCI二区以上期刊2篇,发表和录用CCF-B类国内期刊2篇,发表学术专著1部、专著章节1章。申请国家发明专利8项。培养硕士研究生9人,博士后出站1人。.项目应用或提出有效的多任务学习策略应用在修辞分析、篇章表示学习、作文自动评分模型等多个方面,相关理论研究和算法设计成功地在应用实践中得到验证,总体上完成了既定的研究目标。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
面向中国英语学习者的英文作文全自动评分及诊断反馈技术研究
基于深度神经网络的自动作文评分算法研究
汉语考试中海量作文多层面全自动评分技术
多任务学习的理论分析与应用