This proposal will conduct a research on deep neural network based sentence-discourse integrated dependency relation model using dependencies as the basic means to connect sentence and discourse annotation architectures for better discourse parsing. In detail, our discourse parser will make a full use of character embedding, word embedding, convolutional sentence vector and other layers of language processing information. As for the basic learning model, we will consider simple forward neural network, convolutional neural network and recursive neural network. This study will hopefully benefit improving deep discourse analysis processing tasks and more comprehensive understanding on text characteristics.
本项目拟研究基于深度神经网络的句子-篇章一体化的依存关系模型,将依存关系作为基本的表达手段,使用依存结构连接句子和篇章两级的标识架构,改进已有的篇章分析研究。具体来说,我们篇章分析将充分利用包括字嵌入向量、词向量、句子卷积向量在内的多层语言处理信息。在基本的学习模型上,我们将综合考虑简单前向神经网络、卷积神经网络和递归神经网络。本项目有望帮助进一步改进典型的深层篇章分析处理任务,并达到对于文本特性更加全面深入理解的目的。
本一年期项目的研究服务于增进对于汉语文本特性的更全面理解,围绕着改进既有的典型句子-篇章级任务处理效能,利用符合中文文本深层特征的句子-篇章表示的一体化模型,实现从词汇、短语、句子到篇章级的不同粒度的结构表示和分析计算及其之间的有效融合。.本项目在执行中圆满乃至超额完成了项目规划的研究目标及指标,包括预定的各项关键技术研发以相关论文发表。本项目研究报告的结果集中于细粒度(汉字)切分相关的深度学习表示(嵌入)在各层语言处理上的可能性能改进。在神经分词这一层,我们论证了字-词嵌入表示需要结合(正如项目申请所预期的)进行,才能带来进一步性能提升(ACL论文)。在篇章分析这一层,我们报告了首个引入字一级嵌入式表示强化隐式分析性能的工作(COLING论文),同时还报告了首个集成显示和隐式数据的对抗神经网络模型(ACL论文)。在本项目尤其关注的集成模型上,我们报告了首个神经模型下的字-词-句一体的中文分析以及对应的树库(AAAI论文)。.在工程实验工作上,我们报告了鼓舞人心的结果。同时,本一年期项目资助发表10篇论文,包括3篇CCF-A类(ACL\AAAI)论文, 3篇CCF-B类论文(均属顶级计算语言学会议论文),1篇SCI国际期刊论文(CCF-C),2篇EI论文。我们注重人才培养以及相关学术交流,本项目资助下,已累计培养各级学位学生8名,并6人次参与相关顶级国际会议的学术交流(含论文发表)。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于深度学习的句子相似度计算研究
基于依存图的汉语依存分析技术研究
篇章结构分析及基于双语投射的篇章标注方法研究
基于句子匹配分析的知识抽取研究与实现