With the development of artificial intelligence, the topic of understanding user generated content on the internet in depth has attracted increasing attention from research fields. Argumentation mining aims to extract and analyze argument information from argumentative text and generate structured output. Resulted technologies can assist people in social science, politics and science fields with making decisions. Our project aims to tackle three limitations of the existing research in argumentation mining, including the lack of linguistic features in the argument representation, the lack of domain knowledge in the model and the lack of sub-task relationship in the model. Our contribution includes combining semantic and structural information for argument representation, incorporating domain knowledge and considering sub-task relations for argumentation mining modeling. Our research takes the bridging of theory and application into account. We can thus provide direct support for the development of argumentative text analysis application in related fields.
伴随着人工智能技术的发展,对互联网上用户产生文本进行深度理解成为当今研究的一个热门话题。论辩挖掘(Argumentation mining)面向包含用户针对特定话题相关看法的论辩性文本展开研究,旨在对不规则的论辩性文本进行论点信息的提取和分析,以产生结构化输出,从而实现对用户逻辑推导过程的深入挖掘。相关的技术可以为社会、政治和科学领域的决策者以及研究人员提供自动化的论辩性文本分析工具,为企业市场营销创造新的前景。本课题针对当今论辩挖掘研究的三个局限性(论点表示中语言特性的缺失、模型中领域知识的缺失以及模型中子任务关联性的缺失),研究结合语义和结构信息的论点表示方法,结合领域知识的端到端论辩挖掘模型以及多领域的语料集合的构建。相关的研究内容充分考虑算法理论与应用领域的对接,能够对相关领域的论辩性文本分析应用的开发提供直接的算法和技术支持。
论辩(Argumentation)以人的逻辑论证过程作为研究对象,是一个涉及逻辑、哲学、语言、修辞、计算机科学和教育等多学科的研究领域,相关研究工作可以追溯到亚里士多德时期。研究者认为,论辩是驱使人们进行推理的原因,因此,研究论辩对于深度理解人的逻辑推理过程至关重要。近年来,论辩研究引起计算语言学的关注,并催生了一个新的研究领域,即计算论辩学(Computational Argumentation)。计算论辩试图将人类关于逻辑论证的认知模型与计算模型结合起来,以提高人工智能自动推理的能力。.本项目针对网络上的论辩性文本,基于逻辑学和语言学的理论模型,开展面向论辩挖掘理论和算法的相关研究,从数据集构造、论点的语义表示以及论辩挖掘模型三个方面开展工作。在具体执行过程中,重点研究端到端的论辩挖掘多任务框架,基于神经网络的端到端论辩质量分析算法以及基于强化学习的学生议论文自动化评分算法。第一,我们使用几个单独的模型来预测每个论辩元素子任务的结果,使用提出的联合模型将每个单独模型的概率分数作为输入,形成目标函数。还定义约束条件,通过ILP求解目标函数。第二,我们提出一种融合论点交互信息的论辩文本说服力质量评估模型,主要通过一个包括三种不同类型注意力机制的双向注意力网络来捕捉回复帖和原始帖之间的论点交互信息。第三,我们提出了一个强化学习的模型,使用QWK 作为议论文评分系统的训练。每次对一组文章进行评分,其中每个评分都是强化学习的一个动作。我们引入了一个打包打分的思想,使用QWK 作为奖励,并作为引导,更新评分系统。.项目执行期间,一共发表由项目资助的论文16篇。其中,CCF A类论文6篇,CCF B类论文6篇,SCI 期刊论文2篇,其它论文2篇。构建4个领域的数据集合,总样本数超过2万。项目执行期间,构建论辩挖掘数据集合4个,其中社交领域的论辩观点对论文1个,金融领域问题集1个,汽车领域问题集1个和司法领域数据集1个。项目执行期,培养硕士生毕业生13名。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
基于关系对齐的汉语虚词抽象语义表示与分析
基于卷积神经网络的链接表示及预测方法
面向自适应学习的端到端人脸识别
5G网络切片端到端安全实现机理和提升方法研究
全网状IP网络端到端QoS测量的研究
互联网端到端拥塞控制和区分服务