基于门控卷积神经网络和长期记忆建模的复杂文本分类模型研究

基本信息
批准号:61806142
项目类别:青年科学基金项目
资助金额:20.00
负责人:金日泽
学科分类:
依托单位:天津工业大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:金光浩,王胜蓓,苑炜弢,崔光宇,Joon-Young Paik,卢阳,王江峰,赵雷
关键词:
长距离依赖卷积神经网络深度学习门控机制文本分类
结项摘要

Natural language understanding (NLU) is the core technology in the field of artificial intelligence, and it will act as a dominant method for human-computer interaction. Therefore, the research of NLU has great significance in theory and application. Many applications of NLU rely on text classification as it is a fundamental task to understanding topics of a message. Deep neural networks work in an end-to-end manner and require less human supervision, which make it possible for them become a general-purpose an powerful solution in deep semantic understanding and inference. However, the existing deep learning solutions are ineffective in terms of architecture design and collaboration mechanism. As a result, they can not effectively capture the hierarchical semantic representation and supporting evidences for the inference. This proposal studies the relationship between design of gates and gradient vanishing, the depth of convolutional nets, and multi-prototype word semantics; the relationship between the number of recurrent hops and the effectiveness of the long-term memory modeling and inference. In details: adapting a gate mechanism based convolutional net to transform the input text into the feature vector, which can avoid the problem of gradient vanishing in the convention neural net; putting forward in the depth of the net, which makes it possible to modeling the long-term memory and providing the mapping between the feature obtained and the memory component; obtaining the integrated feature by inserting, deleting, or updating memory slots in the memory component. Theoretical breakthroughs are expected to be achieved in deep semantics and inference. And the research results can be applied to various NLP tasks such as complex text classification, machine translation, and Q/A.

自然语言理解是人工智能领域里最核心的技术,即将成为新的和谐人机交互方式,具有重大的研究意义和应用价值。而分类技术对于判断用户意图至关重要。神经网络模型以其端到端数据驱动的特点规避人为特征工程,在构建通用语义理解和逻辑推理能力等方面具有巨大的应用潜力。但是现有的深度学习框架在实际操作中不能有效组织各个神经网络模块的协作,直接影响到提取关键特征的性能,继而无法进行准确推理并理解长依赖文本。本项目针对门控函数对梯度回流、卷积神经网络级数及多层次语义特征提取的关系机理开展研究,并基于这种多义语义对长依赖学习及逻辑推理机制开展研究:优化门控卷积层的设计,有效加深模型级数,使其能够更多地挖掘文本中的多层自然含义;使用记忆和注意力机制对输入文本的中间语义表示进行转换,从而准确获取长距离依赖特征,并应用于复杂文本处理中的主题、情感分类任务,智能对话系统中的意图理解、逻辑推理任务。

项目摘要

复杂文本分类技术旨在解决多标签分类、多伦对话系统中的用户意图识别、半监督文本分类等任务。本项目通过设计一种新颖的门控注意力机制,提升深度神经网络提取类别特征、发现上下文长距离依赖的能力;探索了提出方法在对话策略学习中的应用;提出基于生成对抗学习的无监督文本分类方法、文本与图像融合技术。提出方法有助于构建智能文本检索、人机对话系统、手语翻译与生成系统。本项目在国内外重要刊物上发表了 15 篇学术论文,申请知识产权6项,培养硕/博士生13人、青年科技工作者3人。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

农超对接模式中利益分配问题研究

农超对接模式中利益分配问题研究

DOI:10.16517/j.cnki.cn12-1034/f.2015.03.030
发表时间:2015
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

基于图卷积网络的归纳式微博谣言检测新方法

基于图卷积网络的归纳式微博谣言检测新方法

DOI:10.3785/j.issn.1008-973x.2022.05.013
发表时间:2022

金日泽的其他基金

相似国自然基金

1

基于卷积神经网络和双层优化建模的复杂图像分类研究

批准号:61702163
批准年份:2017
负责人:谢国森
学科分类:F0605
资助金额:27.00
项目类别:青年科学基金项目
2

视觉分类任务中基于高阶统计建模的深层卷积神经网络方法研究

批准号:61806140
批准年份:2018
负责人:王旗龙
学科分类:F0604
资助金额:26.00
项目类别:青年科学基金项目
3

基于卷积神经网络构建糖尿病视网膜病变的多分类预测模型

批准号:81703318
批准年份:2017
负责人:张凤
学科分类:H3011
资助金额:20.00
项目类别:青年科学基金项目
4

结合卷积神经网络的复杂介质动力学建模与加速方法研究

批准号:61872345
批准年份:2018
负责人:何小伟
学科分类:F0209
资助金额:65.00
项目类别:面上项目