基于无监督知识提取和多关系表示学习的自动问答关键技术研究

基本信息
批准号:61772382
项目类别:面上项目
资助金额:62.00
负责人:彭敏
学科分类:
依托单位:武汉大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:李飞,田纲,刘纪平,高望,胡刚,谢倩倩,黄济民,朱佳晖,陈典
关键词:
自动问答领域知识表示实体关系抽取机器学习
结项摘要

Question-Answering(QA) on a large scale of domain-oriented texts is an important discipline within the fields of artificial intelligence and big data application at present. Its main challenges are how to extract the domain knowledge from web-scale natural texts and how to understand the questions released by users. This project aims at building QA systems with the ability of unsupervised knowledge learning and multi-relational question semantical representation. Firstly, by constructing the neural sparse topic model and introducing the prior information of relation mentions, we extract the relations without supervision and generate the knowledge as the candidate answers for QA systems. Secondly, by considering the multi-relational inference path of the questions, we propose a multi-relational translation model TransGP, and then construct an entity annotated word co-occurrence graph to uncover the context information. We therefore devise an end-to-end neural attention network based on bi-directional LSTM to leverage the embeddings of multi-relational questions. Finally, we present an answer retrieval model based on EP-K-D tree to figure out the relational subgraphs of target entities with low computational complexity. On the basis of a shortest path search method MRSP, we hence enrich the answer entities with natural language descriptive sentences. The innovation results of this project can not only effectively reduce the dependency of QA systems on limited knowledge, but also provide users with efficient and accurate QA service, thus it will greatly expand the applications of QA systems.

面向海量领域文本的自动问答技术是当前人工智能和大数据应用的一个重要分支,主要难点是如何提取海量的领域文本知识以及怎样理解用户提出的问题。本项目旨在实现具有无监督知识学习能力和问句多关系语义表征的自动问答技术。主要包括:1)通过构建神经稀疏主题模型,结合关系指称先验信息,无监督地提取实体关系,生成作为自动问答答案备选的知识。2)考虑问句的多关系推断路径,提出不确定性多关系翻译表示模型TransGP,然后结合领域文本构建实体标注词汇共现图,生成问句的上下文信息,设计基于双向LSTM以及注意力机制的神经网络,得到多关系问句的嵌入表示。3)构建基于实体优先级的EP-K-D树的答案搜索模型,结合基于神经网络的最短路径方法MRSP,生成较低计算复杂度的答案实体关系子图,并概括为自然语言描述语句。研究成果可有效减少自动问答对已有知识的依赖,为用户提供高效准确的问答服务,并极大地扩展自动问答的应用领域。

项目摘要

面向海量领域文本的自动问答技术是当前人工智能和大数据应用的一个重要分支,主要难点是如何提取海量的领域文本知识以及怎样理解用户提出的问题。本项目旨在实现具有无监督知识学习能力和问句多关系语义表征的自动问答技术。主要包括:1)通过构建神经稀疏主题模型,结合关系指称先验信息,无监督地提取实体关系,生成作为自动问答答案备选的知识。2)考虑问句的多关系推断路径,提出不确定性多关系翻译表示模型TransGP,然后结合领域文本构建实体标注词汇共现图,生成问句的上下文信息,设计基于双向LSTM以及注意力机制的神经网络,得到多关系问句的嵌入表示。3)构建基于实体优先级的EP-K-D树的答案搜索模型,结合基于神经网络的最短路径方法MRSP,生成较低计算复杂度的答案实体关系子图,并概括为自然语言描述语句。项目已圆满完成研究目标和研究计划,取得一系列软件、论文、专利等研究成果。研究成果可有效减少自动问答对已有知识的依赖,为用户提供高效准确的问答服务,并极大地扩展自动问答的应用领域。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

新型树启发式搜索算法的机器人路径规划

新型树启发式搜索算法的机器人路径规划

DOI:10.3778/j.issn.1002-8331.1903-0411
发表时间:2020
2

现代优化理论与应用

现代优化理论与应用

DOI:10.1360/SSM-2020-0035
发表时间:2020
3

基于自适应干扰估测器的协作机器人关节速度波动抑制方法

基于自适应干扰估测器的协作机器人关节速度波动抑制方法

DOI:10.13973/j.cnki.robot.210412
发表时间:2022
4

WMTL-代数中的蕴涵滤子及其应用

WMTL-代数中的蕴涵滤子及其应用

DOI:10.11897/SP.J.1016.2018.00886
发表时间:2018
5

口腔扁平苔藓研究热点前沿的可视化分析

口腔扁平苔藓研究热点前沿的可视化分析

DOI:10.7507/1672-2531.202012076
发表时间:2021

相似国自然基金

1

基于对抗表示学习的知识迁移关键技术研究

批准号:61876208
批准年份:2018
负责人:吴庆耀
学科分类:F0607
资助金额:62.00
项目类别:面上项目
2

基于大规模知识库的问答系统关键技术研究

批准号:61672058
批准年份:2016
负责人:赵东岩
学科分类:F0211
资助金额:62.00
项目类别:面上项目
3

知识问答中自然答案生成关键技术研究

批准号:61702512
批准年份:2017
负责人:何世柱
学科分类:F0211
资助金额:27.00
项目类别:青年科学基金项目
4

基于大数据深度语义表示学习的农业智能问答研究

批准号:31771677
批准年份:2017
负责人:陈雷
学科分类:C1301
资助金额:62.00
项目类别:面上项目