基于大数据深度语义表示学习的农业智能问答研究

基本信息
批准号:31771677
项目类别:面上项目
资助金额:62.00
负责人:陈雷
学科分类:
依托单位:中国科学院合肥物质科学研究院
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:李淼,袁媛,陈晟,杨振新,万莉,孙凯,高进
关键词:
知识库构建神经网络问答系统大数据智能计算
结项摘要

The development of internet agricultural big data requires the information retrieval to be more intelligent and more precise. However, since the traditional search engine is insufficient for semantic understanding, the list of candidate answers is difficult to achieve precise Q&A. In order to solve this problem, based on the previous team work of agricultural knowledge engineering, natural language processing, etc., this project focuses on the semantic representation learning, understanding and matching in agricultural intelligent Q&A system, including:.1. Combined with optimization model the automatic mining of Internet multi-source agricultural knowledge, studying the optimized three tuple of entity and relationship for the joint representation learning of agricultural knowledge base and text. Solving the problems of the lack of domain knowledge and the lack of semantic features in description between entity and relationship..2. Introducing the multi granularity linguistic elements in the analysis of agricultural questions. Constructing the corresponding combination function to improve the semantic universality of text combination. Solving the problems of question classification errors and semantic bias caused by the single neural network strategy..3. In order to improve the quality of answer extraction, studying the multimodal agricultural knowledge reasoning based on multi feature mixture and multi strategy semantic similarity calculation method. Solving the problems of low coverage of inference rules and insufficient ability to answer complex questions..Through the above studies, constructing of agricultural intelligent Q&A system based on deep semantic representation learning of big data, and providing the necessary technical supports for the unmanned online guidance of intelligent and precise crops planting.

互联网农业大数据的发展对信息检索的智能化与精准化的要求日益增高,而传统搜索引擎对语义理解不足,其候选答案列表难以实现精准回答。针对该问题,本项目在团队有关农业知识工程、自然语言处理的工作基础上,重点突破农业智能问答中的深层语义表示学习与匹配方法:1.结合互联网多源农业知识的自动挖掘,研究农业知识库和文本联合表示学习的三元实体关系优化模型,解决领域知识不足、实体与关系的关联描述欠缺语义特征的问题;2.在农业问句分析中引入多粒度的语言元素,构建相应的组合函数提高文本组合的语义通用性,避免问句分类错误与单一神经网络策略导致的语义偏差现象;3.研究多特征混合的多模态农业知识推理和多策略语义相似度计算方法,提高系统答案抽取质量,解决推理规则覆盖度低、复杂问句回答能力不足的问题。通过上述研究,构建基于大数据深度语义表示学习的农业智能问答系统,为实现农作物智能化、精细化种植的无人/在线指导提供技术支撑。

项目摘要

互联网农业大数据的发展对信息检索的智能化与精准化的要求日益增高,以关键词匹配和文档排序为特点的传统搜索引擎的不足越来越明显:一是关键词匹配无法在语义上对用户的检索需求进行理解,对以自然语言形式给出的问句的检索效果不佳;二是传统搜索引擎的返回结果是数量较多的候选答案列表,需要用户进行二次检索。.针对这些问题,本项目首先结合互联网多源农业知识的自动挖掘,研究农业知识库和文本联合表示学习的关系优化模型,解决领域知识不足的问题;其次在农业问句分析中构建相应的组合函数提高文本组合的语义通用性,解决问句分类错误以及单一神经网络策略导致的语义偏差问题;最后研究多特征混合的农业知识推理和长文本答案的自动摘要生成方法,提高答案选择质量,提高复杂问句的回答能力。.具体来说,在问句分类方面,分别提出了基于信息熵权重和基于级联词向量卷积神经网络的方法,提高了问句分类的精度;在答案选择方面,分别提出了基于文本摘要和基于多层语义获取的方法,尤其针对农业领域非事实类问答中的长文本答案情况,研究了基于历史信息复用的长文本生成式自动摘要方法。在10000条问答对的对比实验中,当候选答案池的大小为100时,本项目提出的答案选择方法的准确率达到了66.2%,与基线系统相比最高提高了17.6个百分点。.此外,本项目面向问答系统的跨媒体应用需求,开展了跨媒体智能关键技术的前期探索,如农业图像理解、农业跨媒体知识图谱构建及应用等,并在此基础上获得了国家自然科学基金面上项目“基于跨媒体语义协同理解的农业知识演化与生成研究”的支持。.通过本项目的实施,构建了基于大数据深度语义表示学习的农业智能问答系统,为农作物病虫害诊断、智能化种植的在线指导提供必要的技术支撑。同时得益于后续项目的支持,有望进一步突破多源异构农业数据的语义统一表征与内容协同理解问题,提高跨媒体环境下的农业认知计算能力,为下一代智能农业技术产品和应用系统研发提供开放式的支撑环境。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
4

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018
5

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018

陈雷的其他基金

批准号:51101136
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:61401307
批准年份:2014
资助金额:24.00
项目类别:青年科学基金项目
批准号:51878316
批准年份:2018
资助金额:61.00
项目类别:面上项目
批准号:51409158
批准年份:2014
资助金额:26.00
项目类别:青年科学基金项目
批准号:31300009
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:41202056
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:51704319
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:21875058
批准年份:2018
资助金额:65.00
项目类别:面上项目
批准号:71903202
批准年份:2019
资助金额:19.00
项目类别:青年科学基金项目
批准号:51675467
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:41872092
批准年份:2018
资助金额:66.00
项目类别:面上项目
批准号:31600449
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:41602147
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:61502445
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:41502019
批准年份:2015
资助金额:22.00
项目类别:青年科学基金项目
批准号:U1332133
批准年份:2013
资助金额:70.00
项目类别:联合基金项目
批准号:31870833
批准年份:2018
资助金额:59.00
项目类别:面上项目
批准号:10804122
批准年份:2008
资助金额:24.00
项目类别:青年科学基金项目
批准号:51002043
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:81701218
批准年份:2017
资助金额:20.00
项目类别:青年科学基金项目
批准号:31701520
批准年份:2017
资助金额:26.00
项目类别:青年科学基金项目
批准号:51405355
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目

相似国自然基金

1

基于语义的农业多模态数据深度解析机制研究

批准号:31601218
批准年份:2016
负责人:邓寒冰
学科分类:C1301
资助金额:20.00
项目类别:青年科学基金项目
2

基于深度学习框架的多媒体大数据表示学习

批准号:61402479
批准年份:2014
负责人:程斌
学科分类:F0210
资助金额:26.00
项目类别:青年科学基金项目
3

基于深度学习的异构数据低维非线性表示

批准号:91230101
批准年份:2012
负责人:张讲社
学科分类:A0606
资助金额:70.00
项目类别:重大研究计划
4

基于图结构的数据表示和深度学习方法

批准号:61876152
批准年份:2018
负责人:王鹏
学科分类:F0604
资助金额:62.00
项目类别:面上项目