基于大数据深度语义表示学习的农业智能问答研究

基本信息

批准号：31771677

项目类别：面上项目

资助金额：62.00

负责人：陈雷

学科分类：

依托单位：中国科学院合肥物质科学研究院

批准年份：2017

结题年份：2021

起止时间：2018-01-01 - 2021-12-31

项目状态：已结题

项目参与者：李淼,袁媛,陈晟,杨振新,万莉,孙凯,高进

关键词：

知识库构建神经网络问答系统大数据智能计算

结项摘要

The development of internet agricultural big data requires the information retrieval to be more intelligent and more precise. However, since the traditional search engine is insufficient for semantic understanding, the list of candidate answers is difficult to achieve precise Q&A. In order to solve this problem, based on the previous team work of agricultural knowledge engineering, natural language processing, etc., this project focuses on the semantic representation learning, understanding and matching in agricultural intelligent Q&A system, including:.1. Combined with optimization model the automatic mining of Internet multi-source agricultural knowledge, studying the optimized three tuple of entity and relationship for the joint representation learning of agricultural knowledge base and text. Solving the problems of the lack of domain knowledge and the lack of semantic features in description between entity and relationship..2. Introducing the multi granularity linguistic elements in the analysis of agricultural questions. Constructing the corresponding combination function to improve the semantic universality of text combination. Solving the problems of question classification errors and semantic bias caused by the single neural network strategy..3. In order to improve the quality of answer extraction, studying the multimodal agricultural knowledge reasoning based on multi feature mixture and multi strategy semantic similarity calculation method. Solving the problems of low coverage of inference rules and insufficient ability to answer complex questions..Through the above studies, constructing of agricultural intelligent Q&A system based on deep semantic representation learning of big data, and providing the necessary technical supports for the unmanned online guidance of intelligent and precise crops planting.

互联网农业大数据的发展对信息检索的智能化与精准化的要求日益增高，而传统搜索引擎对语义理解不足，其候选答案列表难以实现精准回答。针对该问题，本项目在团队有关农业知识工程、自然语言处理的工作基础上，重点突破农业智能问答中的深层语义表示学习与匹配方法：1.结合互联网多源农业知识的自动挖掘，研究农业知识库和文本联合表示学习的三元实体关系优化模型，解决领域知识不足、实体与关系的关联描述欠缺语义特征的问题；2.在农业问句分析中引入多粒度的语言元素，构建相应的组合函数提高文本组合的语义通用性，避免问句分类错误与单一神经网络策略导致的语义偏差现象；3.研究多特征混合的多模态农业知识推理和多策略语义相似度计算方法，提高系统答案抽取质量，解决推理规则覆盖度低、复杂问句回答能力不足的问题。通过上述研究，构建基于大数据深度语义表示学习的农业智能问答系统，为实现农作物智能化、精细化种植的无人/在线指导提供技术支撑。

项目摘要

互联网农业大数据的发展对信息检索的智能化与精准化的要求日益增高，以关键词匹配和文档排序为特点的传统搜索引擎的不足越来越明显：一是关键词匹配无法在语义上对用户的检索需求进行理解，对以自然语言形式给出的问句的检索效果不佳；二是传统搜索引擎的返回结果是数量较多的候选答案列表，需要用户进行二次检索。.针对这些问题，本项目首先结合互联网多源农业知识的自动挖掘，研究农业知识库和文本联合表示学习的关系优化模型，解决领域知识不足的问题；其次在农业问句分析中构建相应的组合函数提高文本组合的语义通用性，解决问句分类错误以及单一神经网络策略导致的语义偏差问题；最后研究多特征混合的农业知识推理和长文本答案的自动摘要生成方法，提高答案选择质量，提高复杂问句的回答能力。.具体来说，在问句分类方面，分别提出了基于信息熵权重和基于级联词向量卷积神经网络的方法，提高了问句分类的精度；在答案选择方面，分别提出了基于文本摘要和基于多层语义获取的方法，尤其针对农业领域非事实类问答中的长文本答案情况，研究了基于历史信息复用的长文本生成式自动摘要方法。在10000条问答对的对比实验中，当候选答案池的大小为100时，本项目提出的答案选择方法的准确率达到了66.2%，与基线系统相比最高提高了17.6个百分点。.此外，本项目面向问答系统的跨媒体应用需求，开展了跨媒体智能关键技术的前期探索，如农业图像理解、农业跨媒体知识图谱构建及应用等，并在此基础上获得了国家自然科学基金面上项目“基于跨媒体语义协同理解的农业知识演化与生成研究”的支持。.通过本项目的实施，构建了基于大数据深度语义表示学习的农业智能问答系统，为农作物病虫害诊断、智能化种植的在线指导提供必要的技术支撑。同时得益于后续项目的支持，有望进一步突破多源异构农业数据的语义统一表征与内容协同理解问题，提高跨媒体环境下的农业认知计算能力，为下一代智能农业技术产品和应用系统研发提供开放式的支撑环境。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.16796/j.cnki.1000-3770.2022.03.003

发表时间：2022

DOI：10.12202/j.0476-0301.2022178

发表时间：2022

DOI：10.19328/j.cnki.2096-8655.2022.02.002

发表时间：2022

DOI：10.13609/j.cnki.1000-0313.2022.04.019

发表时间：2022

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

陈雷的其他基金

批准号：51101136

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：61401307

批准年份：2014

资助金额：24.00

项目类别：青年科学基金项目

批准号：51878316

批准年份：2018

资助金额：61.00

项目类别：面上项目

批准号：51409158

批准年份：2014

资助金额：26.00

项目类别：青年科学基金项目

批准号：31300009

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：41202056

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：51704319

批准年份：2017

资助金额：25.00

项目类别：青年科学基金项目

批准号：21875058

批准年份：2018

资助金额：65.00

项目类别：面上项目

批准号：71903202

批准年份：2019

资助金额：19.00

项目类别：青年科学基金项目

批准号：51675467

批准年份：2016

资助金额：62.00

项目类别：面上项目

批准号：41872092

批准年份：2018

资助金额：66.00

项目类别：面上项目

批准号：31600449

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：41602147

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：61502445

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：41502019

批准年份：2015

资助金额：22.00

项目类别：青年科学基金项目

批准号：U1332133

批准年份：2013

资助金额：70.00

项目类别：联合基金项目

批准号：31870833

批准年份：2018

资助金额：59.00

项目类别：面上项目

批准号：10804122

批准年份：2008

资助金额：24.00

项目类别：青年科学基金项目

批准号：51002043

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

批准号：81701218

批准年份：2017

资助金额：20.00

项目类别：青年科学基金项目

批准号：31701520

批准年份：2017

资助金额：26.00

项目类别：青年科学基金项目

批准号：51405355

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

相似国自然基金

基于语义的农业多模态数据深度解析机制研究

批准号：31601218

批准年份：2016

负责人：邓寒冰

学科分类：C1301

资助金额：20.00

项目类别：青年科学基金项目

基于深度学习框架的多媒体大数据表示学习

批准号：61402479

批准年份：2014

负责人：程斌

学科分类：F0210

资助金额：26.00

项目类别：青年科学基金项目

基于深度学习的异构数据低维非线性表示

批准号：91230101

批准年份：2012

负责人：张讲社

学科分类：A0606

资助金额：70.00

项目类别：重大研究计划

基于图结构的数据表示和深度学习方法

批准号：61876152

批准年份：2018

负责人：王鹏

学科分类：F0604

资助金额：62.00

项目类别：面上项目

基于大数据深度语义表示学习的农业智能问答研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

EBPR工艺运行效果的主要影响因素及研究现状

复杂系统科学研究进展

"多对多"模式下GEO卫星在轨加注任务规划

结直肠癌免疫治疗的多模态影像及分子影像评估

智能煤矿建设路线与工程实践

陈雷的其他基金

微量稀土在双相不锈钢热加工过程中的作用机理研究

基于群智能优化的复杂混合盲信号分离算法研究

石墨相g-C3N4基光催化复合材料制备及其降解水中PPCPs研究

船用天然气发动机非平衡等离子体低温点火研究

威海海域柄海鞘和史氏菊海鞘来源的海洋放线菌多样性及活性菌株筛选

西藏冈底斯南缘努日大型铜-钼-钨矿床成矿元素共生分离机制研究

依时性流体圆管法非稳态阶段流变测试的可靠性研究

基于非视觉功能的LED远红光-近红外荧光材料合成及发光特性研究

全球金融周期背景下的跨境风险传染——基于汇率和跨境资本流动的渠道分析

节约型双相不锈钢在TWIP+TRIP耦合效应下的应变硬化行为及微观机理研究

南秦岭山柞地区晚侏罗世-早白垩世斑岩-矽卡岩型铜（钼）矿床深部地质过程与成矿作用研究

岭南槭引种适应性及栽培区域选择研究

海相页岩纹层多样性及其对页岩储层品质的影响

基于形态和多词的有限语料蒙汉互译调序优化方法

瓮安生物群中胚胎状化石再研究

稀土激活碱土硅酸盐LED橘色荧光材料的能带结构、相变与格位选择发光调控机制研究

KATP通道激活机制的研究

强磁场下低旋磁比核固体NMR观测新方法的研究

用以解决交流LED闪光和眩光问题的新型荧光材料及其光学特性研究

Lnc-23096调控miR-29b介导早期失神经肌萎缩中蛋白质代谢的机制研究

自微乳化改善苦菜总黄酮的生物利用率和促吸收机制研究

离心摆式双质量飞轮多谐次减振机理与转速自适应寻优算法研究

相似国自然基金