The development of internet agricultural big data requires the information retrieval to be more intelligent and more precise. However, since the traditional search engine is insufficient for semantic understanding, the list of candidate answers is difficult to achieve precise Q&A. In order to solve this problem, based on the previous team work of agricultural knowledge engineering, natural language processing, etc., this project focuses on the semantic representation learning, understanding and matching in agricultural intelligent Q&A system, including:.1. Combined with optimization model the automatic mining of Internet multi-source agricultural knowledge, studying the optimized three tuple of entity and relationship for the joint representation learning of agricultural knowledge base and text. Solving the problems of the lack of domain knowledge and the lack of semantic features in description between entity and relationship..2. Introducing the multi granularity linguistic elements in the analysis of agricultural questions. Constructing the corresponding combination function to improve the semantic universality of text combination. Solving the problems of question classification errors and semantic bias caused by the single neural network strategy..3. In order to improve the quality of answer extraction, studying the multimodal agricultural knowledge reasoning based on multi feature mixture and multi strategy semantic similarity calculation method. Solving the problems of low coverage of inference rules and insufficient ability to answer complex questions..Through the above studies, constructing of agricultural intelligent Q&A system based on deep semantic representation learning of big data, and providing the necessary technical supports for the unmanned online guidance of intelligent and precise crops planting.
互联网农业大数据的发展对信息检索的智能化与精准化的要求日益增高,而传统搜索引擎对语义理解不足,其候选答案列表难以实现精准回答。针对该问题,本项目在团队有关农业知识工程、自然语言处理的工作基础上,重点突破农业智能问答中的深层语义表示学习与匹配方法:1.结合互联网多源农业知识的自动挖掘,研究农业知识库和文本联合表示学习的三元实体关系优化模型,解决领域知识不足、实体与关系的关联描述欠缺语义特征的问题;2.在农业问句分析中引入多粒度的语言元素,构建相应的组合函数提高文本组合的语义通用性,避免问句分类错误与单一神经网络策略导致的语义偏差现象;3.研究多特征混合的多模态农业知识推理和多策略语义相似度计算方法,提高系统答案抽取质量,解决推理规则覆盖度低、复杂问句回答能力不足的问题。通过上述研究,构建基于大数据深度语义表示学习的农业智能问答系统,为实现农作物智能化、精细化种植的无人/在线指导提供技术支撑。
互联网农业大数据的发展对信息检索的智能化与精准化的要求日益增高,以关键词匹配和文档排序为特点的传统搜索引擎的不足越来越明显:一是关键词匹配无法在语义上对用户的检索需求进行理解,对以自然语言形式给出的问句的检索效果不佳;二是传统搜索引擎的返回结果是数量较多的候选答案列表,需要用户进行二次检索。.针对这些问题,本项目首先结合互联网多源农业知识的自动挖掘,研究农业知识库和文本联合表示学习的关系优化模型,解决领域知识不足的问题;其次在农业问句分析中构建相应的组合函数提高文本组合的语义通用性,解决问句分类错误以及单一神经网络策略导致的语义偏差问题;最后研究多特征混合的农业知识推理和长文本答案的自动摘要生成方法,提高答案选择质量,提高复杂问句的回答能力。.具体来说,在问句分类方面,分别提出了基于信息熵权重和基于级联词向量卷积神经网络的方法,提高了问句分类的精度;在答案选择方面,分别提出了基于文本摘要和基于多层语义获取的方法,尤其针对农业领域非事实类问答中的长文本答案情况,研究了基于历史信息复用的长文本生成式自动摘要方法。在10000条问答对的对比实验中,当候选答案池的大小为100时,本项目提出的答案选择方法的准确率达到了66.2%,与基线系统相比最高提高了17.6个百分点。.此外,本项目面向问答系统的跨媒体应用需求,开展了跨媒体智能关键技术的前期探索,如农业图像理解、农业跨媒体知识图谱构建及应用等,并在此基础上获得了国家自然科学基金面上项目“基于跨媒体语义协同理解的农业知识演化与生成研究”的支持。.通过本项目的实施,构建了基于大数据深度语义表示学习的农业智能问答系统,为农作物病虫害诊断、智能化种植的在线指导提供必要的技术支撑。同时得益于后续项目的支持,有望进一步突破多源异构农业数据的语义统一表征与内容协同理解问题,提高跨媒体环境下的农业认知计算能力,为下一代智能农业技术产品和应用系统研发提供开放式的支撑环境。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
拥堵路网交通流均衡分配模型
卫生系统韧性研究概况及其展望
面向云工作流安全的任务调度方法
基于语义的农业多模态数据深度解析机制研究
基于深度学习框架的多媒体大数据表示学习
基于深度学习的异构数据低维非线性表示
基于图结构的数据表示和深度学习方法