Patent is the world’s largest technical information source. Patent retrieval is an important method to obtain knowledge from massive patent documents and understand dynamic technology, and it can be used to enhance the value in use of patent greatly. The purpose of project is to establish patent retrieval model from various angles, such as query expansion, retrieval model and method fusion by integrated use of information retrieval, data mining and machine learning. This project is to focus on the method of query expansion based on different sources of information, the application of different retrieval methods to different text domain according to the difference of patent text domain, and the establishment of patent retrieval model based on deep learning for text domain such as abstract, and the integration of retrieval results of multiple text domains. This project is to integrate various proposed methods based on ranking learning method, add quality factors of patent in the process of model training, and improve accuracy of patent retrieval and user satisfaction of return results. The research is to aim at semantic retrieval technology based on text representation, query comprehension, query reconstruction and text similarity measurement to develop a method of patent retrieval based on ranking learning and deep learning, and provide a reliable study mode for patent retrieval.
专利是世界上最大的技术信息源,专利检索是当今从海量专利文献中获取知识,了解技术动态的重要手段,能够极大地提升专利的利用价值。项目的宗旨是:综合运用信息检索、文本挖掘和机器学习方法,从查询扩展、检索模型、方法融合等多个角度,进行专利检索模型的构建。重点研究基于不同信息源的查询扩展方法;针对专利文本域的内容差异性,对于不同的文本域采用不同检索方法;针对专利中的摘要等文本域构建基于深度学习的检索模型,对多个文本域的检索结果进行融合;采用排序学习方法对于提出的多种方法进行融合,在模型训练过程中加入专利的质量因素,提高专利检索准确率以及用户对于返回结果的满意度。本研究为以语义检索技术为目标,以文本表示、查询理解、查询重构、文本相似度计算等为基础,构建基于排序学习和深度学习的专利检索方法,为专利检索提供一个可靠的研究思路。
专利是当今世界最重要的知识产权,而专利检索是对于专利进行获取和分析的重要基础。面向专利检索的排序学习方法、深度学习方法和信息检索方法的研究,是项目研究的重要途径。通过排序学习模型的构建和深度学习方法的应用为专利检索方法的研究提供的新的方向,能够有效的提高信息检索任务的准确率。本项目的研究对于信息检索的研究以及知识产权有效运用都有着重要的意义。本项目从组排序学习理论和应用两个方面展开研究。. 理论研究方面,一是检索模型方面,对于组排序学习方法展开研究,基于排序学习方法融合的研究思路,提出了两种融合框架:特征层次融合框架FGFIREM和损失函数层次融合框架,使用不同的方案融合损失函数以提高排序性能。二是,查询处理方面,应用深度学习等方法优化查询扩展过程,进而有效的提高扩展词的性能。检索模型和查询扩展的相关研究奠定专利检索研究的理论基础。. 应用研究方面,一是专利检索方面的研究,采用语义资源、词向量表示、排序学习和查询扩展等方法对于已有的专利检索任务进行优化,实验证明所提出的方法能够有效的提高检索性能。二是排序学习方法在查询扩展方法中的应用,采用排序学习模型选择查询扩展词,能够有效的优化查询扩展过程,生物医学和社交媒体等相关任务应用的实验结果显示了所提出方法的有效性。. 基于项目的研究工作,发表及录用学术论文16篇,其中SCI检索论文7篇,EI检索论文2篇,CSSCI检索论文1篇,北大中文核心期刊论文6篇。软件著作权2项。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
货币政策与汇率制度对国际收支的影响研究
基于强化学习的信息检索排序模型研究
运用排序和相似度学习进行基于区域的图像检索研究
信息检索中基于损失函数优化的排序学习研究
基于深度学习的跨模态检索方法研究