基于排序学习和深度学习的专利检索研究

基本信息
批准号:61602078
项目类别:青年科学基金项目
资助金额:20.00
负责人:许侃
学科分类:
依托单位:大连理工大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:林原,刘盛博,刘文飞,徐博,王琳,田利云,费鹏
关键词:
检索模型结果排序排序算法相关性反馈检索排序
结项摘要

Patent is the world’s largest technical information source. Patent retrieval is an important method to obtain knowledge from massive patent documents and understand dynamic technology, and it can be used to enhance the value in use of patent greatly. The purpose of project is to establish patent retrieval model from various angles, such as query expansion, retrieval model and method fusion by integrated use of information retrieval, data mining and machine learning. This project is to focus on the method of query expansion based on different sources of information, the application of different retrieval methods to different text domain according to the difference of patent text domain, and the establishment of patent retrieval model based on deep learning for text domain such as abstract, and the integration of retrieval results of multiple text domains. This project is to integrate various proposed methods based on ranking learning method, add quality factors of patent in the process of model training, and improve accuracy of patent retrieval and user satisfaction of return results. The research is to aim at semantic retrieval technology based on text representation, query comprehension, query reconstruction and text similarity measurement to develop a method of patent retrieval based on ranking learning and deep learning, and provide a reliable study mode for patent retrieval.

专利是世界上最大的技术信息源,专利检索是当今从海量专利文献中获取知识,了解技术动态的重要手段,能够极大地提升专利的利用价值。项目的宗旨是:综合运用信息检索、文本挖掘和机器学习方法,从查询扩展、检索模型、方法融合等多个角度,进行专利检索模型的构建。重点研究基于不同信息源的查询扩展方法;针对专利文本域的内容差异性,对于不同的文本域采用不同检索方法;针对专利中的摘要等文本域构建基于深度学习的检索模型,对多个文本域的检索结果进行融合;采用排序学习方法对于提出的多种方法进行融合,在模型训练过程中加入专利的质量因素,提高专利检索准确率以及用户对于返回结果的满意度。本研究为以语义检索技术为目标,以文本表示、查询理解、查询重构、文本相似度计算等为基础,构建基于排序学习和深度学习的专利检索方法,为专利检索提供一个可靠的研究思路。

项目摘要

专利是当今世界最重要的知识产权,而专利检索是对于专利进行获取和分析的重要基础。面向专利检索的排序学习方法、深度学习方法和信息检索方法的研究,是项目研究的重要途径。通过排序学习模型的构建和深度学习方法的应用为专利检索方法的研究提供的新的方向,能够有效的提高信息检索任务的准确率。本项目的研究对于信息检索的研究以及知识产权有效运用都有着重要的意义。本项目从组排序学习理论和应用两个方面展开研究。. 理论研究方面,一是检索模型方面,对于组排序学习方法展开研究,基于排序学习方法融合的研究思路,提出了两种融合框架:特征层次融合框架FGFIREM和损失函数层次融合框架,使用不同的方案融合损失函数以提高排序性能。二是,查询处理方面,应用深度学习等方法优化查询扩展过程,进而有效的提高扩展词的性能。检索模型和查询扩展的相关研究奠定专利检索研究的理论基础。. 应用研究方面,一是专利检索方面的研究,采用语义资源、词向量表示、排序学习和查询扩展等方法对于已有的专利检索任务进行优化,实验证明所提出的方法能够有效的提高检索性能。二是排序学习方法在查询扩展方法中的应用,采用排序学习模型选择查询扩展词,能够有效的优化查询扩展过程,生物医学和社交媒体等相关任务应用的实验结果显示了所提出方法的有效性。. 基于项目的研究工作,发表及录用学术论文16篇,其中SCI检索论文7篇,EI检索论文2篇,CSSCI检索论文1篇,北大中文核心期刊论文6篇。软件著作权2项。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
5

货币政策与汇率制度对国际收支的影响研究

货币政策与汇率制度对国际收支的影响研究

DOI:
发表时间:2022

许侃的其他基金

相似国自然基金

1

基于强化学习的信息检索排序模型研究

批准号:61872338
批准年份:2018
负责人:徐君
学科分类:F0211
资助金额:62.00
项目类别:面上项目
2

运用排序和相似度学习进行基于区域的图像检索研究

批准号:61363046
批准年份:2013
负责人:黄伟
学科分类:F0210
资助金额:45.00
项目类别:地区科学基金项目
3

信息检索中基于损失函数优化的排序学习研究

批准号:60673009
批准年份:2006
负责人:黄亚楼
学科分类:F0210
资助金额:26.00
项目类别:面上项目
4

基于深度学习的跨模态检索方法研究

批准号:61902347
批准年份:2019
负责人:董建锋
学科分类:F0211
资助金额:26.00
项目类别:青年科学基金项目