Information retrieval is important to acquire knowledge and understand the world in the internet age today, and an essential issue in information retrieval is ranking. The group based ranking framework provides a new direction for learning to rank by the construction of loss function based on group sample, which can also improve the ranking performance of information retrieval. Current group ranking method is in theory research phase to be perfect. Faced with this situation, this project is based on group sample to research the theory and application of learning to rank. To theory research based on loss function of learning to rank, the group based ranking framework is improved by the research of loss function integration and directly optimizing information retrieval evaluation measures. To application the group based learning to rank approach is applied to the research fields such as query expansion and movie ranking. This project is effective to improve the research level of learning to rank, and provide new idea and theory for application of learning to rank.
信息检索是当今互联网时代获取知识、了解世界的重要手段,排序则是其研究的核心问题。针对排序进行优化的排序学习方法对于信息检索的研究以及互联网的发展都有着重要的意义。组排序学习方法通过组样本的损失函数构造为排序学习方法的研究提供的新的方向,能够有效的提高信息检索任务的准确率。当前组排序学习方法的研究正处于理论研究,亟待完善的阶段。针对这种情况,本项目从理论和应用两个方面展开研究。理论研究方面重点从排序学习方法损失函数构造入手改进已有的组样本排序学习方法,通过对多损失函数融合模型、直接优化评价方法的研究来完善组排序学习方法。应用研究方面主要将组排序学习方法的应用于查询扩展、电影排名预测等问题的研究。本项目的研究有助于提高排序学习方法的研究水平,为排序学习方法的应用提供新的思路与理论依据。
信息检索是当今互联网时代获取知识、了解世界的重要手段,排序则是其研究的核心问题。针对排序进行优化的排序学习方法对于信息检索的研究以及互联网的发展都有着重要的意义。组排序学习方法通过组样本的损失函数构造为排序学习方法的研究提供的新的方向,能够有效的提高信息检索任务的准确率。本项目从组排序学习理论和应用两个方面展开研究。. 理论研究方面,首先是基于神经网络方法的组排序学习方法的研究,采用相关性偏序关系交叉熵损失函数和似然损失函数的构造的最优序列的选择等方法对于组样本损失函数的性能进行改进;其次是直接优化信息检索评价方法的研究,提出一种基于位置优化的方法来代替已有的基于信息检索优化的方法。最后是多样本损失函数融合的研究,提出了一个损失函数融合框架,并且基于组排序方法损失函数,融合Pointwise、Pairwise和Listwise样本的损失函数,使用加权方案来结合不同类型的损失函数以提高排序性能。. 应用研究方面,首先是排序学习学方法在查询扩展中的应用分为三个研究内容。伪相关反馈词排序模型的研究;基于社会化标注的查询扩展方法;基于不同信息资源的专利查询扩展词选择方法,提高了查询扩展方法的性能。其次是排序学习方法在电影排名推荐的应用研究,基于BOX Office威电影媒体网站提取排名特征采用排序学习方法训练排名模型用于电影推荐任务。最后是生物医学文献检索的应用研究,基于组排序学习方法进行文档标注,该方法的初衷在于通过将同一查询下具有不同多样性的文档分组,实现面向多样性的文档排序模型的构建。. 基于项目的研究工作,发表及录用学术论文19篇,其中SCI刊源论文7篇,SCI检索论文5篇,EI检索论文6篇,CSSCI检索论文1篇,北大中文核心期刊论文2篇。
{{i.achievement_title}}
数据更新时间:2023-05-31
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
基于SSVEP 直接脑控机器人方向和速度研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
一种改进的多目标正余弦优化算法
大数据可信排序学习方法及其并行化研究
时空深度学习方法与应用
几个排序问题的研究及应用
排序主题模型及其应用研究