Pseudo Relevance Feedback (PRF) is an effective technique for solving the term mismatching problem in Information Retrieval(IR). In traditional PRF models, the top K documents from the first-pass retrieval are assumed to be relevant. This assumption may cause: 1) when the quality of the feedback document set is low, noise will be brought in the reformulated query; 2) documents with different quality level are treated in the same way while they have different impact to PRF model in reality. In this research, we propose to use machine learning and web mining techniques to address the above problems. In particular, 1) we present a new assumption for PRF, and propose a quality-biased PRF retrieval framework; 2) we present a new topic-based assumption, and proposed a topic-based PRF model and query-related topic extraction models; 3) propose an external resource based PRF model to address the problem of low quality of feedback documents.
伪相关反馈是解决信息检索过程中词不匹配问题的有效手段,是提高信息检索准确率和召回率的关键技术之一。在传统基于查询扩展的伪相关反馈技术中,由于假设初次检索得到前K篇文档为相关文档,使得1)当初次检索返回文档集质量不高时,容易引入噪音;2)不同质量反馈文档无法区分对待。本课题重新审视伪相关反馈的基础假设,研究如何挖掘网络资源和使用机器学习技术来解决伪相关反馈中若干关键问题,进一步提高基于查询扩展的相关反馈技术的性能:1)引入新的基于质量偏重相关反馈假设,并提出面向相关反馈文档质量评估模型;2)引入新的基于主题相关反馈假设,并提出查询相关反馈主题提取算法;3)提出基于多种外部资源的反馈模型,解决首次查询精度较差时,反馈文档质量无法得到保证的问题。
伪相关反馈是解决信息检索过程中词不匹配问题的有效手段,是提高信息检索准确率和召回率的关键技术之一。在传统基于查询扩展的伪相关反馈技术中,由于假设初次检索得到前K篇文档为相关文档,使得1)当初次检索返回文档集质量不高时,容易引入噪音;2)不同质量反馈文档无法区分对待。本课题主要研究如何挖掘网络资源和使用机器学习技术进一步提高基于查询扩展的相关反馈技术的性能:1)引入新的基于质量偏重相关反馈假设,并提出面向相关反馈文档质量评估模型;2)引入新的基于主题相关反馈假设,并提出查询相关反馈主题提取算法;3)提出基于多种外部资源的反馈模型,解决首次查询精度较差时,反馈文档质量无法得到保证的问题。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
肉苁蓉种子质量评价及药材初加工研究
结构化机器学习若干关键问题研究
基于局部特征的多视角学习算法若干关键问题的研究
多核学习若干关键问题研究
机器学习中的若干重要问题研究