基于机器学习的相关反馈算法中若干关键问题研究

基本信息
批准号:61300117
项目类别:青年科学基金项目
资助金额:23.00
负责人:叶正
学科分类:
依托单位:杭州电子科技大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:任一支,朱圣代,虞抒沁,尧俊,徐小威
关键词:
文档质量评估排序学习相关反馈机器学习
结项摘要

Pseudo Relevance Feedback (PRF) is an effective technique for solving the term mismatching problem in Information Retrieval(IR). In traditional PRF models, the top K documents from the first-pass retrieval are assumed to be relevant. This assumption may cause: 1) when the quality of the feedback document set is low, noise will be brought in the reformulated query; 2) documents with different quality level are treated in the same way while they have different impact to PRF model in reality. In this research, we propose to use machine learning and web mining techniques to address the above problems. In particular, 1) we present a new assumption for PRF, and propose a quality-biased PRF retrieval framework; 2) we present a new topic-based assumption, and proposed a topic-based PRF model and query-related topic extraction models; 3) propose an external resource based PRF model to address the problem of low quality of feedback documents.

伪相关反馈是解决信息检索过程中词不匹配问题的有效手段,是提高信息检索准确率和召回率的关键技术之一。在传统基于查询扩展的伪相关反馈技术中,由于假设初次检索得到前K篇文档为相关文档,使得1)当初次检索返回文档集质量不高时,容易引入噪音;2)不同质量反馈文档无法区分对待。本课题重新审视伪相关反馈的基础假设,研究如何挖掘网络资源和使用机器学习技术来解决伪相关反馈中若干关键问题,进一步提高基于查询扩展的相关反馈技术的性能:1)引入新的基于质量偏重相关反馈假设,并提出面向相关反馈文档质量评估模型;2)引入新的基于主题相关反馈假设,并提出查询相关反馈主题提取算法;3)提出基于多种外部资源的反馈模型,解决首次查询精度较差时,反馈文档质量无法得到保证的问题。

项目摘要

伪相关反馈是解决信息检索过程中词不匹配问题的有效手段,是提高信息检索准确率和召回率的关键技术之一。在传统基于查询扩展的伪相关反馈技术中,由于假设初次检索得到前K篇文档为相关文档,使得1)当初次检索返回文档集质量不高时,容易引入噪音;2)不同质量反馈文档无法区分对待。本课题主要研究如何挖掘网络资源和使用机器学习技术进一步提高基于查询扩展的相关反馈技术的性能:1)引入新的基于质量偏重相关反馈假设,并提出面向相关反馈文档质量评估模型;2)引入新的基于主题相关反馈假设,并提出查询相关反馈主题提取算法;3)提出基于多种外部资源的反馈模型,解决首次查询精度较差时,反馈文档质量无法得到保证的问题。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
3

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

肉苁蓉种子质量评价及药材初加工研究

肉苁蓉种子质量评价及药材初加工研究

DOI:10.11842/wst.2017.02.019
发表时间:2017

叶正的其他基金

相似国自然基金

1

结构化机器学习若干关键问题研究

批准号:60973088
批准年份:2009
负责人:刘大有
学科分类:F0607
资助金额:32.00
项目类别:面上项目
2

基于局部特征的多视角学习算法若干关键问题的研究

批准号:61602296
批准年份:2016
负责人:朱昌明
学科分类:F0605
资助金额:20.00
项目类别:青年科学基金项目
3

多核学习若干关键问题研究

批准号:61272198
批准年份:2012
负责人:王喆
学科分类:F0605
资助金额:80.00
项目类别:面上项目
4

机器学习中的若干重要问题研究

批准号:60635030
批准年份:2006
负责人:周志华
学科分类:F0305
资助金额:190.00
项目类别:重点项目