面向相关性反馈的搜索引擎用户点击模型研究

基本信息
批准号:61472206
项目类别:面上项目
资助金额:87.00
负责人:马少平
学科分类:
依托单位:清华大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:刘奕群,王超,张永锋,罗成,张昊辰,毛佳昕,张辉
关键词:
相关反馈用户行为分析搜索引擎点击模型
结项摘要

Search result ranking is one of the major concerns in search engine researches and click model construction which aims at improving ranking performance with the help of implicit relevance feedback information contained in click-through logs has been paid much attention. However, most existing click models assume that all search results should be homogeneous and are therefore not able to deal with search results in rich media formats or containing interaction functions. In contrast to the prevailing approaches, we proposed a different click model construction framework by taking the differences in result presentation, user preference and query information need into consideration. By collecting and analyzing both large-scale user behavior data and eye-tracking data, we plan to look into the practical information acquistion process of search users and extract behavior features to describe the heterogeneous nature of click-through behavior. After that, a learning based scheme would be adopted to provide relevance feedback results to improve ranking performance of commercial search engines.

结果排序技术是搜索引擎技术研究中的核心问题,而建立用户点击行为模型, 挖掘纷繁复杂的用户行为数据中蕴含的隐式相关性反馈信息则是这一技术问题的重要进展 方向。面对搜索结果中广泛存在的富媒体展现形式和多模态交互方式,以各搜索结果展现形 式相同为主要前提的同质性假设不再成立,这使得当前绝大多数点击模型在真实搜索应用环 境中受到越来越大的挑战。与传统点击模型构建方式不同,本项目提出应当基于海量规模用 户行为日志数据和眼动实验数据进行分析挖掘,对搜索引擎用户交互过程中客观存在的结果 展现形式、用户行为偏好和查询需求类型方面的异质特性进行深入分析与模型特征提取。在 此基础上,更加全面的描述用户点击行为,协助搜索引擎构建具有异质性描述能力的点击模 型,并借助机器学习方法实现对搜索结果相关性的估计,以更好的提升搜索引擎的结果排序 性能。

项目摘要

结果排序技术是搜索引擎技术研究中的核心问题。用户点击模型通过对用户与搜 索引擎交互过程的模型化描述,从海量规模用户行为挖掘隐式反馈信息并提升结果排序性能。面对搜索结果中广泛存在的富媒体展现形式和多模态交互方式,以各搜索结果展现形式相同为主要前提的同质性假设不再成立,这使得当前绝大多数点击模型在真实搜索应用环境中受到越来越大的挑战。因此,本课题对搜索引擎结果展现、用户行为和查询需 求方面的异质特性进行深入分析,进而构建具有异质性描述能力的点击模型,以协助搜索引擎更好的利用群体智慧达到服务互联网用户的目的。..在自然科学基金的支持下,项目负责人及研究小组顺利完成原计划开展的各项研究工作,基于用户行为数据和眼动实验数据,对搜索引擎用户交互过程中客观存在的结果 展现形式、用户行为偏好和查询需求类型方面的异质特性进行深入分析与模型特征提取。在此基础上,构建了基于视觉显著性特征的检验预测模型,基于鼠标移动行为的满意度自动评估模型,引入时间信息的点击模型,引入鼠标移动信息的点击模型,适用于图片搜索的用户行为模型和适用于移动搜索的点击模型等一系列具有异质性描述能力的用户行为模型。并借助机器学习方法,实现对搜索结果相关性的估计。相关研究成果加深对用户与搜索系统交互过程的认识,极大的扩展了传统点击模型的应用范围,有效的提升了搜索引擎的结果排序性能。..研究成果发表在SIGIR,TOIS,CIKM,WWW,IJCAI,IRJ等信息检索、人工智能和网络应用领域高水平会议和期刊上。相关成果共发表论文19篇,其中包含CCF A类论文10篇,CCF B类论文5篇,并曾获得CIKM 2018最佳论文奖,SIGIR 2015最佳论文提名奖和AIRS 2016最佳论文提名奖。相关研究成果获得2015年北京市科学技术一等奖。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
3

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
4

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
5

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021

马少平的其他基金

批准号:61532011
批准年份:2015
资助金额:295.00
项目类别:重点项目
批准号:60223004
批准年份:2002
资助金额:100.00
项目类别:专项基金项目
批准号:69675004
批准年份:1996
资助金额:9.00
项目类别:面上项目

相似国自然基金

1

面向新一代搜索引擎的用户动机推演模型的研究

批准号:60573090
批准年份:2005
负责人:王大玲
学科分类:F0202
资助金额:22.00
项目类别:面上项目
2

面向搜索引擎的用户个性化查询意图分析

批准号:61202277
批准年份:2012
负责人:陈毅恒
学科分类:F0211
资助金额:22.00
项目类别:青年科学基金项目
3

面向移动终端的基于用户点击与深度神经网络的图像排序算法研究

批准号:61602136
批准年份:2016
负责人:谭敏
学科分类:F0605
资助金额:20.00
项目类别:青年科学基金项目
4

面向高准确率语音转写的用户反馈学习与识别结果优化

批准号:61202209
批准年份:2012
负责人:王向东
学科分类:F0209
资助金额:22.00
项目类别:青年科学基金项目