Search result ranking is one of the major concerns in search engine researches and click model construction which aims at improving ranking performance with the help of implicit relevance feedback information contained in click-through logs has been paid much attention. However, most existing click models assume that all search results should be homogeneous and are therefore not able to deal with search results in rich media formats or containing interaction functions. In contrast to the prevailing approaches, we proposed a different click model construction framework by taking the differences in result presentation, user preference and query information need into consideration. By collecting and analyzing both large-scale user behavior data and eye-tracking data, we plan to look into the practical information acquistion process of search users and extract behavior features to describe the heterogeneous nature of click-through behavior. After that, a learning based scheme would be adopted to provide relevance feedback results to improve ranking performance of commercial search engines.
结果排序技术是搜索引擎技术研究中的核心问题,而建立用户点击行为模型, 挖掘纷繁复杂的用户行为数据中蕴含的隐式相关性反馈信息则是这一技术问题的重要进展 方向。面对搜索结果中广泛存在的富媒体展现形式和多模态交互方式,以各搜索结果展现形 式相同为主要前提的同质性假设不再成立,这使得当前绝大多数点击模型在真实搜索应用环 境中受到越来越大的挑战。与传统点击模型构建方式不同,本项目提出应当基于海量规模用 户行为日志数据和眼动实验数据进行分析挖掘,对搜索引擎用户交互过程中客观存在的结果 展现形式、用户行为偏好和查询需求类型方面的异质特性进行深入分析与模型特征提取。在 此基础上,更加全面的描述用户点击行为,协助搜索引擎构建具有异质性描述能力的点击模 型,并借助机器学习方法实现对搜索结果相关性的估计,以更好的提升搜索引擎的结果排序 性能。
结果排序技术是搜索引擎技术研究中的核心问题。用户点击模型通过对用户与搜 索引擎交互过程的模型化描述,从海量规模用户行为挖掘隐式反馈信息并提升结果排序性能。面对搜索结果中广泛存在的富媒体展现形式和多模态交互方式,以各搜索结果展现形式相同为主要前提的同质性假设不再成立,这使得当前绝大多数点击模型在真实搜索应用环境中受到越来越大的挑战。因此,本课题对搜索引擎结果展现、用户行为和查询需 求方面的异质特性进行深入分析,进而构建具有异质性描述能力的点击模型,以协助搜索引擎更好的利用群体智慧达到服务互联网用户的目的。..在自然科学基金的支持下,项目负责人及研究小组顺利完成原计划开展的各项研究工作,基于用户行为数据和眼动实验数据,对搜索引擎用户交互过程中客观存在的结果 展现形式、用户行为偏好和查询需求类型方面的异质特性进行深入分析与模型特征提取。在此基础上,构建了基于视觉显著性特征的检验预测模型,基于鼠标移动行为的满意度自动评估模型,引入时间信息的点击模型,引入鼠标移动信息的点击模型,适用于图片搜索的用户行为模型和适用于移动搜索的点击模型等一系列具有异质性描述能力的用户行为模型。并借助机器学习方法,实现对搜索结果相关性的估计。相关研究成果加深对用户与搜索系统交互过程的认识,极大的扩展了传统点击模型的应用范围,有效的提升了搜索引擎的结果排序性能。..研究成果发表在SIGIR,TOIS,CIKM,WWW,IJCAI,IRJ等信息检索、人工智能和网络应用领域高水平会议和期刊上。相关成果共发表论文19篇,其中包含CCF A类论文10篇,CCF B类论文5篇,并曾获得CIKM 2018最佳论文奖,SIGIR 2015最佳论文提名奖和AIRS 2016最佳论文提名奖。相关研究成果获得2015年北京市科学技术一等奖。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
涡度相关技术及其在陆地生态系统通量研究中的应用
跨社交网络用户对齐技术综述
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
面向新一代搜索引擎的用户动机推演模型的研究
面向搜索引擎的用户个性化查询意图分析
面向移动终端的基于用户点击与深度神经网络的图像排序算法研究
面向高准确率语音转写的用户反馈学习与识别结果优化