Analysis of web query intents is an important research topic in Web Information Retrieval, which plays a crucial role for improving the performance of search engines and user searching experience. However, there is little attention paid to the individual information in previous research work. Therefore, this work proposes a query intent analysis framework by incorporating personal information. Specifically, our approach focuses on: 1) modeling query intents by utilizing personal information as features, which aim to identify specific query intents for each individual user. 2) Query intent identifing and mining methods based on user naturally annotated Web resources. The proposed approaches could both indentify query intents in a macro view and automatically mine fine-grained query intents. 3) Topic model based personalized search framework, which can effectively learn user interests and improve the effectiveness of analyzing query intents. 4) Query classification algorithm based on URL topic, which could improve the efficiency of query classification and further be used as an important feature for identifying query intents. 5) Retrieval results cluster algorithm based on identifying query intents, specifically, the algorithm can cluster researching results and present them according to identified personalized query intents, which would effectively improve the user search efficiency.
查询意图分析是信息检索研究中一个非常重要的课题,对于改善搜索引擎性能以及用户搜索体验有着十分重要的作用。然而在当前的查询意图分析研究中,用户个性化信息并没有得到充分利用。为此本项目提出了一种融合用户个性化信息的查询意图分析方法。具体地,本方法包含以下几个主要方面:(1)提出了在查询意图分析模型中使用用户个性化信息作为特征,旨在使查询意图分析的结果体现出不同用户的差异性;(2) 提出了基于用户自然标注资源的共性查询意图识别与挖掘方法,即能识别宏观的用户查询意图,又可自动挖掘细粒度的查询意图;(3)提出了基于话题模型的个性化用户检索兴趣建模方法,可以更好的学习用户模型,改善查询意图分析的效果;(4)将查询类别信息作为查询意图识别的重要特征加以利用,并提出了基于URL的查询分类算法,可以极大提高查询分类的效率;(5)将本项目提出的查询意图分析方法应用于检索结果聚类,即围绕多种不同的查询意图对搜索
搜索引擎成为人们从互联网上快速获取信息的最主要途径之一。当前的搜索引擎主要基于关键字匹配的搜索模式。然而用户输入的查询往往较短,导致查询具有多种语义或包含有多个子主题。本课题专注于信息类查询的意图表示、识别与应用。特别地,从查询表层字符信息上升到主题层面,采取不同的主题形式来形式化地表示查询背后的搜索意图,从多个角度理解查询意图,并基于查询意图提供新颖的搜索服务与搜索模式。..本课题的主要贡献可概括如下:..(1)针对查询歧义问题,以主题类别表示查询意图,将查询映射到给定的主题类别体系中,即将查询意图识别归结为查询主题分类问题。本课题提出一种基于用户自动标注资源的查询主题分类方法。仅需要很少的人工参与,却可以获得海量的有主题标注的查询,基于有标注的查询得以训练基于统计的查询分类器。方法改善了查询分类缺少标注查询的数据稀疏问题,不仅分类准确率高而且具有较高在线处理效率,可以应用于多种查询意图识别相关的应用场景。..(2)针对查询宽泛问题,以一组查询子主题表示查询意图。查询子主题不依赖于预先指定的类别体系,能够在更细致的层面对查询意图进行刻划,是对查询主题分类的补充。本课题分析了从各个信息源中抽取的查询子主题候选的特点,并应用适于任务需要的聚类算法。实验表明,提出的方法获得了比商业搜索引擎相关搜索更好的性能。..(3)针对查询意图与用户相关的问题,以用户主题兴趣表示查询意图,从用户个人兴趣的角度个性化地表示查询意图。为了更准确地判断每一位用户具体的查询意图需要考察用户背景与兴趣等个人信息。本课题基于概率主题模型对用户搜索历史进行建模,建立用户的主题兴趣模型,将用户查询依据其与用户历史兴趣的相关性映射到用户主题兴趣模型之中,实现个性化的查询意图识别。据我们所知,这是首次将基于主题模型的用户建模与个性化搜索相结合的工作。..因此,基于主题的查询意图识别研究对搜索引擎具有以下的促进作用:(1)构建用户的信息需求结构空间,结构化地组织信息,有效地帮助用户清晰地了解相关信息结构,明确自身搜索目的;(2)丰富搜索引擎的搜索模式,提高搜索质量,准确且迅速地满足用户的信息需求。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于分形L系统的水稻根系建模方法研究
跨社交网络用户对齐技术综述
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
面向微博的地理兴趣点抽取及其用户行为意图分析研究
面向用户意图的行为轨迹搜索与推荐系统
面向相关性反馈的搜索引擎用户点击模型研究
查询语义分析驱动的多层次交互式查询意图识别技术研究