The linguistic diversity apparent in information resources on the web combined with the limitation of languages mastered by ordinary web users, hinder full access to the wealth of multi-channel information that is available. Cross-language information retrieval has become a essential approach to resolving this contradiction. Despite this, current studies give limited consideration to users' multilingual interests, and therefore may not be able to achieve high accuracy and personalized result presentation. To solve these problems, this project intends to combine personalized information retrieval and cross-language information retrieval, exploring related technologies to improve personalized multilingual search accuracy and user satisfaction. The main research that will be conducted in this project includes: a hybrid method based on probabilistic topic models for granular multilingual user interest model building; a semi-supervised machine learning method based on word graphs for query translation and expansion; a structured analysis technique based on semantic extraction for personalized results ranking and optimization. Lastly, we verify the effectiveness of the proposed methods through experimentation with the theories and algorithms which are developed in addition to the implementation of a prototype system.
网络上信息资源表达语言的多样性与普通网络用户个体所掌握语言的局限性,阻碍了人们对多渠道信息的充分获取。跨语言信息检索已成为解决这一矛盾的必要方法。但目前跨语言信息检索相关研究尚未能较好地考虑用户的兴趣偏好,因此难以获得高置信度以及个性化呈现的跨语言信息检索结果。针对这一问题,本项目拟结合跨语言信息检索和个性化信息检索技术,探讨提高跨语言信息检索准确率和用户满意度的方法。项目将具体研究基于概率主题模型的混合建模方法以构建粒度级多语言用户兴趣模型;基于词图网络的半监督机器学习方法以翻译和扩展查询词;基于语义抽取的结构化分析技术以个性化排序和优化搜索结果;最后通过对所提出的理论与算法进行实验测试和系统原型的实现来验证所提方法的效能。
网络上信息资源表达语言的多样性与普通网络用户个体所掌握语言的局限性, 阻碍了人们对多渠道信息的充分获取。跨语言信息检索已成为解决这一矛盾的必要方法。但目前跨语言信息检索相关研究尚未能较好地考虑用户的兴趣偏好, 因此难以获得高置信度以及个性化呈现的跨语言信息检索结果。针对这一问题,本项目结合跨语言信息检索和个性化信息检索技术,探讨提高跨语言信息检索准确率和用户满意度的方法。主要包括适用于个性化跨语言信息检索的用户兴趣模型表现形式研究、基于语义网络的增强用户兴趣模型、基于主题的个性化查询扩展方法、基于隐含语义和外部语义的检索结果重排序方法以及基于协同过滤和矩阵分解的搜索结果优化方法等。本项目中关键技术的攻克,大大提高了跨语言信息检索系统的搜索准确率和用户满意程度,在信息检索理论和技术上取得了一定的突破,为进一步地实际应用推广奠定了基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
粗颗粒土的静止土压力系数非线性分析与计算方法
拥堵路网交通流均衡分配模型
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
中国参与全球价值链的环境效应分析
面向资源不对等语言对的个性化深度跨语言信息检索研究
基于双语文档反馈的跨语言信息检索研究
信息检索中基于用户检索历史挖掘的个性化查询自动补全方法研究
基于互连网络环境的汉英跨语言信息检索研究