文本重排是信息检索中的一个关键阶段。它一般处于初次检索和查询扩展之间,目的是改进初次检索的质量,为后续的查询扩展提供较多的相关文本。本项目拟把文本重排形式化为一个分类问题、利用自动聚类或自动抽取关键词语产生伪标记文本、采用基于半指导学习的分类方法,以期在缺少标记文本的情况下,根据非标记文本之间的关系,获取尽多相关文本并提升其排名。本项目也拟研究如何评估文本序列的质量和如何利用篇章理论的话题和次话题等概念来认定相关文本,以期从计算理论上判断文本重排的必要性和从语言理论上检验文本重排的功效性。本项目的研究有助于提高查询扩展进而信息检索的质量,对及时获取各种信息包括安全信息、商业信息和生活信息有重要意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
EBPR工艺运行效果的主要影响因素及研究现状
基于铁路客流分配的旅客列车开行方案调整方法
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
信息熵-保真度联合度量函数的单幅图像去雾方法
现代优化理论与应用
并行系统上文本信息检索中的 Top-k问题研究
海量文本信息集合可视化呈现及可视化文本检索方法研究
对等网络环境下文本检索技术研究
面向短文本数据流的信息检索与信息过滤协同学习研究