面向复杂查询的异质媒体搜索理论与方法

基本信息
批准号:61732008
项目类别:重点项目
资助金额:310.00
负责人:刘奕群
学科分类:
依托单位:清华大学
批准年份:2017
结题年份:2022
起止时间:2018-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:汪萌,李小红,钱学明,刘知远,栾焕博,吴乐,顿玉洁,贺丽君,陈大鹏
关键词:
检索模型结果排序异质媒体查询处理
结项摘要

With the development of search engine technology, traditional search engine has evolved from a Web information portal to one of the most important sources of various information and knowledge in human society. The application scenario of search engine has transformed from desktop computers to pervasive computing devices. The information resources have transformed from homogeneous textual content to multi-model heterogeneous content. The expression of search intent has transformed from keyword-based mechanism to personalized complex interactions. This evolution leads to serious technical challenges for the future development of search engine technologies, which also makes it necessary to focus on a new kind of search service that support complex search requests on heterogeneous contents and pervasive devices. To shed light on this research question, this project aims to focus on the understanding of multi-modal complex queries, the indexing of multi-modal media content, the ranking strategy of heterogeneous information sources. With these efforts, we try to improve search performance and users’ effectiveness of information access processes. We also hope to help future search engines to evolved into value-added knowledge service providers.

随着搜索技术的发展,搜索引擎逐渐从传统的互联网信息门户演化成为整合获取人类社会各种信息与知识的主要渠道之一。搜索应用场景逐渐迁移到普适泛在的设备环境;搜索信息资源逐渐迁移到多模态异质媒体内容;搜索用户需求表达逐渐迁移到个性化的复杂交互方式。这种演化对搜索技术的未来发展提出了新的挑战,也使得一种能够支持“泛在环境下”的“复杂查询”和“异质搜索”的新型搜索服务成为必要的技术研究方向。针对这一挑战性问题,本项目拟针对多模态复杂查询的需求理解、跨模态搜索对象的关联索引、异质媒体数据的聚合排序等技术内容开展深入研究,提出新的理论与方法,解决包括多模态查询和信息资源的统一表示、泛在搜索场景下的用户意图理解、基于有噪音训练信息的深度排序学习等关键科学问题。提升搜索引擎的检索效果与用户获取信息的效率,引领新一代搜索技术朝着知识增值服务的方向发展。

项目摘要

随着搜索技术的发展,搜索引擎逐渐从传统的互联网信息门户演化成为整合获取人类社会各种信息与知识的主要渠道之一。搜索应用场景逐渐迁移到普适泛在的设备环境;搜索信息资源逐渐迁移到多模态异质媒体内容;搜索用户需求表达逐渐迁移到个性化的复杂交互方式。这种演化对搜索技术的未来发展提出了新的挑战,也使得一种能够支持“泛在环境下”的“复杂查询”和“异质搜索”的新型搜索服务成为必要的技术研究方向。针对这一挑战性问题,本项目针对多模态复杂查询的需求理解,跨模态搜索对象的关联索引、异质媒体数据的聚合排序等技术内容开展深入研究,提出了新的理论与方法,解决了多模态查询和信息资源的统一表示、泛在搜索场景下的用户意图理解和基于有噪音训练信息的深度排序学习等关键科学问题。本项目的相关工作在信息检索领域得到了广泛认可。在学术方面,本项目在相关领域的国际顶级会议和期刊上共发表论文一百余篇,先后获得了AIRS 2018最佳论文奖、CIKM 2018最佳论文奖、SIGIR 2018最佳短文提名奖、ICTIR 2019最佳短文提名奖、SIGIR 2020最佳论文提名奖和WSDM 2022最佳论文奖。在工业界的实际应用方面,项目研究成果在搜狗搜索引擎核心排序模块中得到应用,显著的提高了搜狗搜索引擎的搜索结果排序性能,并顺利应用于腾讯新闻搜索、知乎内容检索、微信搜一搜等系统,提升了用户体验并且创造了巨大的社会价值和经济效益。项目负责人作为第一完成人获得“2020年钱伟长中文信息处理科学技术奖一等奖”。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
3

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018

刘奕群的其他基金

批准号:60903107
批准年份:2009
资助金额:19.00
项目类别:青年科学基金项目

相似国自然基金

1

面向复杂查询的异质媒体搜索理论与方法研究

批准号:61732004
批准年份:2017
负责人:王晓阳
学科分类:F0211
资助金额:270.00
项目类别:重点项目
2

基于复杂查询类型的多媒体检索

批准号:61502157
批准年份:2015
负责人:袁进
学科分类:F0211
资助金额:21.00
项目类别:青年科学基金项目
3

面向互联网的跨媒体挖掘与搜索引擎

批准号:90920303
批准年份:2009
负责人:庄越挺
学科分类:F0603
资助金额:280.00
项目类别:重大研究计划
4

面向云数据高级查询的可搜索加密模型与关键技术研究

批准号:61672195
批准年份:2016
负责人:贾小华
学科分类:F0207
资助金额:63.00
项目类别:面上项目