面向复杂查询的异质媒体搜索理论与方法研究

基本信息
批准号:61732004
项目类别:重点项目
资助金额:270.00
负责人:王晓阳
学科分类:
依托单位:复旦大学
批准年份:2017
结题年份:2022
起止时间:2018-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:贾焰,汪卫,李爱平,韩琥,金城,肖仰华,何震瀛,阚美娜,黄九鸣
关键词:
搜索意图建模知识图谱语义融合跨媒体搜索分布式高效检索
结项摘要

Over the past few years, the area of search engine has witnessed the development of keyword search, entity search, unstructured data search, and vertical search, meeting the ever-increasing needs of search for information. The next breakthrough may very well be in the heterogeneous media search, through a comprehensive use of multiple media information types to effectively answer complex queries. This project builds on the research results on a variety of search techniques, and focuses on an increased use of semantic information at various points during the search process. The search queries themselves may be expressed in a cross-media form, and the search objects combine many different media types. In this way, the search technology becomes broader, deeper, and smarter. The key research questions addressed in this project include (1) how to bridge the high-level semantics in the search queries and the low-level semantics needed to find the search objects, (2) how to extract useful semantic features for specific search queries from the unstructured data, (3) how to collaboratively analyze the cross media data for semantic information, as well as (4) how to efficiently perform the search on massive amounts of data. The projects uses four components in its approaches, namely (1) knowledge graph to support cross-media semantic knowledge integration, (2) semantic templates to support intelligent query decomposition and transformation, (3) demand-driven heterogeneous media analysis to deepen the semantic mining for specific cross media queries, and (4) cloud computing architecture to support fast search and knowledge extraction. The project is expected to gain insights in complex query understanding and cross media mining of semantic information, resulting in innovative theories and methods. With Baidu’s participation, the project expects to put the theories and methods to practical tests to build a solid basis for future wide-spread adoption of complex heterogeneous media search tasks.

近年来,搜索技术经历了关键词搜索、实体搜索、非结构化数据搜索以及垂直搜索等,满足不断提升的搜索需求。异质媒体搜索综合利用异质媒体的交叉信息,解答复杂查询,可能是搜索技术的下一突破口。本项目建立在各类搜索研究成果的基础上,更多地利用语义层面的信息,支持搜索问题本身及搜索对象的跨媒体化,加强搜索的广度、深度和智能程度。所涉及的关健科学问题包括搜索层高语义到操作层低语义的转化,非结构化数据面向个性化搜索的语义特征抽取,跨媒体数据的协同语义分析,以及大规模数据的高效搜索。在研究方法上,以知识图谱为知识组织方法,用于跨媒体语义综合;以语义模版做为基础构件,实现智能化查询分解及转化;以异质媒体搜索需求为驱动,深化媒体个性化交叉语义挖掘;以云计算构架,实现快速知识抽取及搜索。项目预期在复杂查询理解、语义知识交叉挖掘利用等方面提出创新性理论和方法,并与百度公司合作,为异质媒体复杂搜索的理论与实践奠定基础。

项目摘要

近年来,搜索技术经历了关键词搜索、实体搜索、非结构化数据搜索以及垂直搜索等,以满足不断提升的搜索需求。异质媒体搜索综合利用异质媒体的交叉信息,解答复杂查询,探索搜索技术的下一突破口。本项目建立在各类搜索研究成果的基础上,更多地利用语义层面的信息,支持搜索问题本身及搜索对象的跨媒体化,加强搜索的广度、深度和智能程度。所涉及的关健科学问题包括搜索层高语义到操作层低语义的转化,非结构化数据面向个性化搜索的语义特征抽取,跨媒体数据的协同语义分析,以及大规模数据的高效搜索。在研究方法上,以知识图谱为知识组织方法,用于跨媒体语义综合;以语义模版做为基础构件,实现智能化查询分解及转化;以异质媒体搜索需求为驱动,深化媒体个性化交叉语义挖掘;以云计算构架,实现快速知识抽取及搜索。在研究成果方面,项目在异质媒体处理和分析、知识获取和知识库构建、快速搜索方面形成了一系列创新型成果,在国内外权威会议和期刊上累计发表高水平学术论文*篇,开发了一个异质媒体的搜索系统原型,并将科学研究成果应用于新浪新闻和微博的基于搜索的异质媒体聚合系统中。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成

DOI:10.3724/ SP.J.1123.2019.04013
发表时间:2019
3

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017

王晓阳的其他基金

批准号:81500528
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:31701495
批准年份:2017
资助金额:20.00
项目类别:青年科学基金项目
批准号:61370080
批准年份:2013
资助金额:75.00
项目类别:面上项目

相似国自然基金

1

面向复杂查询的异质媒体搜索理论与方法

批准号:61732008
批准年份:2017
负责人:刘奕群
学科分类:F0211
资助金额:310.00
项目类别:重点项目
2

基于复杂查询类型的多媒体检索

批准号:61502157
批准年份:2015
负责人:袁进
学科分类:F0211
资助金额:21.00
项目类别:青年科学基金项目
3

面向互联网的跨媒体挖掘与搜索引擎

批准号:90920303
批准年份:2009
负责人:庄越挺
学科分类:F0603
资助金额:280.00
项目类别:重大研究计划
4

面向云数据高级查询的可搜索加密模型与关键技术研究

批准号:61672195
批准年份:2016
负责人:贾小华
学科分类:F0207
资助金额:63.00
项目类别:面上项目