跨媒体的语义挖掘与深度关联建模方法研究

基本信息
批准号:61702466
项目类别:青年科学基金项目
资助金额:25.00
负责人:花妍
学科分类:
依托单位:中国传媒大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:史萍,潘达,钟地秀,沙源,曾䶮,仇紫荷
关键词:
跨媒体检索深度学习语义网络特征学习关联建模
结项摘要

Along with the age of big data, demands for cross-media applications are roaring with the explosive growth of multi-media content, such as text, image and video. The massiveness, heterogeneity, numerous semantic categories and complex relationships of cross-media data make them difficult to be analyzed and understood. Traditional methods focused on simple semantics and single media cannot adapt to deal with large-scale heterogeneous data. The project starts from studying abundant semantic information existed in cross-media data, and it mainly contains the following three parts. (1) Since the cross-media semantics are ignored by existing researchers, we study the semantics in massive data, the relations between cross-media and building the structured semantic network. (2) To deal with the semantic gap caused by the deficiency of feature representations, we explore feature processing unit applied for media characters and study hierarchy semantic feature learning based on deep models. (3) To deal with diversity and complex semantics of the heterogeneous media data, we construct the adaptive correlation learning model for cross-media, study the semantically consistent distance measurement, and do research on an end-to-end cross-media retrieval system with deep feature learning and correlation learning.

随着网络大数据时代的来临,文本、图像、视频等多媒体内容呈现爆炸式的增长,人们对跨媒体应用的需求也日益增加。海量性、异质性、种类繁多、关系复杂等特点对跨媒体数据的智能分析造成了困难,传统的专注于简单语义和单一媒体的研究思路已不能满足大规模异构数据分析的需求。本项目以跨媒体数据中蕴含的丰富语义信息为研究切入点,拟从三个方面展开:1)现有工作中跨媒体的语义研究匮乏,本项目拟从海量数据中充分挖掘语义信息,研究跨媒体语义相关性,构建结构化的语义网络;2)特征表达能力不足是造成语义鸿沟的关键问题,本项目探索适用于不同媒体特性的特征处理单元,研究基于深度学习模型的层次化语义特征学习机制;3)针对异构媒体数据多样化、语义复杂性等特点,构建自适应的跨媒体关联模型,学习具有语义一致的跨媒体距离度量,研究特征学习和关联建模于一体的端到端的跨媒体检索系统。

项目摘要

随着网络大数据时代的来临,文本、图像、视频等多媒体内容呈现爆炸式的增长,人们对跨媒体应用的需求也日益增加。海量性、异质性、种类繁多、关系复杂等特点对跨媒体数据的智能分析造成了困难,传统的专注于简单语义和单一媒体的研究思路已不能满足大规模异构数据分析的需求。本项目以跨媒体数据中蕴含的丰富语义信息为研究切入点,主要研究内容包含以下三方面:1)现有工作中跨媒体的语义研究匮乏,主要利用监督信息中的分类信息或者一一对应的跨模态关系,本项目研究了多模态层次化的语义关系对于检索性能的提升;2)特征表达能力不足是造成语义鸿沟的关键问题,本项目研究适用于不同媒体特性的特征处理单元,研究了基于深度学习模型的图像和文本特征学习机制;3)学习具有语义一致的跨媒体距离度量,研究了特征学习和关联建模于一体的端到端跨媒体检索系统。在研究过程中,针对复杂语义关系,通过双向三重态损失函数建立同类和不同类跨模态数据的距离排序关系,或者通过多模态数据的多类别标签向量建立多尺度的相似关系,与已有方法相比,所提语义关系建模方法对于跨模态检索的性能有显著提升。针对特征表达,本项目研究了基于现有深度学习结构的跨模态网络结构,为图像和文本设计了特征学习模块,通过跨模态对抗学习提升特征表达的能力。并联合语义约束关系和特征学习模块,构建端到端的多媒体检索系统,以此从原始数据中提取可被直接比较多模态样本之间距离/相似度的特征表达,在多个数据集上验证了所研究方法对于检索性能的提升。总的来说,本项目的工作丰富了语义关系和特征学习在多媒体/跨模态检索中的研究,为检索和深度学习领域的应用研究提供了新的思路,具有一定的应用前景。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
3

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015

花妍的其他基金

相似国自然基金

1

融合多模态文本关联分析与挖掘的跨媒体社会图像检索方法研究

批准号:61572140
批准年份:2015
负责人:张玥杰
学科分类:F0211
资助金额:64.00
项目类别:面上项目
2

文摘创新点挖掘的语义识别与关联发现方法研究

批准号:71673213
批准年份:2016
负责人:温浩
学科分类:G0414
资助金额:31.00
项目类别:面上项目
3

基于跨媒体语义关联模型的图像检索技术研究

批准号:61305047
批准年份:2013
负责人:秦曾昌
学科分类:F0604
资助金额:25.00
项目类别:青年科学基金项目
4

基于语义概念深度挖掘的视频复杂事件检测方法研究

批准号:61672268
批准年份:2016
负责人:詹永照
学科分类:F0210
资助金额:63.00
项目类别:面上项目