基于多模态数据融合的短视频信息检索及推荐方法研究

基本信息
批准号:61802121
项目类别:青年科学基金项目
资助金额:25.00
负责人:曹达
学科分类:
依托单位:湖南大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:袁进,黄尚戎,朱贤益,伍湘琼,缪莲海,李海舟,胡旭东
关键词:
深度神经网络信息检索推荐算法多媒体技术表示学习
结项摘要

With the proliferation of micro-video platforms and the explosive growth of the number of micro-videos, users are overwhelmed by the huge volumes of data and cannot find their desired micro-videos. To alleviate the information overload problem, this project proposes the research on information retrieval and recommendation algorithms for micro-videos based on multi-modality fusion. First of all, this project proposes to utilize multi-view representation learning method to fuse the multi-modal data (i.e., image, audio, and text) contained in micro-video. Secondly, this project presents content-enhanced hashtag recommendation algorithm for micro-video, which utilizes the description of the hashtag in social media as hashtag's content. Based on the micro-video's hashtags, the functions of search, browse, and classification can be realized. Moreover, based on micro-video's sequential feature of both content and browse behavior, this project proposes to conduct personalized recommendation by utilizing distance calculation. Lastly, aiming at making use of the micro-video's cross-platform sharing feature, this project proposes to construct the connection between user profile and micro-video to achieve personalized recommendation results. This project can substantially propel the research and application of information retrieval and recommendation method for micro-video, and provide content distribution and access services for developers, consumers, and platforms.

随着短视频平台的快速崛起以及短视频数量的爆发式增长,用户已经淹没在了海量的数据中,而无法获取真正所需的短视频内容。为了缓解短视频的信息过载问题,本项目提出基于多模态数据融合的短视频信息检索及推荐方法研究。首先,针对短视频包含图像、音频、文本等多模态数据的特点,提出利用多视图表示学习方法对短视频多模态数据进行融合。其次,利用社交媒体对短视频标签内容的描述,提出标签内容增强的短视频标签推荐算法,进而实现搜索、浏览、分类等信息检索功能。再次,考虑到短视频具有内容序列化、用户浏览序列化的特点,提出基于距离计算的方法对短视频进行个性化推荐。最后,针对短视频跨平台分享的特点,提出构建用户画像与短视频之间的关联关系,实现跨社交媒体平台的个性化短视频推荐方法。本项目将有力地推动短视频信息检索及推荐方法的研究及应用,为短视频内容生产者、短视频内容消费者、短视频平台提供有效的内容分发及获取服务。

项目摘要

面对短视频资源的不断增加以及用户对短视频的精准获取需求,如何对短视频进行有效检索已经成为学术界与工业界广泛关注的一个问题。项目以文本、图像、视频为载体,研究基于多模态数据融合的短视频信息检索及推荐方法,具体而言包括1)跨模态视频片段检索;2)跨模态菜谱检索;3)多模态数据融合与检索。跨模态视频片段检索旨在解决应用自然语言查询语句,从一个完整的长视频中检索出所对应的视频片段。具体而言,项目提出了基于时空强化学习的视频片段检索、基于对抗学习的排序与定位融合的视频片段检索、基于多模态关系图的视频片段检索等方法。跨模态菜谱检索主要解决面向菜谱领域的视频、图像、文本的互相检索问题。具体而言,本项目提出了基于并行注意力机制与循环注意力机制的跨模态菜谱检索、基于强化学习的文本与视频对齐的跨模态菜谱检索、基于并行注意力机制与交叉注意力机制的跨模态菜谱检索等方法。多模态数据融合与检索任务旨在应用视频、图像、音频、本文等多模态数据解决具体实际应用问题。具体而言,项目提出了基于多模态数据融合的短视频标签推荐、基于多模态数据融合的产品标题压缩等方法。项目针对各项子任务分别收集了大规模数据集,并在此基础上进行了实验验证,实验结果证明了所设计方法的有效性与可行性。本项目将有力地推动短视频信息检索及推荐方法的研究及应用,为短视频的理解与推广提供理论基础。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于铁路客流分配的旅客列车开行方案调整方法

基于铁路客流分配的旅客列车开行方案调整方法

DOI:
发表时间:2021
2

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
3

新型树启发式搜索算法的机器人路径规划

新型树启发式搜索算法的机器人路径规划

DOI:10.3778/j.issn.1002-8331.1903-0411
发表时间:2020
4

"多对多"模式下GEO卫星在轨加注任务规划

"多对多"模式下GEO卫星在轨加注任务规划

DOI:10.19328/j.cnki.2096-8655.2022.02.002
发表时间:2022
5

信息熵-保真度联合度量函数的单幅图像去雾方法

信息熵-保真度联合度量函数的单幅图像去雾方法

DOI:10.3724/SP.J.1089.2019.17435
发表时间:2019

曹达的其他基金

相似国自然基金

1

基于多模态数据融合的短视频品牌信息检索和品牌联想挖掘方法研究

批准号:61902093
批准年份:2019
负责人:漆舒汉
学科分类:F0211
资助金额:25.00
项目类别:青年科学基金项目
2

基于多模态表征学习的时尚数据检索与推荐算法研究

批准号:61802100
批准年份:2018
负责人:顾晓玲
学科分类:F0210
资助金额:27.00
项目类别:青年科学基金项目
3

基于多示例学习的多模态信息表达与推荐方法研究

批准号:71201120
批准年份:2012
负责人:袁汉宁
学科分类:G0112
资助金额:22.00
项目类别:青年科学基金项目
4

基于多模态信息深度语义融合的个性化音乐推荐模型研究

批准号:61771196
批准年份:2017
负责人:陈宁
学科分类:F0113
资助金额:62.00
项目类别:面上项目