社会媒体中图像自动描述关键技术研究

基本信息
批准号:61672402
项目类别:面上项目
资助金额:62.00
负责人:牛振兴
学科分类:
依托单位:西安电子科技大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:杨曦,王楠楠,颜建强,宗汝,郑昱,王海军,仇文亮,魏雪,吕鑫
关键词:
图像理解深度学习主题模型图像描述社交媒体
结项摘要

The goal of automatic image description/captioning in social media is to describe an image from a social network platform with a textual paragraph in natural language. In particular, it needs to describe what objects, scenes, activity are contained in images. It is a kind of high-level image understanding, and is the foundation of social media analysis and sentiment analysis. This project stems from general automatic image description, however, the special characteristic of social media is carefully considered, and hence our project contains: (1) object proposal discovery; (2) multimodal hierarchical embedding; (3) image set description; (4) image sequence description; (5) image emotion description and hot event detection and description. From the perspective of technology, our project is based on the popular probabilistic graph model and deep learning methods, and we will propose novel topic models, novel neural network, and learning algorithms. Our papers will be published on international important journal and top conference, and a system will be developed for demonstration.

社会媒体中的图像自动描述是用一段自然的文字对社交平台上的图像进行描述,包括图像中的目标、场景、动作、彼此间的相互关系等。它是社会媒体内容分析的高级阶段,是社会舆情分析的技术基础。本项目在一般图像自动描述前沿技术基础上,针对社会媒体的特有性质,拟开展以下几个方面的研究:(1)图像集合中潜在目标的发现;(2)多模态数据的层次化表示与嵌入;(3)图像集合的描述;(4)图像序列的描述;(5)图像情感的描述及热点事件全方位描述。其中,潜在目标发现、多模态层次化表示与嵌入是基础,然后从图像集合、图像序列、图像情感三个方面设计有针对性的嵌入约束和自动描述算法,并最终生成图像全方位描述。在技术路线设计上,本项目采用近年来流行的概率图模型和深度学习方法,并针对以上几个研究内容设计新的主题模型、神经网络结构、及学习算法。成果将发表在国际一流期刊、会议中,并通过开发应用演示系统进行可视化验证与展示。

项目摘要

社会媒体中的图像自动描述是用一段自然的文字对社交平台上的图像进行描述,包括图像中的目标、场景、动作、彼此间的相互关系等。它是社会媒体内容分析的高级阶段,是社会舆情分析的技术基础。本项目在一般图像自动描述前沿技术基础上,针对社会媒体的特有性质,拟开展以下几个方面的研究:(1)图像集合中潜在目标的发现;(2)多模态数据的层次化表示与嵌入;(3)图像集合的描述;(4)图像序列的描述;(5)图像情感的描述及热点事件全方位描述。其中,潜在目标发现、多模态层次化表示与嵌入是基础,然后从图像集合、图像序列、图像情感三个方面设计有针对性的嵌入约束和自动描述算法,并最终生成图像全方位描述。在技术路线设计上,本项目采用近年来流行的概率图模型和深度学习方法,并针对以上几个研究内容设计新的主题模型、神经网络结构、及学习算法。成果将发表在国际一流期刊、会议中,并通过开发应用演示系统进行可视化验证与展示。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
4

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

牛振兴的其他基金

批准号:61402348
批准年份:2014
资助金额:27.00
项目类别:青年科学基金项目

相似国自然基金

1

图像语义自动文本描述技术研究

批准号:61370157
批准年份:2013
负责人:周向东
学科分类:F0210
资助金额:76.00
项目类别:面上项目
2

基于社会媒体信息挖掘的图像语义理解关键技术研究

批准号:61103059
批准年份:2011
负责人:唐金辉
学科分类:F0209
资助金额:24.00
项目类别:青年科学基金项目
3

基于社会媒体信息挖掘的图像标注技术研究

批准号:61272214
批准年份:2012
负责人:孙福明
学科分类:F0209
资助金额:76.00
项目类别:面上项目
4

跨媒体语义医学图像检索中关键技术研究

批准号:60873185
批准年份:2008
负责人:吴洪
学科分类:F0210
资助金额:30.00
项目类别:面上项目