图像语义自动文本描述技术研究

基本信息
批准号:61370157
项目类别:面上项目
资助金额:76.00
负责人:周向东
学科分类:
依托单位:复旦大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:谈子敬,何震瀛,产文,张明西,李俊娴,纪传俊,都金涛,白洁,林哲
关键词:
图像语义描述图像语义标注图像检索多媒体数据管理
结项摘要

With the proliferation of the Social Web, techniques of automatic image semantic description shows great potential in many novel Social Web applications, and has attracted increasing attentions and research interests. In this project, we will explore Web text corpus to harvest the image semantic knowledge and concept hierarchy, and based on these we will adapt the state-of-the-art statistical learning techniques,such as structural learning and sparse regularization, etc. to explore both of the lower visual image recognition and higher semantic exploration. Our research will focus on the theories and methods of automatic image description generation and image-text matching. Specifically, we will devote our main efforts in the following areas: semi-supervised image region annotation; Web text analysis based image language model and concept hierarchy construction; structural learning based image semantic text description generation; and image-text matching. The breakthroughs of the above researches will bring new theories and methods to the area of image semantic analysis and annotation, as well as play an important role in the development of the new applications of Social Web, such as multimedia Question-Answering and complex query of images and videos, etc.

随着社会Web的蓬勃发展,图像语义的自动文本描述技术在社会Web内容管理与检索方面具有广阔的应用前景,引起了越来越多的关注和研究兴趣。本课题将在充分发掘Web文本数据中蕴含的图像语义知识与概念体系的基础上,利用结构化学习及稀疏正则化等统计学习理论与方法,对基于底层视觉识别的图像标注与图像高层语义发掘进行深入研究。围绕图像语义的自动文本描述以及图像-文本语义匹配技术的理论与方法,重点开展基于半监督学习的图像局部区域语义标注,基于Web海量文本分析的图像描述语言模型和可视概念网络构建,基于结构化学习的图像语义自动文本描述,以及Web社区问答的图像增强等研究。上述研究的突破性成果将对Web多媒体问答式搜索,多媒体数据的复杂语义查询等新型应用发挥积极的促进作用。

项目摘要

本项目在语义上下文模型,稀疏正则化以及深度学习技术的基础上,对图像区域标注、图像语义的文本描述和Web社区问答检索等问题开展研究。主要代表性研究工作是提出了一种利用图像语义上下文来改进图像区域标注的方法;一种新的基于相似性深度网络的图像语义文本描述方法,一种新的基于层次分类的问题标签选取与cQA问题检索方法等。研究表明对语义上下文的挖掘是提高图像区域识别,以及图像复杂场景识别性能的重要途径。在基于深度网络的图像语义文本描述方面,相似性网络预训练以及增加网络隐层的深度对于提高系统性能具有重要意义。同时我们的研究还显示稀疏正则化的运用可以提高层次分类的性能,并提出了一种有效的自动标签获取技术。本项目同时还对迁移学习, 跨领域图像分类,高维数据的可视化分析,Web社区产品评价数据的挖掘,高维时序数据的分析索引等问题开展了研究,并取得了一批研究成果。课题组共发表(已录用)EI/核心刊物论文14篇,包括CIKM,ICPR,PCM等重要国际会议论文多篇,培养博士毕业生1人,硕士毕业生6人。在项目的执行中,课题组参与承办了知名国际会议ACM CIKM 2014和其他国际学术会议和交流。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

平行图像:图像生成的一个新型理论框架

平行图像:图像生成的一个新型理论框架

DOI:10.16451/j.cnki.issn1003-6059.201707001
发表时间:2017
4

多媒体网络舆情危机监测指标体系构建研究

多媒体网络舆情危机监测指标体系构建研究

DOI:
发表时间:2017
5

基于关系对齐的汉语虚词抽象语义表示与分析

基于关系对齐的汉语虚词抽象语义表示与分析

DOI:
发表时间:2020

周向东的其他基金

批准号:31171346
批准年份:2011
资助金额:56.00
项目类别:面上项目
批准号:30470773
批准年份:2004
资助金额:22.00
项目类别:面上项目
批准号:60403018
批准年份:2004
资助金额:21.00
项目类别:青年科学基金项目
批准号:30770951
批准年份:2007
资助金额:30.00
项目类别:面上项目
批准号:81372500
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:81071913
批准年份:2010
资助金额:30.00
项目类别:面上项目
批准号:81370111
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:61073002
批准年份:2010
资助金额:32.00
项目类别:面上项目
批准号:60773077
批准年份:2007
资助金额:26.00
项目类别:面上项目
批准号:81070031
批准年份:2010
资助金额:33.00
项目类别:面上项目
批准号:30971308
批准年份:2009
资助金额:31.00
项目类别:面上项目
批准号:81660010
批准年份:2016
资助金额:36.00
项目类别:地区科学基金项目
批准号:30472078
批准年份:2004
资助金额:8.00
项目类别:面上项目

相似国自然基金

1

基于深度学习的图像文本描述自动生成方法研究

批准号:61806218
批准年份:2018
负责人:郭延明
学科分类:F0604
资助金额:19.00
项目类别:青年科学基金项目
2

基于颜色不变性描述的图像自动语义标注研究

批准号:60803072
批准年份:2008
负责人:郎丛妍
学科分类:F0210
资助金额:19.00
项目类别:青年科学基金项目
3

社会媒体中图像自动描述关键技术研究

批准号:61672402
批准年份:2016
负责人:牛振兴
学科分类:F0210
资助金额:62.00
项目类别:面上项目
4

草图的文本描述及其图像检索算法

批准号:61601042
批准年份:2016
负责人:齐勇刚
学科分类:F0113
资助金额:19.00
项目类别:青年科学基金项目