图像语义自动文本描述技术研究

基本信息

批准号：61370157

项目类别：面上项目

资助金额：76.00

负责人：周向东

学科分类：

依托单位：复旦大学

批准年份：2013

结题年份：2017

起止时间：2014-01-01 - 2017-12-31

项目状态：已结题

项目参与者：谈子敬,何震瀛,产文,张明西,李俊娴,纪传俊,都金涛,白洁,林哲

关键词：

图像语义描述图像语义标注图像检索多媒体数据管理

结项摘要

With the proliferation of the Social Web, techniques of automatic image semantic description shows great potential in many novel Social Web applications, and has attracted increasing attentions and research interests. In this project, we will explore Web text corpus to harvest the image semantic knowledge and concept hierarchy, and based on these we will adapt the state-of-the-art statistical learning techniques,such as structural learning and sparse regularization, etc. to explore both of the lower visual image recognition and higher semantic exploration. Our research will focus on the theories and methods of automatic image description generation and image-text matching. Specifically, we will devote our main efforts in the following areas: semi-supervised image region annotation; Web text analysis based image language model and concept hierarchy construction; structural learning based image semantic text description generation; and image-text matching. The breakthroughs of the above researches will bring new theories and methods to the area of image semantic analysis and annotation, as well as play an important role in the development of the new applications of Social Web, such as multimedia Question-Answering and complex query of images and videos, etc.

随着社会Web的蓬勃发展，图像语义的自动文本描述技术在社会Web内容管理与检索方面具有广阔的应用前景，引起了越来越多的关注和研究兴趣。本课题将在充分发掘Web文本数据中蕴含的图像语义知识与概念体系的基础上，利用结构化学习及稀疏正则化等统计学习理论与方法，对基于底层视觉识别的图像标注与图像高层语义发掘进行深入研究。围绕图像语义的自动文本描述以及图像-文本语义匹配技术的理论与方法，重点开展基于半监督学习的图像局部区域语义标注，基于Web海量文本分析的图像描述语言模型和可视概念网络构建，基于结构化学习的图像语义自动文本描述，以及Web社区问答的图像增强等研究。上述研究的突破性成果将对Web多媒体问答式搜索，多媒体数据的复杂语义查询等新型应用发挥积极的促进作用。

项目摘要

本项目在语义上下文模型，稀疏正则化以及深度学习技术的基础上，对图像区域标注、图像语义的文本描述和Web社区问答检索等问题开展研究。主要代表性研究工作是提出了一种利用图像语义上下文来改进图像区域标注的方法；一种新的基于相似性深度网络的图像语义文本描述方法，一种新的基于层次分类的问题标签选取与cQA问题检索方法等。研究表明对语义上下文的挖掘是提高图像区域识别，以及图像复杂场景识别性能的重要途径。在基于深度网络的图像语义文本描述方面，相似性网络预训练以及增加网络隐层的深度对于提高系统性能具有重要意义。同时我们的研究还显示稀疏正则化的运用可以提高层次分类的性能，并提出了一种有效的自动标签获取技术。本项目同时还对迁移学习，跨领域图像分类，高维数据的可视化分析，Web社区产品评价数据的挖掘，高维时序数据的分析索引等问题开展了研究，并取得了一批研究成果。课题组共发表（已录用）EI/核心刊物论文14篇，包括CIKM，ICPR，PCM等重要国际会议论文多篇，培养博士毕业生1人，硕士毕业生6人。在项目的执行中，课题组参与承办了知名国际会议ACM CIKM 2014和其他国际学术会议和交流。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.3778/j.issn.1002-8331.1911-0012

发表时间：2020

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.3724/SP.J.1089.2019.17435

发表时间：2019

DOI：10.12005/orms.2019.0029

发表时间：2019

DOI：10.7544/issn1000-1239.2019.20190386

发表时间：2019

周向东的其他基金

批准号：31171346

批准年份：2011

资助金额：56.00

项目类别：面上项目

批准号：30470773

批准年份：2004

资助金额：22.00

项目类别：面上项目

批准号：60403018

批准年份：2004

资助金额：21.00

项目类别：青年科学基金项目

批准号：30770951

批准年份：2007

资助金额：30.00

项目类别：面上项目

批准号：81372500

批准年份：2013

资助金额：70.00

项目类别：面上项目

批准号：81071913

批准年份：2010

资助金额：30.00

项目类别：面上项目

批准号：81370111

批准年份：2013

资助金额：70.00

项目类别：面上项目

批准号：61073002

批准年份：2010

资助金额：32.00

项目类别：面上项目

批准号：60773077

批准年份：2007

资助金额：26.00

项目类别：面上项目

批准号：81070031

批准年份：2010

资助金额：33.00

项目类别：面上项目

批准号：30971308

批准年份：2009

资助金额：31.00

项目类别：面上项目

批准号：81660010

批准年份：2016

资助金额：36.00

项目类别：地区科学基金项目

批准号：30472078

批准年份：2004

资助金额：8.00

项目类别：面上项目

相似国自然基金

基于深度学习的图像文本描述自动生成方法研究

批准号：61806218

批准年份：2018

负责人：郭延明

学科分类：F0604

资助金额：19.00

项目类别：青年科学基金项目

基于颜色不变性描述的图像自动语义标注研究

批准号：60803072

批准年份：2008

负责人：郎丛妍

学科分类：F0210

资助金额：19.00

项目类别：青年科学基金项目

社会媒体中图像自动描述关键技术研究

批准号：61672402

批准年份：2016

负责人：牛振兴

学科分类：F0210

资助金额：62.00

项目类别：面上项目

草图的文本描述及其图像检索算法

批准号：61601042

批准年份：2016

负责人：齐勇刚

学科分类：F0113

资助金额：19.00

项目类别：青年科学基金项目

图像语义自动文本描述技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

针对弱边缘信息的左心室图像分割算法

基于改进LinkNet的寒旱区遥感图像河流识别方法

信息熵-保真度联合度量函数的单幅图像去雾方法

基于直觉模糊二元语义交互式群决策的技术创新项目选择

基于卷积神经网络的JPEG图像隐写分析参照图像生成方法

周向东的其他基金

节律性压力波维持气道上皮黏液层稳态的信号链接基础

CA916798基因在顺铂诱导的肺癌多药耐药中的作用研究

基于语言模型的图像数据库自动语义标注及多模式检索研究

芽孢毒素BoNT-LH(N)-Elafin融合表达对气道上皮细胞黏液分泌的靶位效应

雄激素经AR/PI3K/AKT通路调控CA916798参与肺腺癌发生的作用及机制研究

SHP2在顺铂诱导的肺癌多药耐药中的作用及其分子机制研究

拴链因子Exocyst复合物在慢性气道炎症中的促黏液分泌效应

基于语义上下文建模的图像语义分析技术研究

支持超平面查询的Web图像数据库索引及主动学习技术研究

气道冷敏元件TRPM8异构体转录调控机制及其促黏液分泌效应

CA916798基因通过PI3K/AKT通路参与顺铂耐药的机制研究

寒冷气候对PM2.5致呼吸道损害效应的影响及其相关分子背景

直接血管生成抑制剂—苔藓蒽噻吩及其类似物的设计合成

相似国自然基金