基于多任务概率视觉语义模型的图像场景理解

基本信息

批准号：61301192

项目类别：青年科学基金项目

资助金额：25.00

负责人：魏巍

学科分类：

依托单位：西北工业大学

批准年份：2013

结题年份：2016

起止时间：2014-01-01 - 2016-12-31

项目状态：已结题

项目参与者：张蓬,张秀伟,张海超,任越美,张臻,张磊,巩东,孟庆洁,屈冰欣

关键词：

半监督学习图像场景理解概率图模型大数据视觉语义

结项摘要

The explosive growth of network images and the metadata describing the semantic meaning of those images provides an opportunity to reduce the "semantic gap". But the characteristics of metadata, such as type diversity, asymmetry, noisy and dispersion, restrict the applicability of traditional scene understanding methods to network images. Considering the characteristic of the metadata, a probabilistic graphical model based on the semantics of objects is constructed in this project to understand the images. First, a hierarchical semantivisual structure is build to organize the target metadata, which will act as a prior knowledge of the graphic model to guide the formation of semantics of objects. Then a multi-task probabilistic graphical model is constructed associating different types of target metadata by considering the tasks of image segmentation, classification and annotation jointly. In addition, the multi-task model establishes the relationship between low-level image features and high-level scene content. A semi-supervised learning method is further incorporated into the model parameter learning process to deal with the asymmetric metadata, which improves the generalization ability of the learned graphic model. This project uses the metadata effectively in a unified probabilistic graphical model from these three aspects, which establish the connection between low-level image features and image scene semantics based on object semantics.The research achievements will provide the theoretical and technical basis for complex scene understanding, information management of mass images and robotics.

互联网上的图像呈爆炸性增长，更多的网络图像及描述图像语义的元数据为降低"语义鸿沟"提供了有力支撑。但元数据具有类型多样、不对称、含噪及分散等特点，这限制了传统图像理解方法在网络图像上的应用。为此，本课题针对元数据的特点，构建基于目标语义的概率图模型实现图像场景理解。首先构建层次化视觉语义结构来组织分散的目标元数据，以此作为概率图先验，指导目标语义的生成；设计联合图像分割、分类及标注于一体的多任务概率图模型结构，以此来关联不同类型的目标元数据，并建立图像低层特征与图像场景语义的联系；引入半监督的学习方法，以此作为概率图模型的参数学习算法以处理不完备的元数据，并提高模型的泛化性能。本项目从上述三方面将元数据的有效使用纳入到一个统一的概率图模型中，基于目标语义更好的建立低层图像特征与图像场景语义间的连接，研究成果为复杂场景下的图像理解、海量图像信息管理以及机器人等技术的发展提供理论和技术支持。

项目摘要

图像理解旨在让计算机能够像人类一样分析和理解真实世界中的图像，通过获取图像中包含的语义信息，完成分类、识别、检测和检索等任务。概率语义模型方法常用于图像理解，其中视觉语义先验、概率语义模型构建以及模型推理算法等是概率语义模型方法的关键内容。本项目即针对上述关键内容开展研究，按计划要点和预定指标分别研究了图像的语义特征提取及词袋表示、图像的结构性先验建模、多任务模型构建、概率图推理方法及鉴别性特征提取及分类等内容，并将这些方法应用于图像理解相关的任务如图像分类等。在理论创新方面，提出了一系列的新思想、新方法，在国内外主流学术期刊和会议上发表学术论文30余篇，包括计算机视觉与模式识别以及人工智能领域的顶级国际会议（CVPR 5篇，ICCV论文1篇，AAAI论文1篇，ECCV论文1篇），以及本领域的权威期刊(IEEE Trans. on Image Processing 2篇，IEEE Trans. on Geoscience and Remote Sensing 1篇，Pattern Recognition 2篇)。在关键技术方面，已申请专利10余项。项目组共培养博士生6名，硕士生5名。在基金的资助下多次邀请国内外同行专家来校交流，项目组成员也多次参加国际会议，就本项目与同行专家进行了充分的讨论和交流，给项目组成员带来了新的思路和新的视野并激发了项目组钻研学术的热情，为项目组的深入研究、内容扩展和项目的顺利实施奠定了良好的基础。成功协助举办了2014 IEEE橘色技术国际会议，提升了项目组在该领域的知名度。本项目的部分研究成果应用于“多源图像协同分析洪水冰凌监测技术及应用”技术中，获得2016年度陕西省科技进步一等奖(项目负责人排名第7)。研究成果为复杂场景下的图像理解、海量图像信息管理以及机器人等技术的发展提供理论和技术支持。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.3778/j.issn.1002-8331.1911-0012

发表时间：2020

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：2020

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.19328/j.cnki.2096-8655.2022.02.002

发表时间：2022

魏巍的其他基金

批准号：61303008

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：51872170

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：61671385

批准年份：2016

资助金额：60.00

项目类别：面上项目

批准号：31200596

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：51602245

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：51108006

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：41503068

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：61905045

批准年份：2019

资助金额：23.00

项目类别：青年科学基金项目

批准号：50905016

批准年份：2009

资助金额：20.00

项目类别：青年科学基金项目

批准号：51205010

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：21903034

批准年份：2019

资助金额：26.00

项目类别：青年科学基金项目

批准号：11005131

批准年份：2010

资助金额：24.00

项目类别：青年科学基金项目

批准号：51478017

批准年份：2014

资助金额：80.00

项目类别：面上项目

批准号：51678007

批准年份：2016

资助金额：62.00

项目类别：面上项目

批准号：61602197

批准年份：2016

资助金额：21.00

项目类别：青年科学基金项目

批准号：61772323

批准年份：2017

资助金额：63.00

项目类别：面上项目

批准号：41303081

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：31570795

批准年份：2015

资助金额：65.00

项目类别：面上项目

批准号：11602263

批准年份：2016

资助金额：22.00

项目类别：青年科学基金项目

批准号：11404187

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：41802176

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：11601423

批准年份：2016

资助金额：19.00

项目类别：青年科学基金项目

批准号：31770543

批准年份：2017

资助金额：60.00

项目类别：面上项目

批准号：51475041

批准年份：2014

资助金额：83.00

项目类别：面上项目

批准号：51808477

批准年份：2018

资助金额：26.00

项目类别：青年科学基金项目

批准号：21607063

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：51675028

批准年份：2016

资助金额：63.00

项目类别：面上项目

相似国自然基金

基于动态多模态多任务学习的视觉场景理解方法研究

批准号：61773375

批准年份：2017

负责人：张兆翔

学科分类：F0604

资助金额：64.00

项目类别：面上项目

基于图像语义理解的场景三维恢复

批准号：61872023

批准年份：2018

负责人：周忠

学科分类：F0209

资助金额：66.00

项目类别：面上项目

基于视觉和语义的室内场景理解与实时建模

批准号：61632006

批准年份：2016

负责人：尹宝才

学科分类：F0209

资助金额：265.00

项目类别：重点项目

基于稀疏概率图模型的高分辨率遥感影像场景语义理解方法研究

批准号：41771385

批准年份：2017

负责人：钟燕飞

学科分类：D0113

资助金额：63.00

项目类别：面上项目

基于多任务概率视觉语义模型的图像场景理解

{{i.achievement_title}}

暂无此项成果

其他相关文献

针对弱边缘信息的左心室图像分割算法

一种基于多层设计空间缩减策略的近似高维优化方法

基于多色集合理论的医院异常工作流处理建模

基于改进LinkNet的寒旱区遥感图像河流识别方法

"多对多"模式下GEO卫星在轨加注任务规划

魏巍的其他基金

混合数据多粒度粗糙计算模型与算法研究

TMDCs vdW异质结构层间激子效应

基于空谱稀疏结构自适应学习的高光谱图像压缩感知重构方法研究

基于Fosmid基因组文库及转录组分析的甾体降解基因簇的挖掘与表达调控

纤维素诱导组装电化学剥离石墨烯气凝胶材料及其钠离子存贮性能研究

无组织面源挥发性有机物(VOCs)排放特征反演测试方法研究

氮素肥料诱导黑土脱氮过程及其微生物群落结构和功能研究

基于三维金属混合衬底结构的低阈值亚波长近红外纳米线激光器的研究

提高车用液力元件功率密度的叶栅系统设计理论研究

面向复杂装备的稳健产品平台设计方法及其应用研究

激发态芳香性的表征新方法及其在环烯烃中的应用

端粒DNA损伤修复机制对重离子诱导肿瘤细胞凋亡的调控作用

石化行业高活性VOC排放对城市O3和大气氧化性的影响研究

京津冀区域人为源挥发性有机物（VOC）排放清单化学物种分布与校验

微博社交网络中主题专家搜索关键技术研究

面向高维数据的粒计算理论与方法

低分子量有机酸对纳米羟基磷灰石固定铅的影响及机理

基于Pgrac启动子突变文库筛选及元件组装的芽孢杆菌精细调控表达系统的研究

轴流压气机叶片非整阶振动现象的流固耦合机理研究

硅烯与Ag表面的作用机理及其生长机制

湖相富火山组分的混积岩致密油储层的成岩、成储机理研究

基于调和分析方法的Lipschitz区域上椭圆型方程组的L^p预解式估计及相关问题的研究

不同盐渍土生态系统中主导反硝化作用的嗜盐古菌资源及其生态调控机制

基于两相流动的车用液力缓速器动态特性预测及控制技术研究

离子阻隔型胶囊状吸附剂的制备及其分离液相中铂钯的机理研究

纳米晶嵌入式生物质碳基气凝胶的构筑及其吸附-光催化协同去除水体中氟喹诺酮抗生素的机制研究

多元特性驱动的产品族柔性化设计方法研究

相似国自然基金