融合概率图模型与深度学习的图像序列分类

基本信息

批准号：61702486

项目类别：青年科学基金项目

资助金额：25.00

负责人：杨双

学科分类：

依托单位：中国科学院计算技术研究所

批准年份：2017

结题年份：2020

起止时间：2018-01-01 - 2020-12-31

项目状态：已结题

项目参与者：曾加贝,张楠,张杰,邬书哲,何振梁,胡蓝青,马宇昊,时学鹏,张刚

关键词：

深度学习概率图模型计算机视觉图像序列分类

结项摘要

With the rapid development of information technology, there is a huge increase in the number of sequential images. An automatic analysis of these big image-sequence data has becoming an urgent problem recently. Considering the special characteristics of the big image-sequence data, including the imbalance in the distribution of data scale and quality, the common existence of noisy samples, non-linear property and so on, this project will study on probabilistic graphical models and deep learning methods to make them jointly learning in a unified framework for high-accuracy image sequence classification. Specifically, this project will first construct a locally joint-learning mechanism in the level of each individual image in the sequence to improve the representation power of the model, which is helpful to ease the problems caused by noisy samples and imbalance distributions. Then, adaptive learning with non-parametric methods is studied to improve the flexibility of the model. Finally, a unified learning framework for joint learning of the probabilistic graphical models and deep learning methods is proposed to obtain a robust representation and classification of the sequence. This project is expected to bring new thoughts to the related theory development and to make a breakthrough to key technologies, which is important and meaningful to give a powerful impetus to the development of related theories and technologies.

近年来随着信息技术的高速发展，图像序列数据急剧增多，对这些数据进行自动智能的分析逐渐成为一个迫切需要解决的热点问题。针对当下图像序列数据普遍存在的分布不均、噪声样本混杂、高度非线性、数据复杂度不一等问题，本项目将以概率图模型理论与深度学习为基础，研究两者的联合学习方法以实现这两类方法的优势互补，弥补各自的短板问题，进而实现高精度高信度的图像序列分类。具体来说，首先，将研究概率图模型与深度学习方法在序列中图像个体层面的局部协同学习，提高模型对图像个体的表达能力，缓解序列中的高噪声问题与分布不均问题；然后，进一步研究基于序列整体模式的非参数自适应分类方法，提高模型的灵活性与对数据的自适应能力；最后，设计统一的联合学习框架，实现概率图模型与深度学习的协同表达与分类，进而实现对复杂图像序列的鲁棒分类。本项目预期取得重要理论创新与关键技术突破，促进图像序列分类的相关研究与应用进展。

项目摘要

本项目围绕图像序列分析问题展开研究。近些年来，得益于相关大规模数据集以及深度学习的发展，基于计算机视觉的图像分析技术发展的如火如荼，而对图像序列进行分析的技术因其所存在的困难以及相关数据集的匮乏而发展的相对较慢。但另一方面，随着近些年来相关移动设备和存储技术等的进步，图像序列数据急剧增加，如何对这些数据进行快速、准确、鲁棒的智能分析已成为一个迫切需要解决的问题。图像序列分析问题的发展相对缓慢离不开该问题自身所具有的难点，主要包括序列中每个时刻空域运动模式的分析、序列中不同帧间在时域上的运动模式分析、序列整体表达的语义模式与各个时刻所表达的局部模式的矛盾与关联三个关键问题。本项目中以唇语图像序列的识别问题为代表，展开了一系列研究，主要内容可以概括为两个方面：图像序列中在图像帧个体层面的局部协同表示的研究工作和基于图像序列整体语义模式的建模方法的研究工作。具体来说，本项目从多个角度、多个层面和多个粒度展开研究，提出了一系列行之有效的新方法，包括提出了一种基于伪卷积的优化策略，将图像序列分类的评价指标与优化损失融合，实现了对评价指标的直接优化；提出了一种基于全局互信息与局部互信息相协同的图像序列分类方法，并在已有数据集上实现了比较好的实验结果，验证了方法的有效性；提出了一种基于图像序列内部图像帧之间的相对运动特性来建模的方法，并在多个不同数据集上验证了方法的有效性等。综合来说，在本项目研究内容的导向下，在本项目的支持下，项目组发布了第一个大规模的中文词级唇语识别数据集，发表了7篇高水平学术论文，参加国际竞赛1项，并获第二名的好成绩，为图像序列分析领域的发展贡献了新力量。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.3778/j.issn.1002-8331.1911-0012

发表时间：2020

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：2020

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.16383/j.aas.c180673

发表时间：2021

杨双的其他基金

批准号：51902185

批准年份：2019

资助金额：26.00

项目类别：青年科学基金项目

相似国自然基金

深度概率图模型的学习与推理预测

批准号：61573266

批准年份：2015

负责人：杨有龙

学科分类：F0603

资助金额：66.00

项目类别：面上项目

多尺度概率图模型与SAR图像分类的研究

批准号：60872064

批准年份：2008

负责人：温显斌

学科分类：F0113

资助金额：25.00

项目类别：面上项目

融合稀疏表示与深度学习的图像分类技术研究

批准号：61303154

批准年份：2013

负责人：张淳杰

学科分类：F0605

资助金额：28.00

项目类别：青年科学基金项目

面向图像序列的深度学习理论与方法

批准号：61532009

批准年份：2015

负责人：刘青山

学科分类：F06

资助金额：290.00

项目类别：重点项目

融合概率图模型与深度学习的图像序列分类

{{i.achievement_title}}

暂无此项成果

其他相关文献

针对弱边缘信息的左心室图像分割算法

一种基于多层设计空间缩减策略的近似高维优化方法

基于多色集合理论的医院异常工作流处理建模

基于改进LinkNet的寒旱区遥感图像河流识别方法

二维FM系统的同时故障检测与控制

杨双的其他基金

钙钛矿太阳能电池界面结构调控及其光、热稳定性研究

相似国自然基金