基于视感知的图像视频语义获取关键技术研究

基本信息

批准号：60903141

项目类别：青年科学基金项目

资助金额：17.00

负责人：施智平

学科分类：

依托单位：首都师范大学

批准年份：2009

结题年份：2012

起止时间：2010-01-01 - 2012-12-31

项目状态：已结题

项目参与者：胡宏,李志清,李志欣,刘曦,王晓峰,王竹晓,谭庆,叶飞

关键词：

粒度特征捆绑图像视频稀疏编码语义获取

结项摘要

为了让计算机能够像人一样快速而准确地识别物体理解图像需要借鉴生物视觉系统的信息处理机制。本项目瞄准视觉信息的语义理解这一前沿课题，借鉴生物感知系统的信息处理机制，研究图像视频数据的特征编码和语义获取的新理论和新方法，促进生物视觉和机器视觉的交叉研究。主要研究内容包括：研究基于结构相似度的稀疏编码模型从而提取富含结构信息和语义信息的视觉感知特征，有效支持图像视频的语义获取；深入研究生物视觉识别的特征捆绑计算模型，提出融合多个部位多种特征的物体识别方法；针对图像视频数据在视觉特征空间的复杂分布特性，研究基于粒度空间模型的语义映射方法，提高语义分类准确率；研究自顶向下的上下文提示信息和自底向上的视觉感知驱动相结合的图像视频语义获取方法，有效地缩小语义鸿沟。最后，基于本项目研究成果开发一个图像视频语义标注与检索原型系统。

项目摘要

本项目瞄准视觉信息的语义理解这一前沿课题，借鉴生物感知系统的信息处理机制，研究图像视频数据的特征编码和语义获取的新理论和新方法。.提出了基于结构相似度的稀疏编码模型以及视觉特征提取和表示方法，得到结构信息保持良好的编码特征；提出融合两类线性鉴别分析的方法来提取低维的优化鉴别特征，显著提高图像检索的速度和语义准确率，发表在Multimedia Tools and Application。.提出了图像语义自动标注方法：提出融合语义主题的图像自动标注方法PLSA-FUSION、连续视觉特征的图像语义标注模型GM-PLSA、混合生成式和判别式模型的图像语义标注方法HGDM，实验结果令人鼓舞。成果发表在Journal of Visual Communication and Image Representation、Pattern Recognition Letters等期刊。.基于上下文的物体识别和图像分类方法：基于Bayesian Linking Field 模型的思想提出了一种物体识别方法，可以显著改善图像中的物体识别率。提出结合1阶特征和上下文相关2阶特征的物体识别方法，利用不同特征的共现相关性提高识别准确率，在Google图像集上的实验证明了算法的有效性，成果发表在Visual Computer期刊上；提出基于半监督学习的多标签图像分类算法，学习中考虑类别相关性，提高分类正确率，成果发表在ACM MM10；提出利用稀疏编码和判别测度学习的基于行为的人物识别方法，发表在 ACM MM12。.提出多种新颖的分类和聚类算法，为多媒体语义提取提供理论支持。基于进化规划的FCMBP模糊聚类改进方法(Computers and Mathematics with Applications)；挖掘多个领域之间个性与共性的文本分类方法——协同对偶PLSA (IEEE TKDE)；解决半定义分类问题的无约束生成的主题建模方法(ICDM 2010)；解决多模型合并问题――基于PLSA模型的合并算法(IJCAI2011)；称为ADA的自适应关联分类方法，该方法可以是关联分类器以增量形式进行分类学习(Expert Systems with Applications)。.开发了跨媒体智能检索系统（CMIRS），可以实现对图像视频内容的语义理解、专题生成及检索、实现语义概念与图像、视频的双向检索。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.11834/jrs.20209060

发表时间：2020

DOI：

发表时间：2022

DOI：10.3864/j.issn.0578-1752.2019.03.004

发表时间：2019

DOI：10.3964/j.issn.1000-0593(2022)09-2956-07

发表时间：2022

DOI：10.16265/j.cnki.issn1003-3033.2019.01.002

发表时间：2019

施智平的其他基金

批准号：61876111

批准年份：2018

资助金额：62.00

项目类别：面上项目

批准号：61170304

批准年份：2011

资助金额：52.00

项目类别：面上项目

批准号：61472468

批准年份：2014

资助金额：62.00

项目类别：面上项目

相似国自然基金

无人车多视视频信息获取与定位关键技术

批准号：61871038

批准年份：2018

负责人：马楠

学科分类：F0117

资助金额：67.00

项目类别：面上项目

基于压缩感知理论的图像/视频编解码技术研究

批准号：60973056

批准年份：2009

负责人：施云惠

学科分类：F0210

资助金额：31.00

项目类别：面上项目

视频复杂语义分析关键技术研究

批准号：61272393

批准年份：2012

负责人：汪萌

学科分类：F0210

资助金额：81.00

项目类别：面上项目

基于视觉感知模型的视频编码关键技术研究

批准号：61573037

批准年份：2015

负责人：徐迈

学科分类：F0609

资助金额：66.00

项目类别：面上项目

基于视感知的图像视频语义获取关键技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

内点最大化与冗余点控制的小型无人机遥感图像配准

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

空气电晕放电发展过程的特征发射光谱分析与放电识别

人工智能技术在矿工不安全行为识别中的融合应用

施智平的其他基金

拉格朗日动力学形式化及其在机器人验证中的应用

希尔伯特空间以及矩阵理论在HOL4中的形式化

机器人运动学形式化分析及其算法验证

相似国自然基金