为了让计算机能够像人一样快速而准确地识别物体理解图像需要借鉴生物视觉系统的信息处理机制。本项目瞄准视觉信息的语义理解这一前沿课题,借鉴生物感知系统的信息处理机制,研究图像视频数据的特征编码和语义获取的新理论和新方法,促进生物视觉和机器视觉的交叉研究。主要研究内容包括:研究基于结构相似度的稀疏编码模型从而提取富含结构信息和语义信息的视觉感知特征,有效支持图像视频的语义获取;深入研究生物视觉识别的特征捆绑计算模型,提出融合多个部位多种特征的物体识别方法;针对图像视频数据在视觉特征空间的复杂分布特性,研究基于粒度空间模型的语义映射方法,提高语义分类准确率;研究自顶向下的上下文提示信息和自底向上的视觉感知驱动相结合的图像视频语义获取方法,有效地缩小语义鸿沟。最后,基于本项目研究成果开发一个图像视频语义标注与检索原型系统。
本项目瞄准视觉信息的语义理解这一前沿课题,借鉴生物感知系统的信息处理机制,研究图像视频数据的特征编码和语义获取的新理论和新方法。.提出了基于结构相似度的稀疏编码模型以及视觉特征提取和表示方法,得到结构信息保持良好的编码特征;提出融合两类线性鉴别分析的方法来提取低维的优化鉴别特征,显著提高图像检索的速度和语义准确率,发表在Multimedia Tools and Application。.提出了图像语义自动标注方法:提出融合语义主题的图像自动标注方法PLSA-FUSION、连续视觉特征的图像语义标注模型GM-PLSA、混合生成式和判别式模型的图像语义标注方法HGDM,实验结果令人鼓舞。成果发表在Journal of Visual Communication and Image Representation、Pattern Recognition Letters等期刊。.基于上下文的物体识别和图像分类方法:基于Bayesian Linking Field 模型的思想提出了一种物体识别方法,可以显著改善图像中的物体识别率。提出结合1阶特征和上下文相关2阶特征的物体识别方法,利用不同特征的共现相关性提高识别准确率,在Google图像集上的实验证明了算法的有效性,成果发表在Visual Computer期刊上;提出基于半监督学习的多标签图像分类算法,学习中考虑类别相关性,提高分类正确率,成果发表在ACM MM10;提出利用稀疏编码和判别测度学习的基于行为的人物识别方法,发表在 ACM MM12。.提出多种新颖的分类和聚类算法,为多媒体语义提取提供理论支持。基于进化规划的FCMBP模糊聚类改进方法(Computers and Mathematics with Applications);挖掘多个领域之间个性与共性的文本分类方法——协同对偶PLSA (IEEE TKDE);解决半定义分类问题的无约束生成的主题建模方法(ICDM 2010);解决多模型合并问题――基于PLSA模型的合并算法(IJCAI2011);称为ADA的自适应关联分类方法,该方法可以是关联分类器以增量形式进行分类学习(Expert Systems with Applications)。.开发了跨媒体智能检索系统(CMIRS),可以实现对图像视频内容的语义理解、专题生成及检索、实现语义概念与图像、视频的双向检索。
{{i.achievement_title}}
数据更新时间:2023-05-31
内点最大化与冗余点控制的小型无人机遥感图像配准
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
空气电晕放电发展过程的特征发射光谱分析与放电识别
人工智能技术在矿工不安全行为识别中的融合应用
无人车多视视频信息获取与定位关键技术
基于压缩感知理论的图像/视频编解码技术研究
视频复杂语义分析关键技术研究
基于视觉感知模型的视频编码关键技术研究