With the rapid growth of social media and network media, how to derive latent correlations between image semantics and visual features, and achieve automatic image annotation have always been hot topics for researchers. The problems of training data selection, automatic image feature expression, and image cluster modeling play crucial roles while performing automatic image annotation tasks. This project mainly focus on exploiting the principles and technologies of support vector clustering and deep learning to develop effective algorithms for automatic image annotation. The main objective is to solve the above three problems. The contents include the following aspects. 1) Research on training data selection methods based on support vector clustering. With these methods, moderate-scale training images with rich information can be selected from large-scale data sets. 2) Develop swarm intelligence algorithms to train deep learning neural networks, with which the visual features of images can be obtained automatically. 3) Research on developing one-cluster modeling methods based on support vector clustering, so that the images with the same semantic can be modeled in a unified model. 4) Research on developing image-semantic networks, with which the untagged images can be annotated automatically. The outcome of this project will provide more effective methods and techniques for annotating images with complex semantics, and provide theoretical and practical baselines for relative machine learning algorithms.
在社会化媒体与网络媒体广泛兴起的今天,如何获得图像语义与视觉特征的潜在关联来实现未知图像的自动标注一直是研究者们关注的热点问题。训练数据选取、自动图像特征表达和图像簇建模问题在对图像进行自动标注过程中起着关键作用。本项目将利用支持向量聚类算法和深度学习算法所包含的原理与技术,开发面向图像标注问题的有效算法。主要目标是解决上述三方面问题。其内容包括:1)研究基于支持向量的训练数据选取方法,从大规模图像集中获得规模适中并且信息丰富的训练数据;2)研究利用群智能算法训练深度学习网络,通过深度学习网络自动获取能够表达图像视觉信息的特征;3)开发基于支持向量的单数据簇描述算法,对包含相同语义的图像簇进行建模;4)建立图像-语义网络,通过网络对未知图像进行标注。本项目的研究成果,将为标注大规模、语义复杂的图像数据提供有效的方法和手段,并为相关机器学习算法的研究提供理论与实验依据。
在社会化媒体与网络媒体广泛兴起的今天,如何获得图像语义与视觉特征的潜在关联来实现未知图像的自动标注一直是研究者们关注的热点问题。训练数据选取、自动图像特征表达和图像簇建模问题在对图像进行自动标注过程中起着关键作用。本项目针对自动图像标注中底层视觉特征不能充分体现用户所理解的高层语义问题、训练数据类别不平衡问题、弱标记问题,提出了基于典型相关子空间和K最邻近的自动图像标注算法;针对传统的基于哈希的图像检索方法中检索精确度较低的问题,提出了基于分块哈希的图像检索算法;为优化训练高效深度学习网络以获得能够表达图像视觉信息的特征,给出了保证优化算法全局收敛的充分条件,即全局性假设条件和单调性假设条件。进而依据所提出的全局收敛的充分条件,提出了具有柯西随机和高斯随机性质的粒子群新算法。为进一步优化网络,提出了若干解决超高维优化问题的协同优化方法,并从理论上分析了他们收敛性与复杂性。提出了基于生成对抗网络的多视图学习与重构算法,通过生成式方法构建未知视图。提出了新型表征学习算法,使得同一实例的任意视图都能映射至相同的表征向量,并保证其包含实例的重构信息。提出了基于生成对抗网络的重构算法,在生成模型中加入表征信息,保证了生成视图数据与源视图相匹配。此外,为了对所提出的方法进行更广泛地测试,我们将所提出的不同预测学习算法分别应用于解决商务大数据集成挖掘问题、柔性车间作业调度问题、批量蛋白质同源性搜索问题、无线传感网络优化,以及车联网交叉路口自治车辆调度和车辆碰撞预警问题等。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于LASSO-SVMR模型城市生活需水量的预测
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
内点最大化与冗余点控制的小型无人机遥感图像配准
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于分形维数和支持向量机的串联电弧故障诊断方法
基于FPGA的深度学习算法自动优化与编译
基于深度学习和迁移学习的图像自动语义标注方法研究
用于临界热流密度预测的支持向量机深度学习研究
噪声环境下基于深度学习的图像自动标注方法研究