In different applications of image understanding, the manual labeling of training data is commonly tedious and time-consuming, while the access to a large number of unlabeled data is much easier. Hence, as a typical technique for learning with labeled and unlabeled data, graph-based semi-supervised learning plays an important role in image understanding, since the large number of unlabeled data can thus be utilized to improve the results of image understanding. Although many promising results have been reported in previous work, there remain three key problems associated with graph-based semi-supervised learning: how to construct an application-dependent graph; how to handle noisy labels; how to effectively exploit other types of supervisory information (e.g. pairwise constraints). In this project, we make attempt to solve the first two key problems (i.e. graph construction and noise removal) by proposing a new L1-norm Laplacian regularization method, then decompose the challenging problem of pairwise constraint propagation into a series of semi-supervised learning subproblems to effectively exploit this supervisory information, and finally extend the proposed methods to different challenging tasks of image understanding (e.g. image classification and annotation, image semantic analysis and representation). The main objective of this project is to achieve some exciting advances in graph-based semi-supervised learning and then pave the way for applying it to machine learning, pattern recognition, image processing, computer vison and so on.
在图像理解的实际应用中,人工标注数据的代价总是很大,而收集大量未标注数据则较为容易。因此,作为利用未标注数据进行学习的经典方法,基于图的半监督学习对图像理解中的问题解决有着重要的意义,即它能够有效地利用大量未标注数据改善图像理解的效果,从而减少对人工标注的依赖。虽然相关的研究工作已经取得不错的结果,但是仍然存在如下关键问题急需解决:如何根据具体的应用构建图;如何处理数据标注中的噪声;如何有效利用其它形式的监督信息(如成对约束)。本项目拟研究建立基于L1范数的拉普拉斯正则化方法来解决图构建和去噪这两个关键问题,同时研究将约束传递分解为一系列半监督学习子问题以便更好地利用约束信息,并研究将这些新方法应用于图像分类与标注、图像语义分析与表示等较难的图像理解问题。本项目有望在基础理论和关键技术方面取得较大的进展,并推动机器学习、模式识别、图像处理、计算机视觉等相关领域的发展。
在图像理解的实际应用中,人工标注数据的代价总是很大,而收集大量未标注数据则较为容易。因此,作为利用未标注数据进行学习的经典方法,基于图的半监督学习对图像理解中的问题解决有着重要的意义,即它能够有效地利用大量未标注数据改善图像理解的效果,从而减少对人工标注的依赖。虽然相关的研究工作已经取得不错的结果,但是仍然存在如下关键问题急需解决:如何根据具体的应用构建图;如何处理数据标注中的噪声;如何有效利用其它形式的监督信息(如成对约束)。..围绕上述急需解决的关键问题,项目负责人在半监督学习新方法及应用研究方面展开深入系统的研究工作。首先,建立基于L1 范数的拉普拉斯正则化方法,并用于解决图构建和去噪这两个关键问题。其次,将约束传递分解为一系列半监督学习子问题,以便更好地利用约束信息。最后,将这些半监督学习新方法应用于图像分类与标注、图像语义分析与表示等较难的图像理解问题。相关成果已经发表了15篇论文,其中在重要国际期刊IJCV、IEEE Trans. Image Processing、Pattern Recognition上发表5篇,在顶级国际会议AAAI、IJCAI上发表6篇。..基于上述半监督学习方面的研究成果,项目负责人带队参加2015 年度的ImageNet评测(人工智能最重要的评测),并在视频目标检测任务中获得全球第2名。项目负责人还带队在顶级国际会议IJCAI 2015举办的Repeat Buyers Prediction竞赛中取得全球第4名(4/700)的优异成绩。鉴于人工智能方面的学术贡献,项目负责人获得IBM SUR Award 2015、知名国际会议CGI 2014最佳论文奖等。这些重要奖项的获得,说明本项目取得的研究成果已经在国际上产生一定的学术影响。
{{i.achievement_title}}
数据更新时间:2023-05-31
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
内点最大化与冗余点控制的小型无人机遥感图像配准
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
面向云工作流安全的任务调度方法
桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究
半监督免疫谱聚类及其在SAR图像理解中的应用
基于图理论的半监督图像分割与应用研究
基于图的半监督学习的快速鲁棒算法研究及其应用
基于图的半监督学习算法研究