With the introduction of many advanced machine learning methods such as the deep learning, face recognition accuracies on specific testing datasets have been improved dramatically during the past several years. This has greatly stimulated the enthusiasm of promoting face recognition technologies in the industry community. However, in extensive practices, it has been gradually revealed that face recognition technology is far from being perfect especially under various and changeable real application scenarios. This situation has even aroused the questioning of the intrinsic usability of face recognition. For this huge gap between research and application, we think that the fundamental problem is the tendency toward building an ideal system which can adapt to all possible environments under the traditional research framework. In fact, an adaptive face recognition system which can adapt to environmental changes flexibly is usually more preferable in real applications. Nevertheless, in existing face recognition methods, different modules are largely isolated to each other, making the adaptive learning prohibitively complex. Based on this understanding, we propose this research of end of end face recognition towards adaptive learning. The major target of this research is to closing the gap between research and application so as to making face recognition a really useful biometric technology.
近年来随着以深度学习为代表的诸多机器学习方法的引入,人脸识别方法在特定测试集上的准确率急速提升。这无疑极大地刺激了工业界普及人脸识别技术的热情。而正是在广泛深入的实践中,人们逐渐发现人脸识别技术在多样多变的真实应用环境中的表现往往远不及其在实验室中那么理想。这甚至引发了对人脸识别技术本质可用性的质疑。对于人脸识别研究和应用间这种日益彰显的反差,我们认为其根源是传统研究中总是试图构建可以适应所有情况的“以不变应万变”的理想系统的技术思路。实际上真实应用中需要的往往是能够灵活地适应特定应用环境的“以进化应变化”,或者说具备自适应学习能力的人脸识别系统。然而现有人脸识别方法中各个任务模块之间割裂的现状极大地阻碍了自适应学习的实现。有鉴于此,我们提出构建端到端的人脸识别框架的研究,通过打通任务模块之间的隔离来实现面向自适应学习的人脸识别,为人脸识别技术跨越研究与应用间的鸿沟开拓全新思路。
传统的人脸识别系统由多个相互独立的模块构成,这些模块所采用数学模型种类繁多,训练要求和方法也有很大差异。这就给人脸识别系统的自适应学习带来了极大的障碍。当误识出现时,仅仅是确定哪些模块需要调整就已经代价高昂,况且单个模块的自适应调整对其他模块产生的影响也极难被充分考虑。本项目正是针对这一问题,试图打破这些模块之间的隔离,使得人脸识别不同任务阶段之间的依赖显性化从而实现参数的联合训练,或者说构建端到端人脸识别技术。除了有利于实现自适应学习,端到端人脸识别通过特征共享最终有可能本质降低人脸识别系统的存储和运算代价,进一步推动其技术普及。实现端到端人脸识别的核心问题是要将不同的人脸识别模块进行统一的参数化并有机的联合起来。针对这样的目标,课题项目着重研究了基于深度学习模型的端到端的人脸识别模块参数化的问题。提出了一个全新的框架,研究了通过配准学习的方式达到端到端人脸识别的目标,在该框架中,既不需要关于人脸关键点的先验知识,也不需要人工定义的几何变化方式。唯有人的身份信息被用作人脸识别网络学习的监督信号。这样可以使得模型自动学习出适合人脸识别的图像几何变换,即配准方式。提出了一种可以被融入到大多数基于卷积神经元网络的人脸识别系统模型的MaskNet结构。该结构能够自动地根据输入人脸图像中的遮挡情况,产生一个合理的特征掩模。这样能够使得特征提取网络的输出尽可能的具有遮挡鲁棒性。提出一种基于最小方向对比度检测的低复杂度图像感兴趣区域检测方法,可以应用到人脸图像的感兴趣区域提取问题上。出了一种基于高斯混合模型的损失函数。该损失函数对特征空间进行显性的概率建模,进而可以在约束分类界面的同时,也约束特征的概率分布,有效提升了端到端人脸识别的性能。项目中提出的创新性的方法不仅以多篇学术论文的形式在本领域主要的国际期刊及会议上发表,还和工业界结合实现了真实的应用。研究中的部分创新思路更是体现体现在相关行业标准中。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于细粒度词表示的命名实体识别研究
基于全模式全聚焦方法的裂纹超声成像定量检测
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
基于端到端深度学习框架的文本无关副语言语音属性识别研究
端到端异构空间下的刑侦人脸超分辨率理论与算法
端到端数据增广算法研究及其在人体行为识别中的应用
认知融合网络中面向端到端效能的自主资源保障机制