基于生成图像的人眼检测及视线估计方法研究

基本信息
批准号:61806198
项目类别:青年科学基金项目
资助金额:25.00
负责人:苟超
学科分类:
依托单位:中山大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:张桂煊,张慧,王雨桐,鲁越,曹琳
关键词:
瞳孔检测级联回归人眼检测生成对抗网络视线估计
结项摘要

Image-based eye detection and gaze estimation have a wide range of potential applications, such as human-computer interaction, gaming, biometrics recognition, and driver assistant systems, etc. Though a large number of researches have been don for these two tasks, they are still challenging due to the variation of appearance, illumination, head pose and lack of annotated images. In this project, we are proposing a Generative Adversarial Networks (GANs) based model for image generation and a united deep cascade regression framework for simultaneous eye detection and gaze estimation. More specifically, we explicitly model the distribution of large scale of synthetic eyes with labels and real images without annotations based on adversarial learning methods. After generating the large scale of eye images with annotations, we further learn the deep regression models. At each cascade level, we learn the deep models to explore the coupled relations of global structure, local features, pupil position and 3D gaze direction based on the eye related landmarks. As a result, alternative optimization of the eye detection and gaze estimation is achieved.

基于图像的人眼检测及视线估计具有巨大潜在应用市场,比如人机交互、游戏娱乐、生物特征识别、辅助驾驶系统等。尽管目前已有大量相关研究工作,但是由于个体差异、光照变化、姿态变换以及数据标注困难等,人眼检测及视线估计仍然是一个具有挑战性的问题。本项目拟研究一种基于生成对抗网络的图像生成模型,并提出一个基于深度级联回归的统一框架来同时实现人眼检测及视线估计。具体地,我们显式地对大规模仿真人眼图像、对应标注信息、及无标注真实图像分布进行建模,利用对抗学习来得到有效图像生成模型,该模型能有效融合仿真图像、标注信息及真实人眼图像外观纹理。通过生成模型产生大量训练数据后,我们进一步学习基于深度级联回归的检测识别模型。在每一级级联迭代步骤中,基于眼部关键点,我们利用深度网络对眼部全局结构形状信息、局部区域图像特征、人眼瞳孔中心、三维视线方向的关联性进行建模,从而实现交替优化人眼检测及视线方向估计两个任务。

项目摘要

人眼作为脸部特征的重要组成部分,在人的自然交互中有着重要的意义,如能感知周围环境、表现人的注意力、传达个人的情感等。但在目前基于图像的眼动跟踪,即人眼检测及视线估计的研究中,仍存在光照变化、姿态变换以及数据标注困难等问题。.本项目围绕人眼检测、视线估计以及图像生成等方面开展了深入的研究。首先提出基于对抗机理的图像生成网络IsGAN等方法,并进一步提出基于改进GAN的图像生成模型,将真实无标注人眼图像的外观和纹理融合到带标注信息的仿真人眼图像中,生成更接近真实人眼分布且带有准确标注信息的图像;然后研究了眼睛状态、人眼瞳孔位置和视线方向的潜在映射关系,提出基于眼部关键点的精确人眼状态估计、视线估计和人眼位置检测方法,通过级联回归交替迭代优化来同时实现人眼开闭状态和瞳孔中心位置的检测以及视线的估计。最后在BioID、GI4E和MPIIGaze等数据集上进行实验以验证人眼检测识别的有效性,获得98.9%的眼睛状态检测准确率、98.5%(d_{eye}\le0.05)的瞳孔中心位置检测准确率以及仅为4.1°的视线估计角度误差,明显优于其他相似方法;同时通过消融实验证明眼睛状态、视线方向和人眼瞳孔位置三者存在隐式的对应关系,以及所提出的图像生成模型的有效性。.本项目成果可用于辅助驾驶系统、虚拟现实的眼动跟踪分析、辅助医疗应用等,使该人眼检测及视线估计方法成为交通,安防,医用等领域的不可或缺的基于人工智能的手段,具有十分重要的应用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
3

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
4

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015
5

基于FTA-BN模型的页岩气井口装置失效概率分析

基于FTA-BN模型的页岩气井口装置失效概率分析

DOI:10.16265/j.cnki.issn1003-3033.2019.04.015
发表时间:2019

苟超的其他基金

相似国自然基金

1

摄像视频的人眼视觉表征及交通能见度检测方法研究

批准号:61105015
批准年份:2011
负责人:李勃
学科分类:F0604
资助金额:25.00
项目类别:青年科学基金项目
2

语义跨库的人脸图像多属性联合估计研究

批准号:61702273
批准年份:2017
负责人:田青
学科分类:F0605
资助金额:27.00
项目类别:青年科学基金项目
3

基于图像的人脸老化过程模拟方法研究

批准号:60803024
批准年份:2008
负责人:梁毅雄
学科分类:F0201
资助金额:20.00
项目类别:青年科学基金项目
4

基于图像生成的虚拟试衣方法研究

批准号:61902277
批准年份:2019
负责人:宋丹
学科分类:F0209
资助金额:29.00
项目类别:青年科学基金项目