The short-term prediction and visual imagination is a basic ability of human brains. It is a very important research topic in the brain-inspired artificial intelligence, and also a cutting-edge research task in the computer vision research filed. However, current studies are still in exploring basic methods, and there are many key problems need to be handled. This research is based on the cognitive process of human brains, and proposes a novel research program. 1) On the aspect of the activity feature extraction, this research proposes a hybrid neural network model based on image convolution and graph convolution, achieving synchronous feature extractions of image appearances and pose transformations. 2) On the aspect of uncertainty future state prediction, this research proposes a conditional variational autoencoder and pose map feature reasoning network, achieving uncertainty multi-modal prediction. 3) On the aspect of multi-target constraint, this research propose progressive tight coupling conditional image generation method, and achieves semantic consistency and visual fidelity in the image generation. This research framework unify the cognitive process of “observation-prediction-verification-optimization” into an integrated model, and achieves self-supervised model optimization. This research is expected to contribute to the key research project “The Basic Theory and Technology of Brain-inspired Intelligent Agent Autonomous Reasoning and Unknown Imagination”, and provides new ideas and approaches for this research field.
对人体行为未来状态的短时预测和视觉想象是人类大脑的基本能力,在类脑人工智能领域具有重要的研究意义,也是近年来计算机视觉领域的前沿研究方向。然而,目前的研究尚停留在探索阶段,关键问题亟待解决。本申请从模仿大脑认知过程的独特角度出发,提出了新颖的研究方案。1)针对行为特征提取难题,提出基于图像卷积和图卷积的异构神经网络模型,实现图像内容和行为趋势的同步特征提取;2)针对不确定性未来状态预测问题,提出变分自编码和位姿图特征解码推理网络,实现对不确定状态的多峰预测;3)针对生成信息的多目标约束问题,提出渐进式强耦合条件约束图像生成方法,实现语义连贯性和视觉真实性约束的多目标生成。该研究框架将认知过程的“观察-预测-验证-优化”统一为一个完整模型,实现了自监督模型优化。本项目预期为解决关键科学问题:“类脑智能体自主推理与未知想象基础理论与关键技术”做出贡献,为该领域的发展提供新思路和新方法。
该项目从类脑认知形成规律出发,对人体行为的未来状态预测这一科学问题进行研究。研究内容主要从四个方面展开:(1)感知:我们研究了异构特征的高精度姿态估计;(2)预测:我们研究了多峰预测算法和不确定性行为预测方法;(3)验证:我们研究了不确定性推理方法;(4)优化:我们研究了时序约束优化和模型的全局优化。此外,我们对技术落地中存在的问题进行了探索,对结构搜索和模型加速等问题进行了针对性研究。通过如上的研究工作,我们在多个层面上取得了重要成果。在感知层面,我们提出了便节点注意力图卷积网络(EVA-GCN),首次在人体头部姿态估计任务中引入图神经网络,使得姿态估计的精度达到了目前报告的最高水平。在预测方面,我们提出了基于生理学先验知识引导和时空约束的图变分自编码器模型(CST-VGAE),首次在人体头部姿态估计任务中提出了图谱模态上的长程多峰分布预测方法。在推理方面,我们提出了基于贝叶斯学习的人体行为不确定性量化方法和非对称性BSTG transformer模型。在目前已报告的学术研究中,首次使得长程人体行为未来状态的精确预测达到了六秒钟时长的密集预测。在优化方面,我们提出了基于时序验证约束的自监督优化方法。以上研究成果发表在CCF-A类会议和期刊论文中,获得研讨会最佳论文奖,技术应用成果获得第一届全国博士后创新创业大赛金奖。 通过本项目的研究,我们实现了模拟类脑认知的“观察-预测-验证-优化”模式和过程,这对于探索类脑智能与人机交互共融具有一定的科学意义,取得了丰富而有意义的研究成果,也为后续更深层次、更宽领域的研究打下了扎实的基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
面向信息物理系统的人体行为识别理论与关键技术研究
视频中人体行为的低延迟识别及未来行为预测研究
视觉监控敏感信息处理关键技术研究
数字视觉信息修复及重构的关键技术研究