Effective transfer of knowledge among heterogeneous robots would have significant theoretical value and practical value. It could enable robots to rapidly master skills and adapt to new surroundings with relatively low computational cost. However, the path to achieving this goal is obstructed by a number of difficulties related to: computational resource limitations, the uncertainty of information acquisition, and the omnipresence of ambient noise. This project attempts to surmount these obstacles via a unique approach to neural-symbolic integration. With the help of Metric learning and Submodular function, we want to closely link deep learning and transfer learning and will then convert this integration into a series of many-objective optimization problems, which can be solved by a Monte Carlo Tree Search based Evolutionary algorithm. While the ideas and software developed will be widely applicable, the initial target application area will be hand-eye coordination, a topic of significant importance in itself. Specific research steps envisioned are: 1) to study Monte Carlo Tree Search based Evolutionary Many-objective Optimization Algorithms, 2) to extract knowledge in the formal language of Probabilistic Logic Networks from Evolved Deep Spatio-Temporal Inference Networks, 3) to process the acquired knowledge with the transfer learning method, and to 4) reduce the training time of the Deep Spatio-Temporal Inference Networks by exploiting the logically processed knowledge. The results will be applied to heterogeneous robots carrying out hand-eye coordination in the real world, giving them unprecedented capability for knowledge transformation and associated rapid learning.
在不同的机器人之间进行知识迁移,能够实现以较少的学习代价,令目标机器人快速地掌握某种新技能或适应新环境,具有重要的实际应用和理论研究价值。然而,在实现这一目标时必须妥善处理信息获取的不确定性和所处环境的高噪性。本项目提议使用神经-符号集成这一独特的方法来解决这些难题。我们提议将迁移学习同深度学习系统紧密结合,利用度量学习和亚模性函数的技巧,将上述结合转换为求解一系列极多目标优化问题,并通过设计基于蒙特卡洛树搜索的进化算法加以解决。本项目以动态环境中自治机器人的手眼协调为应用背景,开展如下的具体研究工作:1)研究基于蒙特卡洛树搜索的进化极多目标优化算法;2)利用进化极多目标优化方法提升深度时空推理网络的特征表征能力,并研究关于进化深度网络的概率符号知识抽取;3) 研究不同类型知识的迁移学习方法,以及4)如何利用迁移后的知识加快深度时空推理网络的训练速度,从而实现异构机器人间的知识迁移
本项目针对动态环境下机器人动作生成计算代价高,精度低以及鲁棒性不强等问题,将迁移学习,深度学习和进化优化方法进行紧密结合,力图解决机器人的知识迁移,尤其是异构环境下机器人动作生成的知识迁移问题,从而使得机器人能够自主地快速适应不同环境。我们通过将机器人的动作生成问题转换为动态多目标优化问题,并设计一系列的学习驱动,尤其是迁移学习驱动的动态多目标优化算法,使得机器人能够有效地重复利用过往“经验”,并根据自身所处环境和硬件特性,快速产生合理的动作,由此实现机器人在动态环境下的自主知识迁移。依据总体目标,项目组分别对如下问题进行研究,并取得了相应的研究成果:1. 基于群体智能的多自由度机器人动作生成方法;2. 异构环境下多足机器人的动作迁移方法;3. 基于进化迁移优化的动态多目标优化方法;4. 学习驱动的动态多目标优化方法;5. 进化神经架构搜索及其相关应用。研究成果不仅可以用于机器人研究领域,尤其是基于迁移学习的动态多目标优化的系列算法,尤其快速和准确的特性,可广泛应用与智能制造、智能交通等相关领域。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于SSVEP 直接脑控机器人方向和速度研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
物联网中区块链技术的应用与挑战
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
一种改进的多目标正余弦优化算法
基于影像组学异构多模态数据的深度迁移学习混合模型方法研究
面向高光谱影像解译的无监督迁移深度表示模型与学习方法
面向机器人视觉的深度学习与拟人记忆机制特征提取融合方法研究
基于深度学习和迁移学习的对流新生临近预报方法研究