In the unstructured environment, it is still a challenging problem for the skill learning of robots’ dexterous manipulation, mainly on the movement primitive representation and skill experience learning. This proposal aims to perform that the robot intelligently organizes movement primitives to accomplish complex new tasks in the unstructured environment through learning movement primitive, imitating the grasp behavior based on reinforcement learning, building a skill library and improving the robot’s ability of reasoning and generalization. The main research contents consist of the following ones:.(1) Movement primitive representation and recognition based on the extended dynamical system representation and Long Short-Term Memory recurrent neural network;.(2) Grasp behavior imitation based on reinforcement learning;.(3) Task-oriented skill experience reasoning and generalization based on the library description and Hidden Markov Model.. Finally, the proposed technologies will be verified on the robot experimental platform for accomplishing typical tasks such as preparing medicine for the patients, learning massage skills.
非结构环境下,面向机器人灵巧操作的技能学习仍然是一个研究难题,主要在于动作基元的表征与技能经验的学习。本课题探索机器人在完成复杂任务时的技能经验学习方法,旨在使机器人能够通过运动轨迹单元的学习与操作行为的强化学习训练,将技能知识转化为经验,生成技能经验库,并具备针对复杂任务的推理与泛化能力,能够智能地组合动作基元,完成非结构化环境下的新任务。主要研究内容包括:(1)动作基元的表征与识别,研究动态系统表征的扩展方法与基于长短时记忆深度递归神经网络的运动识别;(2)基于强化学习的操作行为模拟,研究深度强化学习模型用于操作物体时机械手臂位姿的学习;(3)面向任务的技能经验推理与泛化,研究技能经验库的形式化描述与基于隐马尔可夫模型的知识推理与泛化。最后,课题将在机器人实验平台上对典型日常服务任务,如给病人冲药、按摩动作学习等进行关键技术的功能验证。
非结构环境下,面向机器人灵巧操作的技能学习在日常服务机器人、人机协作以及救灾排险的操作应用中具有重要的价值。目前,其研究的难点在于动作基元的表征与技能经验的学习。本课题重点研究机器人在完成复杂任务时的技能经验学习方法,旨在使机器人能够通过运动轨迹单元的学习与操作行为的模仿学习训练,将技能知识转化为经验,生成技能经验库,并具备针对复杂任务的推理与泛化能力,能够智能地组合动作基元,完成非结构环境下的新任务。主要研究内容,包括:(1)动作基元的表征与识别,分别采用动态运动基元方法与概率式运动基元方法表征动作轨迹,提出深度图神经网络与长短时记忆递归网络相融合的运动识别模型(ST-GCN-LSTM 模型)用于分类动作类别,其成功率在85%以上;(2)提出基于模仿学习的操作行为模拟方法,可以实现快速、拟人化的机器人灵巧手臂抓取位姿规划;(3)建立操作技能库,并根据动作与物体状态变化之间的关系对其进行形式化描述,提出基于面向功能对象网络(FOON)方法的技能经验推理与泛化,使机器人能够在有限的示教学习中获得针对复杂任务的操作技能。最后,在实验平台上通过典型任务(如组装任务、机器人与人相交互等)验证了上述所提出算法的有效性。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
面向云工作流安全的任务调度方法
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
一种改进的多目标正余弦优化算法
面向工件表面缺陷的无监督域适应方法
机器人灵巧手设计与自主操作关键技术研究
服务机器人灵巧操作的多模态感知融合与人机交互
脊柱手术机器人的经验学习与共享操作方法研究
不确定环境下基于多源信息融合的机器人灵巧手稳定操作机制研究