具有模仿与强化学习机制的智能机器人

基本信息

批准号：60975084

项目类别：面上项目

资助金额：28.00

负责人：潘伟

学科分类：

依托单位：厦门大学

批准年份：2009

结题年份：2012

起止时间：2010-01-01 - 2012-12-31

项目状态：已结题

项目参与者：BenGoertzel,缪克华,邱仲潘,施明辉,张俊松,练睿婷,陈嘉威,苏松志

关键词：

智能引擎强化学习神经网络模拟学习智能机器人

结项摘要

创立一种充分强调学习的发育型智能机器人体系,它利用新型神经网络处理底层的感知信息与运动控制，采用并完善本课题组已有的OpenCogPrime智能引擎来处理高层推理；各个组件协同合作，知识在神经网络与智能引擎之间的相互传递中得到提升。.将这种智能体系应用到机器人上，采用模仿与强化组合学习方法训练机器人：机器人通过模仿人类老师，根据接收到的强化信号、过去的学习经验和观察进行分析，学会全新的具有人类智能的复杂的物理与社会行为。. 智能体系中的新型神经网络可以接收大量输入神经元，在模式识别时不需要进行特征提取；并以其为单元构造可自组织的神经网络群，其中的神经网络相互联系、包含，进化为功能更强大的神经网络。这将在充分、综合、增量式地利用机器人多种传感器信息的技术方面取得重大突破。.本课题的研究将使我国科研人员在神经网络设计、模式识别、机器学习，特别是智能机器人技术方面的研究处于国际领先水平。

项目摘要

采用新型传感器，获取场景的深度与RGB视频；利用创新的行为分割与识别算法获取视频中人类教师示教过程的基本动作高层语义信息；在智能引擎的支持下，让物理机器人通过模仿与强化学习，学会复杂的物理行为与简单的社会行为。.主要的研究成果如下：.采用Kinect传感器获取场景的深度与RGB两种视频信息，选择合理的特征，实现了一种基于本征维数与置信度二次判断的无监督人体行为序列分割算法，把包含多个连续人体行为的视频高质量地划分为一个个相对独立的基本人体行为；在分割基础上，利用简单有效的混合特征来表征人体行为，然后通过学习泛化能力较好的随机森林模型训练人体行为识别器。进一步提出了一种基于多类协同训练行为识别方法，利用少量有标记样本和大量无标记样本来提升人体行为的识别效果。.抽取视频中人体骨架的特征点集的空间直角坐标序列，采用逆运动学方法将它转换为仿人机器人的全身关节电机旋转角度集合序列，实现仿人机器人对人体基本运动的模仿；模仿先在仿真环境进行。设计合理的状态空间与奖励函数，利用强化学习改善由于直角坐标与旋转角度的差异造成的运动不稳定性。优化后的旋转角度序列应用到物理的仿人NAO机器人上，实现了物理机器人对人体基本动作的模仿与强化学习，同时避免了强化学习的试错搜索造成物理机器人的损坏。.在完成人体基本行为学习的基础上，建立有语义标注的机器人基本行为库。人体识别模块先识别出人类教师行为中的基本行为语义序列，然后，仿真机器人逐个调用库中相应的基本行为进行模仿。在两个基本动作衔接的地方仍然采用强化学习来保证动作过渡的稳定性。最后把优化的行为序列应用到物理的NAO机器人，完成了包含多个基本行为的物理行为的学习。.将原来基于虚拟环境的OpenGog改造为一个通用的实体机器人智能引擎ROS，实现了推理、语言，感知，行为的综合。在此基础上将ROS应用到仿人NAO机器人上，实现了一个社交机器人物理原型，该机器人可以识别非特定人的语音，可以与观众进行对话，听懂语音命令执行相应的动作，在第三届国家级的“厦门文博会”上获得最佳创意铜奖。.在环境感知研究方面，实现了一种新型的部分连接神经网络，它在进行模式识别时不用进行特征提取；以这种神经网络为单元，构造了更大规模的神经网络群。实验表明，神经网络群设计方法可行，适用于离线训练、在线识别的多模式的分类问题。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

DOI：10.13609/j.cnki.1000-0313.2022.04.019

发表时间：2022

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

DOI：10.1360/SSM-2020-0035

发表时间：2020

DOI：10.13973/j.cnki.robot.210412

发表时间：2022

潘伟的其他基金

批准号：50572042

批准年份：2005

资助金额：35.00

项目类别：面上项目

批准号：71373188

批准年份：2013

资助金额：57.00

项目类别：面上项目

批准号：21505087

批准年份：2015

资助金额：22.00

项目类别：青年科学基金项目

批准号：51072088

批准年份：2010

资助金额：42.00

项目类别：面上项目

批准号：51323001

批准年份：2013

资助金额：300.00

项目类别：专项基金项目

批准号：51472135

批准年份：2014

资助金额：83.00

项目类别：面上项目

批准号：U1933120

批准年份：2019

资助金额：36.00

项目类别：联合基金项目

批准号：71901080

批准年份：2019

资助金额：17.00

项目类别：青年科学基金项目

批准号：59972016

批准年份：1999

资助金额：14.00

项目类别：面上项目

批准号：31902257

批准年份：2019

资助金额：24.00

项目类别：青年科学基金项目

批准号：59572011

批准年份：1995

资助金额：8.00

项目类别：面上项目

批准号：59372088

批准年份：1993

资助金额：7.00

项目类别：面上项目

批准号：81871670

批准年份：2018

资助金额：57.00

项目类别：面上项目

批准号：81501762

批准年份：2015

资助金额：18.00

项目类别：青年科学基金项目

批准号：71871169

批准年份：2018

资助金额：49.00

项目类别：面上项目

批准号：U1333115

批准年份：2013

资助金额：35.00

项目类别：联合基金项目

批准号：51304238

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：50232020

批准年份：2002

资助金额：135.00

项目类别：重点项目

批准号：21775094

批准年份：2017

资助金额：64.00

项目类别：面上项目

批准号：50872063

批准年份：2008

资助金额：40.00

项目类别：面上项目

批准号：91960104

批准年份：2019

资助金额：60.00

项目类别：重大研究计划

批准号：51272120

批准年份：2012

资助金额：85.00

项目类别：面上项目

相似国自然基金

基于深度强化学习的服务机器人智能感知与自主运动研究

批准号：61873200

批准年份：2018

负责人：辛菁

学科分类：F0307

资助金额：63.00

项目类别：面上项目

基于多智能体强化学习的多机器人系统研究

批准号：60905054

批准年份：2009

负责人：段勇

学科分类：F0309

资助金额：19.00

项目类别：青年科学基金项目

基于逆向强化学习和人工智能的移动机器人自主学习方法研究

批准号：61305121

批准年份：2013

负责人：李德才

学科分类：F0306

资助金额：23.00

项目类别：青年科学基金项目

面向机器人自主操作的人体上肢行为识别-模仿学习研究

批准号：61702516

批准年份：2017

负责人：李寅霖

学科分类：F0210

资助金额：25.00

项目类别：青年科学基金项目

具有模仿与强化学习机制的智能机器人

{{i.achievement_title}}

暂无此项成果

其他相关文献

新型树启发式搜索算法的机器人路径规划

结直肠癌免疫治疗的多模态影像及分子影像评估

智能煤矿建设路线与工程实践

现代优化理论与应用

基于自适应干扰估测器的协作机器人关节速度波动抑制方法

潘伟的其他基金

掺杂对焦绿石稀土锆酸盐热障涂层材料导热系数和高温化学稳定性的研究

基于风险规避视角下供应中断情景中石油采购和应急策略研究

基于分子聚集体的高灵敏纳米荧光探针的设计、合成及其用于细胞内活性氧的检测与成像

织构化低导热陶瓷材料及热传导机理研究

利用电纺丝法制备轻质、低导热陶瓷纤维材料

陶瓷材料的高温光子导热机理研究

大数据背景下基于机场视角的民航事故风险预警机制研究

组织中知识隐藏对知识互动主体间人际行为的影响机制研究：施害者—受害者视角

利用熔盐热析出反应制备金属－陶瓷薄膜梯度功能材料

牛病毒性腹泻病毒利用DDIT3降解MAVS的机制研究

利用超声化学效应合成制备陶瓷微粉的应用基础研究

无烧结陶瓷材料应用基础的研究

细粒棘球蚴感染小鼠Bregs分化调控及其糖代谢重编程事件研究

细粒棘球蚴感染小鼠M-MDSC促进Th17分化的机制研究

基于网络数据的不同情景中石油供应中断突发事件应急管理研究

基于不同风险偏好的民航突发事件应急决策研究

硫化矿石自燃倾向性评价的非线性多参数融合技术及自燃预警研究

远离平衡状态下陶瓷新材料的烧结与组织结构调控

纳米载体材料对细胞的安全性评估：比率荧光纳米探针实时检测成像活性氧水平的变化

电纺丝法制备纳米陶瓷纤维及其应用

抗高温烧结与晶粒生长共晶热障涂层材料的制备与机理研究

陶瓷热障涂层材料的抗高温腐蚀机理与相变研究

相似国自然基金