分层式强化学习理论及其量子启发式算法研究

基本信息

批准号：60805029

项目类别：青年科学基金项目

资助金额：19.00

负责人：陈春林

学科分类：

依托单位：南京大学

批准年份：2008

结题年份：2011

起止时间：2009-01-01 - 2011-12-31

项目状态：已结题

项目参与者：董道毅,胡国强,李衍杰,王莉,萧毅鸿,沈玮

关键词：

强化学习移动机器人分层式结构量子启发式算法

结项摘要

强化学习是机器学习的一个重要分支，具有分层结构的学习算法是克服复杂问题维数灾难、提高学习速度和适应性的关键技术之一，在智能控制中有着广泛应用。项目拟针对大范围不确定环境下的序列决策问题，研究分层式强化学习理论及其量子启发式算法，以及在智能控制中的典型应用。主要包括：①基于定性定量关系将强化学习方法拓展到分层式学习结构，研究分层式强化学习的基本模型和算法理论，基于新的知识表示方法和算法结构设计高效算法，提高强化学习对具有较大状态动作空间的学习问题的可扩展性和学习速度；②研究分层式强化学习的量子启发式算法，从知识表示、探索策略和并行计算等多个方面改善强化学习性能；③以移动机器人导航控制为典型应用实例，拓展分层式强化学习在不确定性智能控制中的应用。本研究对探索具有分层式学习结构和定性推理能力的机器学习理论和算法具有重要理论价值和现实意义，也为复杂不确定系统智能控制提供新的思路。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：10.13197/j.eeev.2019.05.95.fuwq.009

发表时间：2019

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

DOI：10.19328/j.cnki.2096-8655.2022.02.002

发表时间：2022

陈春林的其他基金

批准号：81000378

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

批准号：81272585

批准年份：2012

资助金额：60.00

项目类别：面上项目

批准号：11402213

批准年份：2014

资助金额：28.00

项目类别：青年科学基金项目

批准号：51771200

批准年份：2017

资助金额：60.00

项目类别：面上项目

批准号：61273327

批准年份：2012

资助金额：79.00

项目类别：面上项目

批准号：30970762

批准年份：2009

资助金额：33.00

项目类别：面上项目

批准号：81560584

批准年份：2015

资助金额：35.00

项目类别：地区科学基金项目

批准号：41201108

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

相似国自然基金

量子强化学习理论、算法及应用

批准号：60703083

批准年份：2007

负责人：董道毅

学科分类：F0201

资助金额：20.00

项目类别：青年科学基金项目

面向非限定条件的演化强化学习理论与算法研究

批准号：61375061

批准年份：2013

负责人：俞扬

学科分类：F0603

资助金额：79.00

项目类别：面上项目

非凸稀疏学习理论与分布式优化算法研究

批准号：61876090

批准年份：2018

负责人：袁晓彤

学科分类：F0603

资助金额：64.00

项目类别：面上项目

高效数学启发式算法设计及其应用研究

批准号：61403057

批准年份：2014

负责人：任志磊

学科分类：F0305

资助金额：25.00

项目类别：青年科学基金项目

分层式强化学习理论及其量子启发式算法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

基于被动变阻尼装置高层结构风振控制效果对比分析

基于改进LinkNet的寒旱区遥感图像河流识别方法

新型树启发式搜索算法的机器人路径规划

"多对多"模式下GEO卫星在轨加注任务规划

陈春林的其他基金

KLF4调控CRMP-2转录抑制视网膜神经节细胞轴突生长的分子机制及作用研究

局部晚期宫颈癌灶在体动脉血管网数字化三维模型的构建及应用

基于时间反转法的曲板高速冲击定位研究

四氧化三铁晶界结构与晶界磁学性能的原子尺度研究

基于事件的强化学习及其在群机器人优化控制中的应用

数字化人子宫动脉血管网三维模型的构建

TREK-1-BDNF-mTOR 通路介导丁基苯酞快速抗抑郁的分子机制研究

吉林省城市化地域格局演进机理与空间效应研究

相似国自然基金