分层式强化学习理论及其量子启发式算法研究

基本信息
批准号:60805029
项目类别:青年科学基金项目
资助金额:19.00
负责人:陈春林
学科分类:
依托单位:南京大学
批准年份:2008
结题年份:2011
起止时间:2009-01-01 - 2011-12-31
项目状态: 已结题
项目参与者:董道毅,胡国强,李衍杰,王莉,萧毅鸿,沈玮
关键词:
强化学习移动机器人分层式结构量子启发式算法
结项摘要

强化学习是机器学习的一个重要分支,具有分层结构的学习算法是克服复杂问题维数灾难、提高学习速度和适应性的关键技术之一,在智能控制中有着广泛应用。项目拟针对大范围不确定环境下的序列决策问题,研究分层式强化学习理论及其量子启发式算法,以及在智能控制中的典型应用。主要包括:①基于定性定量关系将强化学习方法拓展到分层式学习结构,研究分层式强化学习的基本模型和算法理论,基于新的知识表示方法和算法结构设计高效算法,提高强化学习对具有较大状态动作空间的学习问题的可扩展性和学习速度;②研究分层式强化学习的量子启发式算法,从知识表示、探索策略和并行计算等多个方面改善强化学习性能;③以移动机器人导航控制为典型应用实例,拓展分层式强化学习在不确定性智能控制中的应用。本研究对探索具有分层式学习结构和定性推理能力的机器学习理论和算法具有重要理论价值和现实意义,也为复杂不确定系统智能控制提供新的思路。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

DOI:10.11999/JEIT210095
发表时间:2021
4

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
5

物联网中区块链技术的应用与挑战

物联网中区块链技术的应用与挑战

DOI:10.3969/j.issn.0255-8297.2020.01.002
发表时间:2020

陈春林的其他基金

批准号:81000378
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:81272585
批准年份:2012
资助金额:60.00
项目类别:面上项目
批准号:11402213
批准年份:2014
资助金额:28.00
项目类别:青年科学基金项目
批准号:51771200
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:61273327
批准年份:2012
资助金额:79.00
项目类别:面上项目
批准号:30970762
批准年份:2009
资助金额:33.00
项目类别:面上项目
批准号:81560584
批准年份:2015
资助金额:35.00
项目类别:地区科学基金项目
批准号:41201108
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

量子强化学习理论、算法及应用

批准号:60703083
批准年份:2007
负责人:董道毅
学科分类:F0201
资助金额:20.00
项目类别:青年科学基金项目
2

面向非限定条件的演化强化学习理论与算法研究

批准号:61375061
批准年份:2013
负责人:俞扬
学科分类:F0603
资助金额:79.00
项目类别:面上项目
3

非凸稀疏学习理论与分布式优化算法研究

批准号:61876090
批准年份:2018
负责人:袁晓彤
学科分类:F0603
资助金额:64.00
项目类别:面上项目
4

高效数学启发式算法设计及其应用研究

批准号:61403057
批准年份:2014
负责人:任志磊
学科分类:F0305
资助金额:25.00
项目类别:青年科学基金项目