增强学习(reinforcement learning)是来源于人脑自评价(adaptive critic)学习机制的一类学习控制方法,在复杂系统的优化控制方面有广泛的应用前景,并且与运筹学的近似动态规划理论密切结合,近年来成为机器学习与智能系统的研究热点。本项目针对连续空间马氏决策过程的优化控制问题,以基于核的自适应评价增强学习与近似动态规划方法为主要研究内容,重点解决:增强学习中实现连续状态与行为空间值函数逼近的核方法及其快速稀疏化算法;基于核的近似动态规划理论框架,包括基于核的启发式动态规划HDP、对偶启发式规划DHP等优化控制新方法;以及增强学习与近似动态规划中能够结合先验信息的核函数构造与模型选择理论与方法等。本项目的成果将能够有效解决现有理论方法面临的算法收敛性和提高泛化性能等挑战问题,推动增强学习与近似动态规划在实际大规模优化控制问题中的应用。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于被动变阻尼装置高层结构风振控制效果对比分析
新型树启发式搜索算法的机器人路径规划
"多对多"模式下GEO卫星在轨加注任务规划
现代优化理论与应用
新产品脱销等待时间对顾客抱怨行为的影响:基于有调节的双中介模型
机器学习核方法模型选择与组合的核矩阵近似分析方法
基于近似动态规划附加学习结构的电力系统控制在线自趋优理论与方法
基于矩阵低秩近似的大规模核/度量学习研究
基于近似动态规划的复杂工业过程数据驱动双网运行优化控制方法研究