离散时间系统的脱策强化学习鲁棒优化控制

基本信息
批准号:61873350
项目类别:面上项目
资助金额:63.00
负责人:罗彪
学科分类:
依托单位:中南大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:王俊伟,赵博,张启超,阎鹏飞,徐延才,梁明明,李月恒,王子洋,李本凯
关键词:
强化学习离散时间系统鲁棒优化控制基于数据的控制自适应动态规划
结项摘要

For most of complicated industrial processes, it is usually difficult to establish their mathematical model. Moreover, there inevitably exist disturbances, which affect the control performance to a great extent. In this project, robust optimal control problems of discrete-time systems are considered and data-based off-policy reinforcement learning will be studied for control design. Two kinds of robust optimal control problem are considered: H∞ control and mixed H2/H∞ control. The off-policy reinforcement learning algorithms and their convergence theories will be studied based on value function and Q-function, respectively. Moreover, some issues will be analyzed rigorously, such as, the implementation based on offline and online data, the stability of closed-loop system and the influence of learning error on control performance. This project will provide some novel and effective methods and theories for data-based robust optimal control of discrete-time systems, which are extremely important for the development of intelligent control.

对于很多复杂工业过程,往往很难精确建立其精确的数学模型,而且不可避免地存在干扰因素,在很大程度上将影响控制性能。本项目针对离散时间系统的鲁棒优化控制问题,研究基于数据的脱策强化学习控制设计方法。主要考虑两类鲁棒优化控制问题:H∞控制与混合H2/H∞控制,分别研究基于状态值函数与Q-函数的脱策强化学习算法,建立算法的收敛性理论,同时探讨基于离线与在线数据的算法实现方法,系统的闭环稳定性及学习误差对控制性能的影响。本项目的研究将为基于数据的离散时间系统鲁棒优化控制提供一些新的、有效的方法和理论依据,促进智能控制的发展。

项目摘要

对于很多复杂工业过程,往往很难精确建立其精确的数学模型,而且不可避免地存在干扰因素,在很大程度上将影响控制性能。本项目针对离散时间系统的鲁棒优化控制问题,研究基于数据的脱策强化学习控制设计方法。考虑了两类鲁棒优化控制问题:H∞控制与混合H2/H∞控制,分别研究基于状态值函数与Q-函数的脱策强化学习算法,建立算法的收敛性理论,同时探讨基于离线与在线数据的算法实现方法,系统的闭环稳定性及学习误差对控制性能的影响。本项目吸收和借鉴了自适应动态规划控制理论、事件触发控制理论、偏微分方程系统控制理论、鲁棒控制理论、积分和深度强化学习技术的最新研究成果和经验,提出了一系列基于数据的离散时间系统鲁棒优化控制方法及理论。共发表论文17篇,其中SCI期刊论文14篇。发表的期刊包括国内外领域顶级期刊:IEEE Transactions on Cybernetics, IEEE Transactions on Neural Networks and Learning Systems, IEEE Transactions on Systems, Man, and Cybernetics: Systems, Neural Networks等等。此外,授权和实审发明专利4项。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
3

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
4

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
5

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020

罗彪的其他基金

批准号:70802058
批准年份:2008
资助金额:13.50
项目类别:青年科学基金项目
批准号:61503377
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目
批准号:71272064
批准年份:2012
资助金额:50.00
项目类别:面上项目

相似国自然基金

1

饱和多控制器系统离策强化学习的有限时间最优控制

批准号:61903351
批准年份:2019
负责人:崔小红
学科分类:F0301
资助金额:23.00
项目类别:青年科学基金项目
2

随机迭代依赖不确定系统的鲁棒学习控制

批准号:61104011
批准年份:2011
负责人:孟德元
学科分类:F0301
资助金额:24.00
项目类别:青年科学基金项目
3

基于验证的区间型离散事件系统的鲁棒分析与控制

批准号:60274011
批准年份:2002
负责人:赵千川
学科分类:F0301
资助金额:22.00
项目类别:面上项目
4

网络控制系统离散事件触发通信与鲁棒容错控制协同设计研究

批准号:61364011
批准年份:2013
负责人:李炜
学科分类:F0301
资助金额:44.00
项目类别:地区科学基金项目