离散时间系统的脱策强化学习鲁棒优化控制

基本信息

批准号：61873350

项目类别：面上项目

资助金额：63.00

负责人：罗彪

学科分类：

依托单位：中南大学

批准年份：2018

结题年份：2022

起止时间：2019-01-01 - 2022-12-31

项目状态：已结题

项目参与者：王俊伟,赵博,张启超,阎鹏飞,徐延才,梁明明,李月恒,王子洋,李本凯

关键词：

强化学习离散时间系统鲁棒优化控制基于数据的控制自适应动态规划

结项摘要

For most of complicated industrial processes, it is usually difficult to establish their mathematical model. Moreover, there inevitably exist disturbances, which affect the control performance to a great extent. In this project, robust optimal control problems of discrete-time systems are considered and data-based off-policy reinforcement learning will be studied for control design. Two kinds of robust optimal control problem are considered: H∞ control and mixed H2/H∞ control. The off-policy reinforcement learning algorithms and their convergence theories will be studied based on value function and Q-function, respectively. Moreover, some issues will be analyzed rigorously, such as, the implementation based on offline and online data, the stability of closed-loop system and the influence of learning error on control performance. This project will provide some novel and effective methods and theories for data-based robust optimal control of discrete-time systems, which are extremely important for the development of intelligent control.

对于很多复杂工业过程，往往很难精确建立其精确的数学模型，而且不可避免地存在干扰因素,在很大程度上将影响控制性能。本项目针对离散时间系统的鲁棒优化控制问题，研究基于数据的脱策强化学习控制设计方法。主要考虑两类鲁棒优化控制问题：H∞控制与混合H2/H∞控制，分别研究基于状态值函数与Q-函数的脱策强化学习算法，建立算法的收敛性理论，同时探讨基于离线与在线数据的算法实现方法，系统的闭环稳定性及学习误差对控制性能的影响。本项目的研究将为基于数据的离散时间系统鲁棒优化控制提供一些新的、有效的方法和理论依据，促进智能控制的发展。

项目摘要

对于很多复杂工业过程，往往很难精确建立其精确的数学模型，而且不可避免地存在干扰因素,在很大程度上将影响控制性能。本项目针对离散时间系统的鲁棒优化控制问题，研究基于数据的脱策强化学习控制设计方法。考虑了两类鲁棒优化控制问题：H∞控制与混合H2/H∞控制，分别研究基于状态值函数与Q-函数的脱策强化学习算法，建立算法的收敛性理论，同时探讨基于离线与在线数据的算法实现方法，系统的闭环稳定性及学习误差对控制性能的影响。本项目吸收和借鉴了自适应动态规划控制理论、事件触发控制理论、偏微分方程系统控制理论、鲁棒控制理论、积分和深度强化学习技术的最新研究成果和经验，提出了一系列基于数据的离散时间系统鲁棒优化控制方法及理论。共发表论文17篇，其中SCI期刊论文14篇。发表的期刊包括国内外领域顶级期刊：IEEE Transactions on Cybernetics, IEEE Transactions on Neural Networks and Learning Systems, IEEE Transactions on Systems, Man, and Cybernetics: Systems, Neural Networks等等。此外，授权和实审发明专利4项。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.16796/j.cnki.1000-3770.2022.03.003

发表时间：2022

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：10.12202/j.0476-0301.2022178

发表时间：2022

DOI：10.13197/j.eeev.2019.05.95.fuwq.009

发表时间：2019

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

罗彪的其他基金

批准号：70802058

批准年份：2008

资助金额：13.50

项目类别：青年科学基金项目

批准号：61503377

批准年份：2015

资助金额：21.00

项目类别：青年科学基金项目

批准号：71272064

批准年份：2012

资助金额：50.00

项目类别：面上项目

相似国自然基金

饱和多控制器系统离策强化学习的有限时间最优控制

批准号：61903351

批准年份：2019

负责人：崔小红

学科分类：F0301

资助金额：23.00

项目类别：青年科学基金项目

随机迭代依赖不确定系统的鲁棒学习控制

批准号：61104011

批准年份：2011

负责人：孟德元

学科分类：F0301

资助金额：24.00

项目类别：青年科学基金项目

基于验证的区间型离散事件系统的鲁棒分析与控制

批准号：60274011

批准年份：2002

负责人：赵千川

学科分类：F0301

资助金额：22.00

项目类别：面上项目

网络控制系统离散事件触发通信与鲁棒容错控制协同设计研究

批准号：61364011

批准年份：2013

负责人：李炜

学科分类：F0301

资助金额：44.00

项目类别：地区科学基金项目

离散时间系统的脱策强化学习鲁棒优化控制

{{i.achievement_title}}

暂无此项成果

其他相关文献

EBPR工艺运行效果的主要影响因素及研究现状

一种基于多层设计空间缩减策略的近似高维优化方法

复杂系统科学研究进展

基于被动变阻尼装置高层结构风振控制效果对比分析

新型树启发式搜索算法的机器人路径规划

罗彪的其他基金

企业集团总部对异质子公司的滚动过程绩效管理方法研究

基于强化学习的分布参数系统数据驱动控制

集团交互控制系统：行为自适应性与动态演化机制

相似国自然基金