分布式鲁棒强化学习及其在解耦控制中的应用研究

基本信息
批准号:61074067
项目类别:面上项目
资助金额:34.00
负责人:秦斌
学科分类:
依托单位:湖南工业大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:王欣,朱晓青,张学毅,彭晓波,陈纲,杨圣彬,毛轩昂,王泽彬,李玲
关键词:
MultiAgent解耦控制分布式智能控制鲁棒强化学习稳定性分析
结项摘要

面对分布式非线性、不确定和时变被控对象,强化学习与模糊神经网络相结合为我们提供了构成一个连续空间实时学习控制系统的有效途径,但是有关收敛精度和学习稳定性的理论结果还很少,很难确保学习过程中系统稳定和跟踪性能。本项目研究一种分布式集成智能控制系统的鲁棒强化学习算法及基于该算法的解耦控制方法,以值函数逼近(模糊神经网络、支持向量机)为核心,借鉴鲁棒控制理论,提出适合分布式强化学习的动态稳定域求解方法,采用环境模型和强化学习的协进化,实现分布式鲁棒强化学习。在此基础上提出一种新的鲁棒解耦控制框架,研究稳定约束下的解耦协调算法并应用到焦炉集气管分布式集成智能解耦控制系统中。本研究不仅对基于强化学习控制系统稳定性分析的理论研究及突破该类控制系统在复杂工业过程中的应用的限制具有较大的指导意义,而且为一类强耦合、非线性、强扰动、不确定分布式对象的鲁棒解耦控制提供新的系统的解决方法,有着广阔的应用前景。

项目摘要

针对分布式非线性、不确定和时变被控对象,研究分布式集成智能控制系统的鲁棒强化学习算法及基于该算法的解耦控制方法,以值函数逼近(模糊神经网络、支持向量机)为核心,借鉴鲁棒控制理论,提出适合分布式强化学习的动态稳定域分析方法,运用IQC和Lyapunov理论,实现分布式鲁棒强化学习。在此基础上提出一种新的鲁棒解耦控制框架,研究稳定约束下的解耦协调算法并应用到焦炉集气管分布式集成智能解耦控制和风力发电控制系统中。本项目通过三年的研究工作,已完成项目计划内容。此外为了达到项目研究目的,还对强化学习应用到网络控制、余热锅炉发电优化以及污水过程处理进行了研究和探讨。.本项目的主要研究成果和结论:.1)深入研究了强化学习体系结构,构建了分布式强化学习的框架,建立了焦炉集气管压力系统、风力发电系统模型,完善了仿真和试验平台;.2)深入研究强化学习中鲁棒稳定性问题,解决学习过程中可能出现的不稳定的问题,推导基于IQC和Lyapunov分布式鲁棒强化学习算法;.3) 探讨了网络控制系统的鲁棒设计方法以及强化学习应用到网络控制中;.4)开发完成了焦炉集气管系统分布式强化学习动态仿真软件和风力发电控制系统仿真软件;.5)将上述结构和算法在焦炉集气管压力解耦控制、风力发电变桨距控制以及余热锅炉发电协调控制中进行实验,验证了方法的可行性。开发焦炉集气管压力协调控制软件并计划推广应用。.6)发明了“基于支持向量机的风力发电变桨距自学习控制方法”(实质性审查阶段),将强化学习思想应用到风电机组控制中。.共发表(含录用)科技论文21篇(期刊论文10篇,会议论文11篇),其中SCI收录1篇,SCI源期刊接受1篇,Ei收录9篇,Ei源4篇(另有课题组成员1本英文专著未标注没有计入)。另外向SCI源期刊投寄论文3篇,EI源期刊投稿2篇(终审阶段);申请国家发明专利1项和获得实用新型专利1项,申请软件著作权2项。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

The Revised Direct Stiffness Matrix Method for Seismogram Synthesis Due to Dislocations: from Crustal to Geotechnical Scale

The Revised Direct Stiffness Matrix Method for Seismogram Synthesis Due to Dislocations: from Crustal to Geotechnical Scale

DOI:
发表时间:2021

秦斌的其他基金

批准号:11375068
批准年份:2013
资助金额:91.00
项目类别:面上项目
批准号:11902368
批准年份:2019
资助金额:26.00
项目类别:青年科学基金项目
批准号:81602993
批准年份:2016
资助金额:17.30
项目类别:青年科学基金项目
批准号:10905025
批准年份:2009
资助金额:24.00
项目类别:青年科学基金项目

相似国自然基金

1

多变量系统解耦鲁棒性研究及其应用

批准号:68974021
批准年份:1989
负责人:庞国仲
学科分类:F0301
资助金额:3.00
项目类别:面上项目
2

离散时间系统的脱策强化学习鲁棒优化控制

批准号:61873350
批准年份:2018
负责人:罗彪
学科分类:F0301
资助金额:63.00
项目类别:面上项目
3

多变量双线性系统的解耦和鲁棒自校正控制

批准号:69504009
批准年份:1995
负责人:孙西
学科分类:F0301
资助金额:9.00
项目类别:青年科学基金项目
4

基于鲁棒解耦的多单元模块式小堆系统协调控制方法研究

批准号:11875218
批准年份:2018
负责人:魏新宇
学科分类:A2803
资助金额:66.00
项目类别:面上项目