基于自适应动态规划的非线性系统零和微分对策

基本信息
批准号:60904037
项目类别:青年科学基金项目
资助金额:19.00
负责人:魏庆来
学科分类:
依托单位:中国科学院自动化研究所
批准年份:2009
结题年份:2012
起止时间:2010-01-01 - 2012-12-31
项目状态: 已结题
项目参与者:白雪瑞,张建宏,戴钰桀,朱迎谷,胡朝辉
关键词:
零和微分对策神经网络近似动态规划最优控制自适应动态规划
结项摘要

本项目将研究基于自适应动态规划的非线性系统零和微分对策问题。拟解决目前对非线性系统零和微分对策鞍点判定以及微分对策鞍点与混合最优解的求解难题,建立以自适应动态规划为基础的一套新的理论分析体系和求解方案,开辟求解非线性系统零和微分对策的新途径。主要研究内容包括:1.研究基于自适应动态规划理论求解鞍点存在的非线性系统二人零和微分对策问题;2.研究非线性系统二人零和微分对策问题鞍点不存在时基于自适应动态规划的混合最优控制方法;3.研究基于自适应动态规划的非线性系统多人零和微分对策问题;4.避开鞍点存在性的复杂判据,建立一种统一有效的自适应动态规划方法使得当对策的鞍点存在时控制策略可以使得性能指标函数达到鞍点而在鞍点不存在时达到对策的混合最优解。上述研究成果将为非线性系统和零和微分对策理论的发展提供新的思路,丰富最优控制理论和微分对策理论的研究内容,同时推动智能系统理论和我国自动化技术的深入发展。

项目摘要

自适应动态规划(ADP)是利用神经网络来逼近动态规划的性能指标函数,实现最优控制的策略,有效地解决了动态规划维数灾的难题,为高维复杂系统的最优控制提供了一种切实可行的理论和方法,近年来其理论和方法的研究日益受到重视。项目以自适应动态规划理论为研究主线,以非线性系统零和微分对策为重点展开相关领域的一系列研究工作,所获得的研究成果包括:1. 研究基于自适应动态规划理论求解非线性系统二人零和微分对策问题;2. 研究基于自适应动态规划的非线性系统多人零和微分对策问题;3. 避开鞍点存在性的复杂判据,建立一种统一有效的自适应动态规划方法使得当对策的鞍点存在时控制策略可以使得性能指标函数达到鞍点而在鞍点不存在时达到对策的混合最优解;同时分别建立了二人零和微分对策与多人零和微分对策的性能指标函数收敛性分析与非线性系统系统稳定性分析体系,为自适应动态规划在零和微分对策中得以实现奠定坚实的理论基础;4. 将带有系统噪声的非线性系统最优控制有效地转换成零和对策问题,采用迭代自适应动态规划方法解决了非线性系统H∞鲁棒最优控制问题,获得最优控制器;5. 建立有限域迭代自适应动态规划理论,使得迭代性能指标函数在有限时间内达到最优性能指标函数的ε-临域之内,同时证明了系统的稳定性以及性能指标函数的ε-最优性;6. 在自适应动态规划实现过程中,采用全局二次启发式规划技术,构建三种神经网络分别近似代价函数及其偏导数、控制律和被控对象。此算法既可以保证较高的计算精度,又能刻画出代价函数序列的收敛过程;7. 由于性能指标函数的高非线性需要采用神经网络等近似结构近似性能指标函数,因此近似误差必然存在。基于自适应动态规划原理,提出了带有误差的自适应动态规划迭代算法,并提出了新型基于“误差上界”的收敛性判别方法。获得了自适应动态规划迭代过程中的容许误差的上界,给出迭代收敛条件;8. 时滞是控制系统普遍存在的现象之一。基于自适应动态规划原理,建立双迭代自适应动态规划的方法,采用性能指标函数与迭代控制律同时进行迭代获得了时滞系统的最优控制,同时证明了性能指标函数的收敛性与最优性。9. 将自适应动态规划的理论研究成果应用于智能电网、变换炉等实际系统中,获得较好的控制效果。在基金支持下,课题研究成果已发表论文35篇,SCI源期刊论文12篇、受理发明专利2项、获软件著作权登记2项等。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
3

基于余量谐波平衡的两质点动力学系统振动频率与响应分析

基于余量谐波平衡的两质点动力学系统振动频率与响应分析

DOI:10.6052/1672⁃6553⁃2017⁃059
发表时间:2018
4

湖北某地新生儿神经管畸形的病例对照研究

湖北某地新生儿神经管畸形的病例对照研究

DOI:
发表时间:2019
5

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021

魏庆来的其他基金

相似国自然基金

1

基于自适应动态规划的非线性系统鲁棒控制与分散镇定

批准号:61304086
批准年份:2013
负责人:王鼎
学科分类:F0301
资助金额:25.00
项目类别:青年科学基金项目
2

基于事件驱动自适应动态规划的模型未知非线性系统最优控制

批准号:61603382
批准年份:2016
负责人:朱圆恒
学科分类:F0301
资助金额:21.00
项目类别:青年科学基金项目
3

基于自适应动态规划的脉冲系统优化方法研究

批准号:61104006
批准年份:2011
负责人:王小华
学科分类:F0301
资助金额:24.00
项目类别:青年科学基金项目
4

非线性系统鲁棒镇定与跟踪控制的自适应动态规划方法

批准号:61503379
批准年份:2015
负责人:杨雄
学科分类:F0301
资助金额:20.00
项目类别:青年科学基金项目