数值求解最优控制: 动态规划方法

基本信息
批准号:60974032
项目类别:面上项目
资助金额:31.00
负责人:郭宝珠
学科分类:
依托单位:中国科学院数学与系统科学研究院
批准年份:2009
结题年份:2012
起止时间:2010-01-01 - 2012-12-31
项目状态: 已结题
项目参与者:姚翠珍,王树亮,吴涛涛,杨坤一,金凤飞,周林芳,李学文,李建鹏
关键词:
数值解法偏微分方程粘性解反馈控制律收敛性最优控制
结项摘要

寻找最优反馈是控制理论梦寐寻以求的目标. 但是除去一般线性系统的LQ 或LQS问题外及其少量个别例子外, 对一般非线性系统, 特别是无穷维系统,最优控制问题的最优反馈律的解析求解是不可能的. 所以数值求解是唯一可能且有实践意义的途径. 目前的数值求解最优反馈律主要是基于Pontryagin极大值原理的打靶法. 这个方法有两个主要的问题, 一是要猜测初值, 二是求出的控制是开环的. 本项目采取完全不同的途径,即数值求出由Bellman动态规划导出的HJB 方程为基础的最优反馈控制数值解. HJB方程的解由1980年代发展的粘性解理论所保证. 即最优控制问题的值函数是相应的HJB方程的粘性解. 基于粘性解理论数值求解最优反馈控制刚开始于我们已经开展的几个成功的数值求解最优反馈控制的例子, 本项目将提出一般的算法并证明算法的收敛性,特别关注分布参数系统.

项目摘要

本项目的主要目的是用动态规划方法数值求解最优控制。 是十分艰难的研究课题, 没有现成的结果可用。 我们发展了离散的HJB方程粘性解的数值解算法, 彻底证明了收敛性。再利用HJB方程的解提出计算具有反馈形式的数值最优控制的算法, 并严格的证明了收敛性。 考虑到HJB方程的数值解并不是全部有用, 所以我们围绕最优控制提出了一种局部算法, 在HJB方程解用过之后就不再保存, 所以算法有效克服了维数灾难。 可惜局部算法的收敛性虽然用数值实验所证实, 但由于一些可能的HJB数值的缺乏, 理论上收敛性还在进行。算法用到了HIV-AIDS治疗模型, 取得了成功。 . 本项目执行期间发表杂志论文22篇, 专著一本。 7篇主要国际会议论文。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

DOI:10.13465/j.cnki.jvs.2020.09.026
发表时间:2020
2

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

DOI:
发表时间:2020
3

钢筋混凝土带翼缘剪力墙破坏机理研究

钢筋混凝土带翼缘剪力墙破坏机理研究

DOI:10.15986/j.1006-7930.2017.06.014
发表时间:2017
4

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

DOI:
发表时间:2018
5

双吸离心泵压力脉动特性数值模拟及试验研究

双吸离心泵压力脉动特性数值模拟及试验研究

DOI:10.13465/j.cnki.jvs.2020.19.016
发表时间:2020

郭宝珠的其他基金

批准号:61873260
批准年份:2018
资助金额:65.00
项目类别:面上项目
批准号:61273129
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:69404002
批准年份:1994
资助金额:8.30
项目类别:青年科学基金项目
批准号:69874003
批准年份:1998
资助金额:10.00
项目类别:面上项目
批准号:60374019
批准年份:2003
资助金额:15.00
项目类别:面上项目

相似国自然基金

1

求解带PDE约束最优控制问题的数值方法研究

批准号:11701210
批准年份:2017
负责人:宋海明
学科分类:A0405
资助金额:25.00
项目类别:青年科学基金项目
2

动态规划粘性解方法及其在最优控制问题中的应用

批准号:11001012
批准年份:2010
负责人:孙兵
学科分类:A0601
资助金额:17.00
项目类别:青年科学基金项目
3

求解非线性半定规划的数值算法研究

批准号:11226223
批准年份:2012
负责人:李阳
学科分类:A0405
资助金额:3.00
项目类别:数学天元基金项目
4

求解 Sylvester 方程的数值方法

批准号:10926150
批准年份:2009
负责人:鲍亮
学科分类:A0502
资助金额:3.00
项目类别:数学天元基金项目