有限范围随机最优控制系统的数值方法与均场倒向随机系统的最优控制问题研究

基本信息
批准号:11626086
项目类别:数学天元基金项目
资助金额:3.00
负责人:凃淑恒
学科分类:
依托单位:河南工业大学
批准年份:2016
结题年份:2017
起止时间:2017-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:全然
关键词:
随机微分方程Lévy过程适定性随机动力系统
结项摘要

Traditional numerical methods for stochastic optimal control such as value iteration, policy iteration and the Markov Chain approximation method all rely on a mesh. Typically, the mesh is obtained by discretizing the state. But the method proposed in this project does not perform any discretization in the state dimension. Firstly, this project will display a numerical method for finite-horizon stochastic optimal control models, such as deriving a numerical method based on the solution of the stochastic minimum principle from piecewise-deterministic Markov processes. Then combining Monte Carlo pathwise simulation and non-parametric interpolation methods, we develop a numerical method. Second, this project will focus on optimal control problem for mean-field backward Stochastic systems: first of all, we will explore the well-posedness of the mean-field backward stochastic systems; And then, we will study the optimal control problems for mean-field backward stochastic system under no restricton on the convexity of control domain, such as partially observable problems and linear-quadratic optimal control problems etc; Finally, we will use a Malliavin calculus approach which will allow us to handle maximum principles for optimal control of non-Markovian systems.

随机最优控制的传统的数值方法总是依赖于网格,例如值迭代法、策略迭代法和马尔科夫链渐近法。这些网格又是由离散化状态区间而得到。然而在本项目的研究中我们提出的方法不再采用离散化方法。第一,本项目旨在研究有限范围随机最优控制模型的数值方法,例如尝试从分段确定的马氏过程的随机最小准则推出结果,并结合Monte Carlo模拟方法和非参数插值方法在最小准则解的基础上推导出一套数值方法。第二,该项目针对均场倒向随机系统的最优控制问题进行一系列的研究:首先,研究均场倒向随机解的适定性;其次,重点探讨在控制区域非凸的情形下均场随机系统的最优控制问题,例如部分可观测问题和LQ控制问题等,并运用Mallivian分析方法研究非马尔科夫型的均场随机系统的最优控制的最大值原理。

项目摘要

现代控制理论的核心之一是随机最优控制理论,随机最优控制理论早在60年代初就获得实际应用。我们研究的随机最优控制便是使随机控制系统的某个性能指标泛函最优的控制.解决随机最优控制问题的两种主要方法是庞特里亚金(Pontryagin)最大值原理和贝尔曼(Bellman)动态规划方法.两种方法分别从两个方面刻画了最优控制,最大值原理给出了最优控制满足的必要条件;动态规划原理建立了一族不同初始时刻和初始状态的最优控制问题与二阶PDE(HJB方程)之间的联系,通过优化HJB方程中的广义哈密顿(Hamilton)函数得到最优控制.. 本项目研究了随机最优控制系统的数值方法和倒向随机系统解的适定性等内容。第一,本项目研究了有限范围随机最优控制模型的数值方法,例如尝试从分段确定的马氏过程的随机最小准则推出结果,并结合Monte Carlo模拟方法和非参数插值方法在最小准则解的基础上推导出一套数值方法。第二,该项目针对均场和延迟倒向随机系统的最优控制问题进行一系列的研究:首先,研究均场和延迟倒向随机系统解的适定性;其次,重点探讨在控制区域非凸的情形下均场随机系统的最优控制问题,例如部分可观测问题和LQ控制问题等,并运用Mallivian分析方法研究非马尔科夫型的均场随机系统的最优控制的最大值原理。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

空气电晕放电发展过程的特征发射光谱分析与放电识别

空气电晕放电发展过程的特征发射光谱分析与放电识别

DOI:10.3964/j.issn.1000-0593(2022)09-2956-07
发表时间:2022
3

地震作用下岩羊村滑坡稳定性与失稳机制研究

地震作用下岩羊村滑坡稳定性与失稳机制研究

DOI:10.16285/j.rsm.2019.1374
发表时间:2020
4

采用黏弹性人工边界时显式算法稳定性条件

采用黏弹性人工边界时显式算法稳定性条件

DOI:10.11883/bzycj-2021-0196
发表时间:2022
5

射流角度对双燃料发动机燃烧过程的影响

射流角度对双燃料发动机燃烧过程的影响

DOI:10.16236/j.cnki.nrjxb.202204037
发表时间:2022

凃淑恒的其他基金

相似国自然基金

1

随机最优控制问题与随机哈密顿系统

批准号:11071101
批准年份:2010
负责人:韩月才
学科分类:A0601
资助金额:32.00
项目类别:面上项目
2

部分可观测平均场随机系统最优控制问题研究

批准号:11626063
批准年份:2016
负责人:李瑞敬
学科分类:A0302
资助金额:3.00
项目类别:数学天元基金项目
3

状态受约束的正倒向随机最优控制问题研究及其应用

批准号:11601285
批准年份:2016
负责人:聂天洋
学科分类:A0601
资助金额:19.00
项目类别:青年科学基金项目
4

基于非凸控制区域的倒向重随机控制系统最优控制必要条件的研究

批准号:11526195
批准年份:2015
负责人:王维峰
学科分类:A0301
资助金额:2.50
项目类别:数学天元基金项目