该项目研究的目的是探索混合系统分层控制的最优控制机制。研究的基础是马尔可夫决策过程的性能势、策略迭代、算子理论、随机微分方程以及最优控制理论的结合。我们从分层控制的角度研究如下模型,考虑一个两层的系统,上层是事件驱动系统,可以建模为马氏链,上层决定下层的运行模式。每个模式下,下层时间驱动系统的动态方程可以用随机差分方程或随机微分方程来描述。这类问题不仅具有重要的理论意义,同时也有相当的实际应用价值。针对这类问题,我们从马尔可夫决策过程的角度提出解决控制问题的一个新方法。基于策略迭代方法,我们可以发展出针对这类控制问题的在线学习和优化算法。
{{i.achievement_title}}
数据更新时间:2023-05-31
EBPR工艺运行效果的主要影响因素及研究现状
复杂系统科学研究进展
基于被动变阻尼装置高层结构风振控制效果对比分析
基于MCPF算法的列车组合定位应用研究
二维FM系统的同时故障检测与控制
基于策略迭代算法的随机Markov跳变系统优化控制研究
基于免疫动态优化策略分层的电子控制空气悬架鲁棒控制系统设计方法
基于时间序列的非线性系统优化迭代学习控制策略和应用边值问题研究
基于集合器分层优化的入网电动汽车控制策略研究