大规模不确定性半Markov系统基于性能势的鲁棒控制和神经元动态规划优化

基本信息
批准号:60404009
项目类别:青年科学基金项目
资助金额:24.00
负责人:唐昊
学科分类:
依托单位:合肥工业大学
批准年份:2004
结题年份:2007
起止时间:2005-01-01 - 2007-12-31
项目状态: 已结题
项目参与者:陆阳,韩江洪,程文娟,郑淑丽,马学森,袁继彬,周雷
关键词:
神经元动态规划性能势最优鲁棒控制策略半Markov决策过程
结项摘要

半Markov决策过程(SMDP)描述的一类实际人造系统,即受控半Markov系统,具有状态空间规模大和模型参数不确定性两个重要特点,存在"建模难"和"维数灾"问题。项目首先针对参数不确定性,运用最新的SMDP性能势理论,研究参数相关和不相关两种情况下,求解最优鲁棒控制策略的有关理论和算法;其次,针对"维数灾"和"建模难"情形,本项目把SMDP性能势理论和先进的神经元动态规划(NDP)方法有机结合,根据系统的单个样本轨道,研究基于Monto-Carlo仿真、TD学习和Q学习的NDP优化理论和算法。针对折扣性能准则和平均性能准则,将给出统一的理论框架和算法;参数空间或策略空间的探索中,将融入进化算法或模拟退火算法等全局搜索方法;同时给出并行算法;建立存在计算误差、不确定性误差、估计偏差或逼近误差时的最优性能误差界。研究结果对改进系统设计、提供鲁棒决策机制、提高系统的管理水平具有一定科学意义。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

特斯拉涡轮机运行性能研究综述

特斯拉涡轮机运行性能研究综述

DOI:10.16507/j.issn.1006-6055.2021.09.006
发表时间:2021
4

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

DOI:10.13465/j.cnki.jvs.2020.09.026
发表时间:2020
5

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019

唐昊的其他基金

批准号:81572637
批准年份:2015
资助金额:45.00
项目类别:面上项目
批准号:81370137
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:21307029
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:81000007
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:61174186
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:81670015
批准年份:2016
资助金额:55.00
项目类别:面上项目
批准号:81202122
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:61573126
批准年份:2015
资助金额:65.00
项目类别:面上项目

相似国自然基金

1

半马尔可夫控制过程基于性能势的优化理论和并行算法

批准号:60274012
批准年份:2002
负责人:奚宏生
学科分类:F0301
资助金额:23.00
项目类别:面上项目
2

基于自适应动态规划的非线性系统鲁棒控制与分散镇定

批准号:61304086
批准年份:2013
负责人:王鼎
学科分类:F0301
资助金额:25.00
项目类别:青年科学基金项目
3

随机Markov跳跃系统的鲁棒控制与滤波设计

批准号:60674015
批准年份:2006
负责人:牛玉刚
学科分类:F0301
资助金额:24.00
项目类别:面上项目
4

半Markov决策过程基于灵敏度优化及其应用

批准号:61004036
批准年份:2010
负责人:李衍杰
学科分类:F0301
资助金额:20.00
项目类别:青年科学基金项目