大规模不确定性半Markov系统基于性能势的鲁棒控制和神经元动态规划优化

基本信息

批准号：60404009

项目类别：青年科学基金项目

资助金额：24.00

负责人：唐昊

学科分类：

依托单位：合肥工业大学

批准年份：2004

结题年份：2007

起止时间：2005-01-01 - 2007-12-31

项目状态：已结题

项目参与者：陆阳,韩江洪,程文娟,郑淑丽,马学森,袁继彬,周雷

关键词：

神经元动态规划性能势最优鲁棒控制策略半Markov决策过程

结项摘要

半Markov决策过程（SMDP）描述的一类实际人造系统，即受控半Markov系统，具有状态空间规模大和模型参数不确定性两个重要特点，存在"建模难"和"维数灾"问题。项目首先针对参数不确定性，运用最新的SMDP性能势理论，研究参数相关和不相关两种情况下，求解最优鲁棒控制策略的有关理论和算法；其次，针对"维数灾"和"建模难"情形，本项目把SMDP性能势理论和先进的神经元动态规划（NDP）方法有机结合，根据系统的单个样本轨道，研究基于Monto-Carlo仿真、TD学习和Q学习的NDP优化理论和算法。针对折扣性能准则和平均性能准则，将给出统一的理论框架和算法；参数空间或策略空间的探索中，将融入进化算法或模拟退火算法等全局搜索方法；同时给出并行算法；建立存在计算误差、不确定性误差、估计偏差或逼近误差时的最优性能误差界。研究结果对改进系统设计、提供鲁棒决策机制、提高系统的管理水平具有一定科学意义。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

DOI：10.19328/j.cnki.2096-8655.2022.02.002

发表时间：2022

DOI：10.1360/SSM-2020-0035

发表时间：2020

DOI：10.3969/j.issn.1004-132X.2020.03.001

发表时间：2020

唐昊的其他基金

批准号：81572637

批准年份：2015

资助金额：45.00

项目类别：面上项目

批准号：81370137

批准年份：2013

资助金额：70.00

项目类别：面上项目

批准号：21307029

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：81000007

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

批准号：61174186

批准年份：2011

资助金额：60.00

项目类别：面上项目

批准号：81670015

批准年份：2016

资助金额：55.00

项目类别：面上项目

批准号：81202122

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

批准号：61573126

批准年份：2015

资助金额：65.00

项目类别：面上项目

相似国自然基金

半马尔可夫控制过程基于性能势的优化理论和并行算法

批准号：60274012

批准年份：2002

负责人：奚宏生

学科分类：F0301

资助金额：23.00

项目类别：面上项目

基于自适应动态规划的非线性系统鲁棒控制与分散镇定

批准号：61304086

批准年份：2013

负责人：王鼎

学科分类：F0301

资助金额：25.00

项目类别：青年科学基金项目

随机Markov跳跃系统的鲁棒控制与滤波设计

批准号：60674015

批准年份：2006

负责人：牛玉刚

学科分类：F0301

资助金额：24.00

项目类别：面上项目

半Markov决策过程基于灵敏度优化及其应用

批准号：61004036

批准年份：2010

负责人：李衍杰

学科分类：F0301

资助金额：20.00

项目类别：青年科学基金项目

大规模不确定性半Markov系统基于性能势的鲁棒控制和神经元动态规划优化

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

新型树启发式搜索算法的机器人路径规划

"多对多"模式下GEO卫星在轨加注任务规划

现代优化理论与应用

机电控制无级变速器执行机构动态响应特性仿真研究

唐昊的其他基金

LDLRAP1基因3’非翻译区通过内源性miR-133海绵作用调控骨肉瘤凋亡的机制研究

YKL-40诱导支气管哮喘气道重构的机制性研究

基于纳米孔和离子特异性DNA酶的重金属离子检测

YKL-40调控支气管上皮细胞的炎症反应在哮喘急性发作中的作用

多站点传送带给料加工站的在线协同优化控制方法

YKL-40诱导人支气管上皮细胞表达HMGB-1在哮喘气道重构中的作用

miR-143/HDAC7 pathway 通过调控组蛋白乙酰化改变影响骨肉瘤转移特性的分子机制研究

多维度柔性传送带给料加工站的优化控制模型与方法及鲁棒性

相似国自然基金