本项目将研究抛物型非线性系统基于自适应迭代动态规划的鲁棒实时最优控制问题。拟解决目前对非线性抛物型系统无穷维最优控制的求解难题,建立以自适应动态规划为基础的一套新的理论体系和求解方案,开辟求解非线性抛物型系统最优控制的新途径。主要研究内容包括:1. 研究基于自适应迭代动态规划理论的慢系统最优控制问题;2. 深入研究包括快慢两个子系统的整个抛物型系统基于自适应动态规划的混合最优控制问题;3. 研究基于自适应动态规划的不确定抛物型非线性系统的鲁棒最优控制问题;4. 针对分布式系统的快慢分解和不确定性,建立一种统一有效的自适应动态规划方法使得对于抛物型系统可以直接求解其鲁棒实时的混合最优控制。上述研究成果将为非线性抛物型系统的鲁棒混合最优控制理论提供新的思路,丰富最优控制理论的研究内容,同时为复杂工业实际中非线性抛物型系统的分析和控制提供必要的科学理论依据和关键技术保证。
本项目针对一类抛物型分布参数系统,首次建立了在线自适应迭代优化的概念,并在多种状态和控制约束以及模型不确定条件下,提出了几种新型的自适应动态规划算法,包括双启发式动态规划算法,两阶段二次迭代算法,混合迭代二人零和算法,单阶段多人非零和算法,构建了基于自适应动态规划的分布参数系统优化控制的理论构架,解决了抛物型分布系统难以精确建模和在线最优控制的关键理论问题,建立了混合鲁棒最优控制下整个闭环系统的稳定性和整体算法的收敛性,并探索了整体系统的性能指标同自适应动态规划中的拓扑网络参数之间的定量关系,提出了鲁棒最优控制器的参数设计及自适应调节方法。项目在研期间,负责人较为系统地研究了几类无限时间和有限时间最优镇定控制、最优跟踪控制以及零和与非零和对策问题,其中关于非线性系统跟踪控制的结果为国际首例,08年至今一直引领着国内外学者争相研究和跟进。对于镇定问题,针对执行器带有饱和或死区特性以及控制方向未知等难点,提出非二次泛函和Nussbaum函数来处理非线性函数隐含控制输入的问题,首次建立了状态和控制约束下在线最优控制的一般框架;对于跟踪问题,针对系统动态未知以及时变目标轨迹无法依据定常系统处理等难点,提出了基于输入/输出数据的鲁棒近似最优跟踪控制策略,建立了新型的数据驱动模型来重构未知系统动态,并且构建了全新增广子系统,开辟了时变最优跟踪控制的新思路;对于对策问题,针对非线性系统带有外界扰动和建模不确定性等难点,提出了全新的在线自适应策略学习方案,利用神经网络作为在线参数近似结构,设计执行网络和扰动网络使得代价函数最小化和最大化,有效求解了系统的纳什均衡点。在本项目完成过程中,主要从理论方面进行了深层次的研究,在科学出版社出版专著1部,在美国Springer出版社出版专著1部,发表论文23篇,其中 SCI检索12篇(在IEEE 会刊发表长文4篇),发表专利4项,指导毕业硕士生6人,协助指导毕业博士生3人。由于自适应动态规划方面的突出工作,项目负责人2012年开始担任国际IEEE计算智能协会的自适应动态规划与增强学习技术局委员,并担任了2011、2013和2014年IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning的程序委员会委员,并在2014的会议上组织了专题小组并担任主席。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
涡度相关技术及其在陆地生态系统通量研究中的应用
粗颗粒土的静止土压力系数非线性分析与计算方法
拥堵路网交通流均衡分配模型
低轨卫星通信信道分配策略
分数阶鲁棒自适应迭代学习控制方法的研究及实现
非线性切换系统在线鲁棒近似优化控制研究
随机迭代依赖不确定系统的鲁棒学习控制
具有非线性参数化严格反馈非线性系统的鲁棒自适应控制