基于近似动态规划的数据驱动非线性多输入多输出在线优化与控制算法

基本信息
批准号:61403250
项目类别:青年科学基金项目
资助金额:24.00
负责人:黄志坚
学科分类:
依托单位:上海海事大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:陈文涛,张琴,武起立,杨智远,谭亲明,钟庆源,杨鹏飞
关键词:
数据驱动非线性多输入多输出在线近似动态规划优化控制
结项摘要

With the development of marine science, aerospace, energy chemical industry, biomedical and management science etc., many complex systems are facing with optimization and control problems. The approximate dynamic programming solves the "curse of dimensionality" problem of dynamic programming, which is an emerging method for solving optimization and control in recent years. This project, based on analysis of optimal systems, researches the structures and methods of approximate dynamic programming and presents its algorithm, firstly focusing on an integrated problem of three demands on nonlinear multi-input multi-output structure, online learning and data driven method. The research is carried out from the following four aspects: 1) the structure topology of nonlinear multi-input multi-output approximate dynamic programming based on topology principle; 2) the local average approximation to the cost function of the critic module of approximate dynamic programming adopting data-driven K-Nearest Neighbor approach; 3) the policy iteration calculation of the multi-output action module of approximate dynamic programming with a exponential convergence performance; 4) the synchronous learning of the critic and action modules and their online optimization and control. This research will lay a theoretical and applied foundation for data-drive nonlinear multi-input multi-output online optimization and control based on approximate dynamic programming. The research is also a consistent demand and consensus for the above science and engineering areas in optimal control, artificial intelligence, energy conservation, decision support and logistics management as well as other aspects.

随着海洋科学、航空航天、能源化工、生物医学以及管理科学等的发展,许多复杂系统面临着优化与控制的难题。近似动态规划解决了动态规划的维数灾问题,是近年来兴起的一种近似优化新解法。本项目基于优化系统的分析,首次针对非线性多输入多输出结构、在线学习、以及数据驱动这三个集中需求的一个综合问题,在一个新的层次上研究近似动态规划的结构与方法,并提出其学习算法。研究围绕以下四个方面展开:1)基于拓扑原理构建非线性多输入多输出近似动态规划的结构;2)采用数据驱动K近邻方法逼近近似动态规划多维输入评价模块的代价函数;3)面向指数收敛性能计算近似动态规划执行模块的多输出策略迭代;4)评价与执行模块的同步学习及其在线优化与控制。为实现基于近似动态规划的数据驱动非线性多输入多输出在线优化与控制奠定理论及应用基础;这也是上述很多科学和工程领域在优化控制、人工智能、节能减排、决策支持以及运筹管理等方面的一致需求与共识。

项目摘要

随着海洋科学、航空航天、能源化工、生物医学以及管理科学等的发展,许多复杂系统面临着优化与控制的难题。近似动态规划解决了动态规划的维数灾问题,是近年来兴起的一种近似优化新解法。本项目基于优化系统的分析,首次针对非线性多输入多输出结构、在线学习、以及数据驱动这三个集中需求的一个综合问题,在一个新的层次上研究近似动态规划的结构与方法,并提出其学习算法。. 研究围绕以下四个方面展开:1)基于拓扑原理构建非线性多输入多输出近似动态规划的结构。2)采用数据驱动K近邻方法逼近近似动态规划多维输入评价模块的代价函数。3)面向指数收敛性能计算近似动态规划执行模块的多输出策略迭代。4)评价与执行模块的同步学习及其在线优化与控制。. 结果:1)构建出四种非线性多输入多输出的近似动态规划结构,即执行网络扩展方法、子网方法、级联执行网络方法、组合方法。论证了其梯度下降训练算法不满足复合矩阵/向量对标量求导的链式法则,并给出解决方案和该四种方法的算法公式。 2)采用K近邻方法逼近评价网络的值函数,以克服神经网络的固有缺点,获得良好数据驱动能力;采用神经网络逼近执行网络控制输出,以获得非线性和多输入多输出性能,并添加持续激励信号,以逼近指数收敛;得出混合方法的近似动态规划。3)采用Lyapunov稳定理论,证明了在二次型、平方加权和、绝对值/模之和的效用函数下,非线性多输入多输出近似动态规划具有稳定与收敛性能。4)基于二次型形式逼近评价网络值函数,多输入多输出ADRC解耦控制逼近执行网络控制输出系数,得出一种不采用神经网络的在线数据驱动非线性多输入多输出近似动态规划方法。并以发动机缸平衡和水下热滑翔机姿态调节的优化控制为例,验证其优化与控制效果。. 研究结果为实现基于近似动态规划的数据驱动非线性多输入多输出在线优化与控制奠定理论及应用基础;这也是上述很多科学和工程领域在优化控制、人工智能、节能减排、决策支持以及运筹管理等方面的一致需求与共识。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

DOI:10.16085/j.issn.1000-6613.2022-0221
发表时间:2022
4

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
5

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020

黄志坚的其他基金

批准号:39670322
批准年份:1996
资助金额:10.00
项目类别:面上项目

相似国自然基金

1

基于近似动态规划的复杂工业过程数据驱动双网运行优化控制方法研究

批准号:61673280
批准年份:2016
负责人:李金娜
学科分类:F0302
资助金额:61.00
项目类别:面上项目
2

基于近似动态规划的非线性系统鲁棒优化控制

批准号:61374042
批准年份:2013
负责人:姜钟平
学科分类:F0301
资助金额:79.00
项目类别:面上项目
3

基于多输入多输出变可信度近似模型的稳健性设计优化方法研究

批准号:51805179
批准年份:2018
负责人:周奇
学科分类:E0506
资助金额:24.00
项目类别:青年科学基金项目
4

多输入多输出非线性时滞系统模糊控制新方法研究

批准号:60674055
批准年份:2006
负责人:陈兵
学科分类:F0301
资助金额:25.00
项目类别:面上项目