信息约束下的博弈学习动力学及其在协同控制中的应用

基本信息

批准号：61873088

项目类别：面上项目

资助金额：60.00

负责人：谭少林

学科分类：

依托单位：湖南大学

批准年份：2018

结题年份：2022

起止时间：2019-01-01 - 2022-12-31

项目状态：已结题

项目参与者：欧阳博,贾林,吴昊天,陈南凯,刘俊阳,曾凯,彭伟星,黎乾雄

关键词：

有限信息协调控制演化博弈博弈学习复杂网络

结项摘要

Game-based cooperative control is a new interdisciplinary research field at the cross-point of game learning and cooperative control. With a game model representing the problem of cooperative control, and using game learning dynamics to design cooperative control algorithms, the game-based cooperative control provides a new framework for solving the tasks of cooperative control in various applications. Current studies on game learning dynamics are mainly based on the complete information assumption, and information limitation is the core challenge in application of game learning dynamics in cooperative control problems. In this proposal, beginning with two typical information limitations, including networked information and minimal information, and by using analysis tools of network theory and optimization methods, systematic investigations will be carried out on design, analysis, and applications of game learning dynamics with limited information. In detail, some design methods of game learning dynamics with limited information will be established; and the applicable game types and convergence performances of the learning dynamics will be clarified. Furthermore, cooperative control algorithms will be designed and applied to different kinds of cooperative control problems based on the game learning dynamics with limited information. Completeness of this project will enrich the content of game theory, enhance the applications of game learning in cooperative control, and provide a new theoretical and technical perspective for understanding the collective decision-making process in complex systems.

基于博弈学习的协同控制是博弈学习和协同控制结合而形成的新型交叉研究领域，它以博弈模型刻画协同控制问题，利用博弈学习动力学设计协同控制算法，为解决各类工程任务中的协同控制问题提供了一个新的研究框架。目前，博弈学习研究主要基于完全信息条件，而实际工程应用中的信息约束是制约博弈学习理论在协同控制问题中应用的核心难点。本课题从网络信息约束与最小信息约束等两类典型信息约束出发，利用网络科学与最优化方法相关理论与工具，对信息约束下的博弈学习动力学构造、分析与应用展开系统的探索：建立若干信息约束下博弈学习动力学的构造方法；阐明不同博弈学习动力学所适用的博弈类型以及收敛效率；设计基于信息约束下博弈学习动力学的协同控制算法，并考察其在各类协同控制问题中应用。本课题的实现，能够从信息约束的新视角丰富博弈学习理论的内容、扩大其在协同控制问题中的应用范围，并为理解复杂系统中的集群决策行为提供新的理论与技术支持。

项目摘要

分布式人工智能是当前人工智能领域的重大热点前沿问题。分布式智能的一个核心挑战性问题是：如何通过智能体的局部信息获取与计算能力来生成群体智能。围绕该问题，本课题在国自科面上基金项目的支持下，对分布式信息约束下的博弈学习动力学的设计与分析展开了研究，并在多智能体协同控制等领域中开展应用。主要成果如下：.1）针对有限策略博弈的分布式纳什均衡搜索问题，构建了基于时间戳的分布式惯性最优响应动力学，并证明了对于一类广义的弱非循环博弈，该博弈学习动力学能够以概率1收敛于纳什均衡。与当前最优算法相比，我们提出的算法不仅以概率1收敛（以正概率停留），且收敛速度提高约5倍。该结果能够解决一大类分布式有限博弈问题。这些成果发表于IEEE Trans. Neural Netw. Learn. Syst. Doi: 10.1109/TNNLS.2022.3183250等.2）针对连续策略博弈的分布式纳什均衡搜索问题，我们提出了基于增广博弈的效用函数解耦方法，形成了基于增广博弈的分布式纳什均衡算法的构造与分析方法，为分布式纳什均衡算法提供了一个博弈原型。这些成果发表于IEEE Trans. Cybernetics, doi: 10.1109/TCYB.2022.3174196, 2022等.3）针对群体博弈的分布式纳什均衡搜索问题，我们引入了图广义纳什均衡的概念并建立了该均衡与基于局部竞争的演化动力学平衡点之间的映射关系。此外，为了适用强耦合群体博弈，我们基于一致性协议，构建了基于一致性的分布式群体演化动力学，并证明其纳什均衡收敛性。该成果发表于IEEE Trans. Syst. Man. Cyber，doi: 10.1109/TSMC.2022.3188266，2022等.在构建上述系列算法的同时，我们将所得到的算法应用于各类多智能体协同任务中，包括分布式交通路由问题、传感器网络覆盖问题、任务分配问题等，形成了基于博弈学习的多智能体系统解决方案。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.12202/j.0476-0301.2022178

发表时间：2022

DOI：10.13197/j.eeev.2019.05.95.fuwq.009

发表时间：2019

DOI：

发表时间：

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.13336/j.1003-6520.hve.20200528028

发表时间：2021

谭少林的其他基金

批准号：31901078

批准年份：2019

资助金额：25.00

项目类别：青年科学基金项目

批准号：61503130

批准年份：2015

资助金额：21.00

项目类别：青年科学基金项目

相似国自然基金

多重相关约束下的多模态学习及其在脑图像分析中的应用

批准号：61876087

批准年份：2018

负责人：杨明

学科分类：F0603

资助金额：62.00

项目类别：面上项目

带变量约束的非合作博弈及其在化工介尺度结构研究中的应用

批准号：91634203

批准年份：2016

负责人：刘志新

学科分类：B0803

资助金额：260.00

项目类别：重大研究计划

复杂约束下几何信息驱动的迭代方法及其应用

批准号：61379072

批准年份：2013

负责人：蔺宏伟

学科分类：F0209

资助金额：76.00

项目类别：面上项目

均衡约束数学规划问题的几个算法及其在机器学习中的应用

批准号：11761014

批准年份：2017

负责人：陈玉

学科分类：A0405

资助金额：36.00

项目类别：地区科学基金项目

信息约束下的博弈学习动力学及其在协同控制中的应用

{{i.achievement_title}}

暂无此项成果

其他相关文献

复杂系统科学研究进展

基于被动变阻尼装置高层结构风振控制效果对比分析

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

带有滑动摩擦摆支座的500 kV变压器地震响应

谭少林的其他基金

滇西北典型高山峡谷区植物遗传格局成因和局域适应机制

复杂动态网络上演化博弈的群体策略选择和干预机制研究

相似国自然基金