基于多Agent的通信交互式动态影响图研究及应用

基本信息

批准号：60975052

项目类别：面上项目

资助金额：31.00

负责人：罗键

学科分类：

依托单位：厦门大学

批准年份：2009

结题年份：2012

起止时间：2010-01-01 - 2012-12-31

项目状态：已结题

项目参与者：曾一锋,黄春庆,席斌,庄进发,潘颖慧,吴长庆,李波,曹二众

关键词：

交互式动态影响图自动小车存取系统多Agent决策模型概率图模型多Agent通信

结项摘要

多Agent的通信行为是目前国际上研究多Agent决策问题中具有挑战性的新课题，其图形表述和模型求解尤为引人瞩目。目前的交互式动态影响图（I-DIDs）忽略了Agent的通信能力，主要通过对其他Agent模型的猜测和识别来推断其可能的决策，这存在着主观性和不确定性，导致模型效用降低、求解困难、应用受限。本项目在前期工作的基础上，将Agent的通信行为引入I-DIDs，应用概率图模型理论、部分可观测马尔可夫决策过程性质和最大奖励期望值原理，建模通信交互式动态影响图（Com-I-DIDs）；根据值等价和行为等价原理重构其他Agent模型节点的条件概率模型，提出新的模型求解方法，降低计算难度，确保模型解的最优性；根据Cooper价值节点转化法，通过对其他Agent行为的灵敏度分析探索多Agent相互建模嵌套层数；开发Com-I-DIDs决策软件，以自动小车存取系统为例进行应用研究。

项目摘要

.针对以往交互式动态影响图（I-DIDs）忽略了Agent的通信能力，从而导致模型效用降低、求解困难、应用受限等问题。本项目在前期工作的基础上，将Agent的通信行为引入到I-DIDs，应用概率图模型理论、部分可观测马尔可夫决策过程性质和最大奖励期望值原理，建立基于I-DID的通信交互式动态影响图(Com-I-DID)模型。为解决通信交互式动态影响图和交互式动态影响图的候选模型空间太大问题，发明了两种减少模型空间的算法：第一种算法聚集了行为等价类并选择性的更新模型，只更新那些在下一个时间片有不同预测行为的模型；第二种算法进一步压缩了模型空间，将每一个时间片动作相同的模型进行聚类。为进一步简化计算，提出了一种用双压缩方法的近似求解算法。本项目以自动小车存取系统为例进行了通信交互式动态影响图(Com-I-DID)模型的应用仿真实验。. 此外，本项目研究中，进一步探讨了交互式动态影响图I-DID和通信交互式动态影响图(Com-I-DID)在原理、模型和算法方面的若干共性，并提出一系列更具有普遍性的方法。这些方法具有在空间和时间上同时对模型进行聚类的能力，采用面向对象设计的概念来优化自我扩展和自我压缩；提出一种基于部分决策树的模型求解算法，并改进了利用部分策略树来判断行为等价的方法，发展了一种叫做增长式比较的策略；提出基于分段行为等价的模型改进算法；提出基于信度-行为的交互式动态影响图的近似算法。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.16796/j.cnki.1000-3770.2022.03.003

发表时间：2022

DOI：

发表时间：2021

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：10.12202/j.0476-0301.2022178

发表时间：2022

DOI：

发表时间：2020

罗键的其他基金

批准号：51075413

批准年份：2010

资助金额：38.00

项目类别：面上项目

相似国自然基金

基于数据驱动的多智能体交互式动态影响图算法研究与应用

批准号：61562033

批准年份：2015

负责人：潘颖慧

学科分类：F06

资助金额：39.00

项目类别：地区科学基金项目

基于值等价的交互式动态影响图的求解方法研究与应用

批准号：61772442

批准年份：2017

负责人：曾一锋

学科分类：F06

资助金额：58.00

项目类别：面上项目

基于交互式动态影响图的未知对手模型学习

批准号：61375070

批准年份：2013

负责人：曾一锋

学科分类：F0305

资助金额：76.00

项目类别：面上项目

基于交互式动态影响图的光储微网运行控制研究

批准号：61703091

批准年份：2017

负责人：李波

学科分类：F0302

资助金额：23.00

项目类别：青年科学基金项目

基于多Agent的通信交互式动态影响图研究及应用

{{i.achievement_title}}

暂无此项成果

其他相关文献

EBPR工艺运行效果的主要影响因素及研究现状

基于铁路客流分配的旅客列车开行方案调整方法

一种基于多层设计空间缩减策略的近似高维优化方法

复杂系统科学研究进展

基于多色集合理论的医院异常工作流处理建模

罗键的其他基金

载流-搅拌摩擦焊接热效应及其组织结构变化规律

相似国自然基金