For future smart road, the intelligent vehicles rely on not only the road itself, but also the communication and computing resources provided by the intelligent road-side infrastructure. The road traffic scheduling and routing game among vehicles may break the statistical traffic features, which are used by resource scheduling in information domain. Therefore, the resources in information domain and transportation domain are complicatedly coupled, and the joint optimization of these multi-domain resources is confronted with the huge state-action space, which cannot be solved in a real-time effective manner. To deal with this spatiotemporal complexity, based on the cognition complementarity and decision coupling of vehicles, this project uses overlapping coalition game to obtain vehicle clusters and divide the state-action space into smaller ones. Then, this project utilizes graph convolutional neural network to extract the time sequence and road topology features of traffic status, and then accurately reconstructs a panorama of traffic status to support the state completeness requirement of the multi-domain resource coordination. Finally, by modeling the quality of service requirement of intelligent driving, this project leverages multi-agent deep reinforcement learning to generate the joint optimization policy, and takes advantage of a mixing network to ensure that the distributed decisions of vehicles can achieve the global optimization. By leveraging the distributed policy network on vehicles instead of the centralized iterative optimization, this project will finally realize the effective coordination of information domain and transportation domain, and improve the safety and efficiency of intelligent driving.
未来智慧道路环境中,智能汽车不仅依赖城市道路资源,还依赖智能化道路基础设施的通信、计算等资源。由于交通环境中车流调控及车辆群体的选路博弈,会打破信息域资源调度所依赖的交通流统计规律,导致智慧道路信息域和交通域资源调度存在复杂耦合,多域资源联合优化的状态和动作空间庞大,难以实时有效解算。本项目首先通过重叠联盟博弈,基于认知互补度、决策耦合度划分车辆群体,利用群体智能分解问题的状态和动作空间,以有效应对时空规模复杂性。然后,基于图卷积神经网络提取交通状态演变的时序拓扑关联,全面准确认知交通态势,满足多域资源协同所依赖的状态认知完备性。在此基础上,抽象智能驾驶服务质量需求,基于车辆群体多代理深度强化学习,获得多域资源联合优化策略,并利用价值混合网络保证车辆群智决策与系统优化目标的一致性,最终以分布式策略网络代替集中式迭代寻优,实现信息域和交通域的高效协同,有效提升智能驾驶的安全与效率。
经过三年来的攻研,严格按照原申请书的计划展开研究,项目圆满实现了申请书中的总体目标,部分目标超额完成。项目以智慧道路信息域和交通域资源的耦合为关注点,充分利用交通主体的泛在计算能力、协同认知能力和联合决策能力,对交通主体多维协作关系构建、交通态势时空演变特征认知、“网-路”资源跨域主动优化等三项核心问题进行研究。通过分析智慧道路多域资源的供需特征,提出基于群体智能的资源分配体系架构,具体包括基于意图推断的协作关系构建算法、基于时空图卷积的交通态势认知算法、基于多智能体强化学习的跨域资源优化方法等关键技术,保证资源使用的高效性和服务质量的稳定性。基于Carla、SUMO和NS3研制了信息域和交通域资源联合调度原型系统,支撑相关学术成果的验证。系统提供的群智协同模块能够灵活快速地部署协同认知和协同决策算法,并通过数据处理与可视化模块直观地展现动态指标。围绕基于群体智能的信息域和交通域资源优化形成了一整套创新性研究成果,在相关领域产生了一定的影响力,三项代表性成果如下:.(一)面向群智认知决策的车辆多维协作关系构建。针对复杂交通环境下交通主体协作关系维度高、变化快的难题,研究基于意图推断的协作关系构建方法,取得了重要的研究成果。利用注意力机制根据交通场景发掘协作意图、确定协作拓扑,通过信息瓶颈理论精简交互内容、提升交互效率,奠定群智协同的基础。.(二)基于时序拓扑关联的交通态势认知。以三维时变图模型为基础对交通态势认知的理论和方法进行了研究,取得了重要的研究成果。利用三维卷积同时对时间和空间依赖进行建模,通过堆叠三维卷积单元构造残差网络学习宏观交通态势的演变规律,基于时空图卷积设计目标检测与追踪一体化模型,实现微观交通态势的预测。.(三)车辆群智协同决策的“网-路”资源分配。针对车辆轨迹规划和通信计算资源分配的联合优化问题进行了研究,取得了重要的研究成果。提出基于冲突图的通信资源分配与数据卸载方法,设计基于多智能体强化学习的跨域资源优化方法,构造双分支卷积网络以协调信息域的服务迁移动作和交通域的选路动作,提供可靠高效的智能驾驶服务。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
拥堵路网交通流均衡分配模型
基于多模态信息特征融合的犯罪预测算法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
信息环境下的城市道路交通规划理论与方法
云环境下加密域可逆信息隐藏的新方法研究
交通信息诱导下的道路复杂物理特性研究
宽频地震多域联合AVO反演方法研究