面向无人机集群时敏目标搜索的深度强化学习及云端训练优化

基本信息
批准号:61906209
项目类别:青年科学基金项目
资助金额:21.00
负责人:刘志宏
学科分类:
依托单位:中国人民解放军国防科技大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
多智能体系统深度强化学习时敏目标搜索云计算无人机集群
结项摘要

For the needs of large-scale time-sensitive target search in the fields of disaster response, environmental protection, etc., this project focuses on the problem of the time-sensitive target search for UAV swarms under uncertain conditions, based on the multi-agent deep reinforcement learning and cloud computing distributed parallel technology. We will research the following three aspects: 1) In view of the uncertainty of target distribution, sensory observation and other uncertain factors affecting the effectiveness of UAV swarms cooperative search in the real application, the modeling method for the time -sensitive target search for UAV swarms under uncertain conditions is studied. 2) According to the characteristics of the non-stationary environment of multi-agent system, combined with the characteristics of neighbor cooperation in UAV swarms, we study the multi-agent deep reinforcement learning algorithm based on neighbor interaction under non-stationary environments. 3) For the fact that deep reinforcement learning relying on a large number of environmental interactions leads to long training time, by using distributed parallel technology in cloud computing, we design a distributed storage architecture for empirical data, and research an asynchronous parallel training optimization method for multi-agent reinforcement learning. This project aims to explore practical and feasible approach for the time-sensitive target search for UAV swarms from the perspective of intelligent learning and effectively improve the efficiency of large-scale time-sensitive target search. This project will provide important supports to the research and application of UAV swarms and new generation artificial intelligence.

面向灾难响应、环境保护等领域中大范围时敏目标搜索的重要需求,本项目基于多智能体深度强化学习和云计算分布式并行技术,围绕不确定条件下无人机集群时敏目标搜索问题,展开三个方面的研究:1)针对现实应用中目标信息、传感器观测等不确定因素对方法有效性造成严重影响的问题,研究不确定条件下无人机集群时敏目标搜索的感知决策建模方法;2)针对多智能体系统非稳态环境的特点,结合无人机集群邻居局部协作的特征,研究非稳态环境中基于邻居交互的多智能体深度强化学习算法;3)针对深度强化学习依赖于大量环境交互导致训练耗时长的问题,结合云计算分布式并行技术,设计经验数据的分布式存储架构,研究多智能体深度强化学习的异步并行训练优化方法。本课题旨在从智能学习的角度,探索切实可行的无人机集群时敏目标搜索方法,有效提高大范围时敏目标搜索的效率,并为无人机集群及新一代人工智能的理论研究和应用提供支持。

项目摘要

面向灾难响应、环境保护等领域中大范围时敏目标搜索的迫切需求,本课题基于多智能体深度强化学习和云计算分布式并行技术,围绕无人机集群时敏目标搜索问题,展开了三个方面的研究:1)针对现实应用中目标分布、传感器观测等不确定因素对方法有效性造成严重影响的问题,研究了不确定条件下无人机集群时敏目标搜索的感知决策建模方法;2)针对多智能体系统非稳态环境的特点,结合无人机集群邻居局部协作的特征,研究了基于邻居交互的多智能体深度强化学习算法;3)针对深度强化学习依赖于大量环境交互导致训练耗时长的问题,结合云计算分布式并行技术,研究了多智能体深度强化学习的异步并行训练优化方法。项目提出了无人机集群时敏目标搜索序贯决策模型、面向无人机集群时敏目标搜索的多智能体强化学习算法、基于云计算的异步并行优化方法等模型及算法,并对所提方法进行了仿真验证,与现有方法相比,所提方法使得无人机集群搜索跟踪到的目标数量分别高出26% 、12% 和17%,同时可以扩展到大规模(1000架)集群中。所提的基于邻居交互的无人机集群碰撞规避算法,能够有效实现无人机集群在飞行过程中的碰撞规避。所设计的基于云计算的异步并行优化方法,运用3台服务器,能够有效的提高训练速度,与1台服务器相比,加速比最高可达到8.29。项目成果发表了学术论文13篇,其中,CCF/CAA推荐A类或B类期刊7篇,1篇1作论文获全球ESI前1%高被引,1篇论文获入选《航空学报》2020年最受关注论文。项目成果为基于学习的无人机集群决策控制方法奠定了基础,推动了无人机集群和新一代人工智能的理论研究及应用拓展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
3

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
4

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
5

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018

刘志宏的其他基金

批准号:61173135
批准年份:2011
资助金额:51.00
项目类别:面上项目
批准号:41072150
批准年份:2010
资助金额:48.00
项目类别:面上项目
批准号:81360415
批准年份:2013
资助金额:54.00
项目类别:地区科学基金项目
批准号:40772125
批准年份:2007
资助金额:40.00
项目类别:面上项目
批准号:59506011
批准年份:1995
资助金额:9.50
项目类别:青年科学基金项目
批准号:51574285
批准年份:2015
资助金额:64.00
项目类别:面上项目
批准号:21173143
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:51872127
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:19502016
批准年份:1995
资助金额:9.00
项目类别:青年科学基金项目
批准号:50874121
批准年份:2008
资助金额:35.00
项目类别:面上项目
批准号:21573142
批准年份:2015
资助金额:67.00
项目类别:面上项目
批准号:51874364
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:11175097
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:20902052
批准年份:2009
资助金额:19.00
项目类别:青年科学基金项目
批准号:20871078
批准年份:2008
资助金额:30.00
项目类别:面上项目
批准号:81672515
批准年份:2016
资助金额:57.00
项目类别:面上项目
批准号:21344003
批准年份:2013
资助金额:10.00
项目类别:专项基金项目

相似国自然基金

1

基于深度强化学习的集群资源调度算法研究

批准号:61872397
批准年份:2018
负责人:肖臻
学科分类:F0204
资助金额:66.00
项目类别:面上项目
2

面向空时影像变化检测的多目标深度学习模型与方法

批准号:61772393
批准年份:2017
负责人:公茂果
学科分类:F06
资助金额:66.00
项目类别:面上项目
3

面向智能视频监控系统中目标理解的长时程深度学习模型研究

批准号:61471206
批准年份:2014
负责人:孙宁
学科分类:F0116
资助金额:81.00
项目类别:面上项目
4

面向云端大数据的可搜索加密关键技术研究

批准号:61872133
批准年份:2018
负责人:刘琴
学科分类:F0206
资助金额:63.00
项目类别:面上项目