面向动态实时人工智能应用的大规模机器学习系统协同调度技术研究

基本信息
批准号:61872376
项目类别:面上项目
资助金额:66.00
负责人:黄峰
学科分类:
依托单位:中国人民解放军国防科技大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:张一鸣,李佳鑫,张鹏飞,胡智尧,李婷,左钟融,王旭,王贺春,杜广雷
关键词:
大规模机器学习系统动态任务图协同调度实时处理人工智能应用
结项摘要

New AI (artificial intelligence) applications perform dynamic learning through real-time interactions with environments. The vector intensive computation of conventional AI applications can be represented as static directed acyclic graphs(DAG), but new AI applications usually have distinct properties including dynamically-changed computation, real-time task scheduling, and concurrent heterogeneous tasks. In this project, we will study the collaborative scheduling techniques of large-scale machine learning systems for dynamic real-time AI applications, mainly including the following aspects. First, focusing on the property of dynamically-changed computation, we will study the evolving computation model for dynamic tasks, so as to realize dynamic adjustment of task graphs based on the feedback of the environment. Second, focusing on the requirement of real-time task scheduling, we will study delay-bounded distributed scheduling, using relaxed consistency model to realize high-throughput, low-latency scalable task scheduling and real-time action selection. Last, focusing on the property of concurrent heterogeneous tasks, we will study heterogeneous resource collaboration mechanism based on dynamic requirement resolution, so as to realize adaptive on-demand allocation of various computation, storage, and networking resources.

以强化学习为代表的新型人工智能(AI)应用通过与环境的实时交互进行动态学习。传统AI应用的向量密集型计算通常可表示为静态的有向无环图(DAG),而新型AI应用则具有计算动态变化、实时任务调度、任务异构并发等新特点。本项目将对面向动态实时AI应用的大规模机器学习系统协同调度技术开展研究,主要包括如下内容。首先,研究大规模机器学习系统中动态任务的演化计算模型,支持基于环境反馈的任务图动态调整。其次,研究延迟有界的分布式调度技术,基于松弛一致性模型实现高吞吐量、低延迟的可扩展任务调度和实时动作选择。最后,研究基于动态需求分解的异构资源协同机制,实现计算、存储和网络等多种资源的自适应按需分配。

项目摘要

很多新型的AI应用无法采用传统的学习方式,而是需要与环境进行动态不间断的交互,并且采取一系列动作来实现特定目标。这类以强化学习为代表的新型AI应用具有与传统AI应用完全不同的计算特点和需求。项目组从2019年开始开展了面向动态实时人工智能应用的大规模机器学习系统协同调度技术的研究,取得如下成果:.(1)设计了动态机器学习任务的演化计算模型。面向任务动态变化的新型AI系统,实现了异构资源的协调机制,提出了新的演化计算模型,以及动态机器学习任务在该模型中的表示。提出分布式机器学习应用程序到DAG图的抽象映射。.(2)实现了延迟有界的可扩展分布式任务调度。实现了多级内存存储之间的自适应动态调整机制,设计了基于主备机制(Primary-Backup)的多级存储快速失效恢复方法。实现了的多级状态更新一致性模型,设计了高可靠、高可用的元数据组织方法。.(3)设计了基于动态需求分解的异构资源协同机制。提出了基于DAG图的需求分析方法,能够预测各项计算任务的计算、内存存储、网络传输等资源的预计消耗情况。设计了协同调度机制,能够按需分配I/O带宽、CPU时间、动态内存、网络带宽等多种资源。.项目组在NeurIPS、ICASSP、INFOCOM、TC等著名期刊和会议发表论文27篇,其中CCF-A类期刊和会议论文17篇、CCF-B类期刊和会议论文3篇。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
3

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
4

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
5

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020

黄峰的其他基金

批准号:11675261
批准年份:2016
资助金额:72.00
项目类别:面上项目
批准号:30371136
批准年份:2003
资助金额:20.00
项目类别:面上项目
批准号:11078015
批准年份:2010
资助金额:32.00
项目类别:联合基金项目
批准号:51871172
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:31600430
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:30170027
批准年份:2001
资助金额:21.00
项目类别:面上项目
批准号:31571858
批准年份:2015
资助金额:66.00
项目类别:面上项目
批准号:51871231
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:11105220
批准年份:2011
资助金额:30.00
项目类别:青年科学基金项目
批准号:51201119
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:51505455
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目
批准号:41401011
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:31301429
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:30871985
批准年份:2008
资助金额:35.00
项目类别:面上项目
批准号:41807230
批准年份:2018
资助金额:22.00
项目类别:青年科学基金项目

相似国自然基金

1

面向大规模多步学习问题的学习分类元系统技术研究

批准号:61502274
批准年份:2015
负责人:臧兆祥
学科分类:F06
资助金额:20.00
项目类别:青年科学基金项目
2

面向大规模数据的机器学习算法研究

批准号:61175050
批准年份:2011
负责人:吴高巍
学科分类:F0603
资助金额:54.00
项目类别:面上项目
3

面向大规模机器学习的高效优化算法研究

批准号:61806128
批准年份:2018
负责人:彭涵阳
学科分类:F0603
资助金额:25.00
项目类别:青年科学基金项目
4

面向控制与实时调度的协同设计研究

批准号:60374058
批准年份:2003
负责人:金宏
学科分类:F0301
资助金额:22.00
项目类别:面上项目