面向动态实时人工智能应用的大规模机器学习系统协同调度技术研究

基本信息

批准号：61872376

项目类别：面上项目

资助金额：66.00

负责人：黄峰

学科分类：

依托单位：中国人民解放军国防科技大学

批准年份：2018

结题年份：2022

起止时间：2019-01-01 - 2022-12-31

项目状态：已结题

项目参与者：张一鸣,李佳鑫,张鹏飞,胡智尧,李婷,左钟融,王旭,王贺春,杜广雷

关键词：

大规模机器学习系统动态任务图协同调度实时处理人工智能应用

结项摘要

New AI (artificial intelligence) applications perform dynamic learning through real-time interactions with environments. The vector intensive computation of conventional AI applications can be represented as static directed acyclic graphs(DAG), but new AI applications usually have distinct properties including dynamically-changed computation, real-time task scheduling, and concurrent heterogeneous tasks. In this project, we will study the collaborative scheduling techniques of large-scale machine learning systems for dynamic real-time AI applications, mainly including the following aspects. First, focusing on the property of dynamically-changed computation, we will study the evolving computation model for dynamic tasks, so as to realize dynamic adjustment of task graphs based on the feedback of the environment. Second, focusing on the requirement of real-time task scheduling, we will study delay-bounded distributed scheduling, using relaxed consistency model to realize high-throughput, low-latency scalable task scheduling and real-time action selection. Last, focusing on the property of concurrent heterogeneous tasks, we will study heterogeneous resource collaboration mechanism based on dynamic requirement resolution, so as to realize adaptive on-demand allocation of various computation, storage, and networking resources.

以强化学习为代表的新型人工智能（AI）应用通过与环境的实时交互进行动态学习。传统AI应用的向量密集型计算通常可表示为静态的有向无环图（DAG），而新型AI应用则具有计算动态变化、实时任务调度、任务异构并发等新特点。本项目将对面向动态实时AI应用的大规模机器学习系统协同调度技术开展研究，主要包括如下内容。首先，研究大规模机器学习系统中动态任务的演化计算模型，支持基于环境反馈的任务图动态调整。其次，研究延迟有界的分布式调度技术，基于松弛一致性模型实现高吞吐量、低延迟的可扩展任务调度和实时动作选择。最后，研究基于动态需求分解的异构资源协同机制，实现计算、存储和网络等多种资源的自适应按需分配。

项目摘要

很多新型的AI应用无法采用传统的学习方式，而是需要与环境进行动态不间断的交互，并且采取一系列动作来实现特定目标。这类以强化学习为代表的新型AI应用具有与传统AI应用完全不同的计算特点和需求。项目组从2019年开始开展了面向动态实时人工智能应用的大规模机器学习系统协同调度技术的研究，取得如下成果：.（1）设计了动态机器学习任务的演化计算模型。面向任务动态变化的新型AI系统，实现了异构资源的协调机制，提出了新的演化计算模型，以及动态机器学习任务在该模型中的表示。提出分布式机器学习应用程序到DAG图的抽象映射。.（2）实现了延迟有界的可扩展分布式任务调度。实现了多级内存存储之间的自适应动态调整机制，设计了基于主备机制（Primary-Backup）的多级存储快速失效恢复方法。实现了的多级状态更新一致性模型，设计了高可靠、高可用的元数据组织方法。.（3）设计了基于动态需求分解的异构资源协同机制。提出了基于DAG图的需求分析方法，能够预测各项计算任务的计算、内存存储、网络传输等资源的预计消耗情况。设计了协同调度机制，能够按需分配I/O带宽、CPU时间、动态内存、网络带宽等多种资源。.项目组在NeurIPS、ICASSP、INFOCOM、TC等著名期刊和会议发表论文27篇，其中CCF-A类期刊和会议论文17篇、CCF-B类期刊和会议论文3篇。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.16796/j.cnki.1000-3770.2022.03.003

发表时间：2022

DOI：10.12202/j.0476-0301.2022178

发表时间：2022

DOI：

发表时间：2020

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

DOI：10.19328/j.cnki.2096-8655.2022.02.002

发表时间：2022

黄峰的其他基金

批准号：11675261

批准年份：2016

资助金额：72.00

项目类别：面上项目

批准号：30371136

批准年份：2003

资助金额：20.00

项目类别：面上项目

批准号：11078015

批准年份：2010

资助金额：32.00

项目类别：联合基金项目

批准号：51871172

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：31600430

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：30170027

批准年份：2001

资助金额：21.00

项目类别：面上项目

批准号：31571858

批准年份：2015

资助金额：66.00

项目类别：面上项目

批准号：51871231

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：11105220

批准年份：2011

资助金额：30.00

项目类别：青年科学基金项目

批准号：51201119

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：51505455

批准年份：2015

资助金额：21.00

项目类别：青年科学基金项目

批准号：41401011

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：31301429

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：30871985

批准年份：2008

资助金额：35.00

项目类别：面上项目

批准号：41807230

批准年份：2018

资助金额：22.00

项目类别：青年科学基金项目

相似国自然基金

面向大规模多步学习问题的学习分类元系统技术研究

批准号：61502274

批准年份：2015

负责人：臧兆祥

学科分类：F06

资助金额：20.00

项目类别：青年科学基金项目

面向大规模数据的机器学习算法研究

批准号：61175050

批准年份：2011

负责人：吴高巍

学科分类：F0603

资助金额：54.00

项目类别：面上项目

面向大规模机器学习的高效优化算法研究

批准号：61806128

批准年份：2018

负责人：彭涵阳

学科分类：F0603

资助金额：25.00

项目类别：青年科学基金项目

面向控制与实时调度的协同设计研究

批准号：60374058

批准年份：2003

负责人：金宏

学科分类：F0301

资助金额：22.00

项目类别：面上项目

面向动态实时人工智能应用的大规模机器学习系统协同调度技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

EBPR工艺运行效果的主要影响因素及研究现状

复杂系统科学研究进展

基于多色集合理论的医院异常工作流处理建模

新型树启发式搜索算法的机器人路径规划

"多对多"模式下GEO卫星在轨加注任务规划

黄峰的其他基金

尘埃等离子体中分形颗粒的生长机理及特性研究

环境友好制浆漂白脱木素新技术的研究

矮星系中暗物质湮灭信号的研究

交变应力和H2S腐蚀电化学耦合作用下管线钢氢析出、渗透与氢致开裂机理及原子尺度模拟

氮沉降增加背景下微生物群落结构与功能变化对凋落物分解的反馈调节

白腐菌代谢物儿茶酚类与过渡金属组建新的木素降解体系

热休克蛋白27对宰后牛肉嫩化的调控机制研究

锆合金防护用铬基多元非晶厚膜的合金设计与事故容错行为研究

尘埃等离子体斑图的形成机理研究

H2S腐蚀产物界面性能对管线钢氢渗透动力学行为的影响机理及规律

基于主动转速调制的旋转血泵生理自适应控制研究

梯级水库对长江枯水期生态水文情势影响的时空尺度效应研究

牛肉成熟过程中细胞凋亡酶对钙激活酶的作用机制研究

外场辅助非酶因子在木纤素物质生物降解中的协同作用

真空负压作用下非饱和粉细砂层渗透注浆增注机制研究

相似国自然基金