面向新模型的深度神经网络求解器的共性组件关键技术研究:算法与性能提升

基本信息
批准号:61876175
项目类别:面上项目
资助金额:16.00
负责人:曹建文
学科分类:
依托单位:中国科学院软件研究所
批准年份:2018
结题年份:2019
起止时间:2019-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:吴学凇,陈雪,卢亚楠,王宇鹏,孙经天,欧天翔
关键词:
深度神经网络高可扩展并行计算非线性优化求解无监督逐层预学习
结项摘要

The development of depth/reinforcement learning (DNN) brings great promise to practical applications such as speech recognition, visual object recognition and text processing. In recent years, utilising GPUs as a parallel method to solve deep learning problems is a significant achievement in recent years to tackle modestly sized deep networks in practice. The DNN parallel optimization algorithm design for GPUs, has great restrictions on sparsity of gradient operators (Hessian matrices) and amount and frequency of processes. It limits the scalability and adaptability of DNN parallel algorithm. Research on resource scheduling and network optimization algorithms for practical DNN solvers in case of large scale heterogeneous platform resource sharing has become the focus of algorithm theory research and application at home and abroad. This application is geared towards a large, heterogeneous, distributed computer hardware platform (10^4~10^6 processor core level), in the case of relatively abundant in computing and network resources and resource sharing, aiming at two types of data input streams: history learning and online learning, a parallel solver for DNN optimization model with high scalability and high computational power is studied. Complete the program of DNN optimization model parallel solver and integration software and hardware system by using face image data sets.

深度神经网络DNN给语音识别、视觉物体识别和文本处理等应用领域带来巨大成功。新型模型/算法不断涌现,其内核均需求解约束非凸优化问题,严重依赖于数据集规模、硬件平台和非线性优化的迭代求解性能。随着数据规模扩大和DNN模型参数增多,非线性优化求解器在GPU集群上的可扩展性和计算能力方面存在大的性能瓶颈。显著提升DNN求解器在大型异构硬件平台上的可扩展性和计算能力,关键在于子空间迭代,其严重依赖于优化的图剖分、Hessian矩阵预条件子。 计算资源共享的高计算性能,密切依赖于系统级网络调度和优化算法。本项目面向资源共享情形下的10^6核级异构硬件平台,针对历史/在线学习的海量数据,研究具有高可扩展性和高效计算能力的、10^12模型参数的DNN优化模型求解器,针对人脸图像数据集,进行并行软件实现和“数据输入流-DNN求解器-分布式平台”的一体化系统集成,形成大规模分布式深度学习求解软件。

项目摘要

深度神经网络DNN给语音识别、视觉物体识别和文本处理等应用领域带来巨大成功。新型模型/算法不断涌现,其内核均需求解约束非凸优化问题,严重依赖于数据集规模、硬件平台和非线性优化的迭代求解性能。随着数据规模扩大和DNN模型参数增多,非线性优化求解器在GPU集群上的可扩展性和计算能力方面存在大的性能瓶颈。显著提升DNN求解器在大型异构硬件平台上的可扩展性和计算能力,关键在于子空间迭代,其严重依赖于优化的图剖分、Hessian矩阵预条件子。 计算资源共享的高计算性能,密切依赖于系统级网络调度和优化算法。..本项目重点研究了DNN优化求解器设计中的共性关键问题,主要包括:DNN优化问题的高性能并行求解算法,分层分级图剖分和自上而下的多级并行求解框架,相关性评价的度量函数,基于协方差和迹算子理论的两个特征空间中与样本类别高度相关的共性特征的的有效提取算法等。本项目针对DNN优化问题高性能并行求解器的若干关键部件进行算法研究和程序实现,重点研究稀疏表达、高逼近精度的预条件子构造,以及基于Hessian-free的Quasi-Newton非线性求解算法的高性能并行实现。..我们在DNN新型模型的算法研究的基础上,也进行了应用领域的探索性研究。在医学图像分析层面,我们对计算机视觉领域目标检测、分割与分类进行有针对性的研究,提出并实现了基于Faster R-CNN + FCN + MGRF + Fusion 的医学图像辅助诊断模型。在病历文本阅读理解和智能问答层面,我们对机器阅读理解进行了有针对性的研究,提出并实现了基于Paragraph-ranking + BiDAF + Self Attention + MCV 的机器阅读理解模型RBiDAF。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

特斯拉涡轮机运行性能研究综述

特斯拉涡轮机运行性能研究综述

DOI:10.16507/j.issn.1006-6055.2021.09.006
发表时间:2021
4

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

曹建文的其他基金

批准号:91230109
批准年份:2012
资助金额:70.00
项目类别:重大研究计划
批准号:91530109
批准年份:2015
资助金额:25.00
项目类别:重大研究计划
批准号:10776035
批准年份:2007
资助金额:34.00
项目类别:联合基金项目
批准号:61170325
批准年份:2011
资助金额:54.00
项目类别:面上项目

相似国自然基金

1

深度学习算法可重构加速器关键技术研究

批准号:61303070
批准年份:2013
负责人:姜晶菲
学科分类:F0204
资助金额:23.00
项目类别:青年科学基金项目
2

无线传感网中面向移动目标检测的最小暴露路径问题的优化新模型与求解算法研究

批准号:61662018
批准年份:2016
负责人:叶苗
学科分类:F0208
资助金额:40.00
项目类别:地区科学基金项目
3

面向大规模电池组件监测的无线传感器网络数据融合模型及算法研究

批准号:61661020
批准年份:2016
负责人:黄勇
学科分类:F0104
资助金额:44.00
项目类别:地区科学基金项目
4

面向嵌入式深度神经网络处理器的低功耗设计技术研究

批准号:61874124
批准年份:2018
负责人:王颖
学科分类:F0402
资助金额:63.00
项目类别:面上项目