The development of depth/reinforcement learning (DNN) brings great promise to practical applications such as speech recognition, visual object recognition and text processing. In recent years, utilising GPUs as a parallel method to solve deep learning problems is a significant achievement in recent years to tackle modestly sized deep networks in practice. The DNN parallel optimization algorithm design for GPUs, has great restrictions on sparsity of gradient operators (Hessian matrices) and amount and frequency of processes. It limits the scalability and adaptability of DNN parallel algorithm. Research on resource scheduling and network optimization algorithms for practical DNN solvers in case of large scale heterogeneous platform resource sharing has become the focus of algorithm theory research and application at home and abroad. This application is geared towards a large, heterogeneous, distributed computer hardware platform (10^4~10^6 processor core level), in the case of relatively abundant in computing and network resources and resource sharing, aiming at two types of data input streams: history learning and online learning, a parallel solver for DNN optimization model with high scalability and high computational power is studied. Complete the program of DNN optimization model parallel solver and integration software and hardware system by using face image data sets.
深度神经网络DNN给语音识别、视觉物体识别和文本处理等应用领域带来巨大成功。新型模型/算法不断涌现,其内核均需求解约束非凸优化问题,严重依赖于数据集规模、硬件平台和非线性优化的迭代求解性能。随着数据规模扩大和DNN模型参数增多,非线性优化求解器在GPU集群上的可扩展性和计算能力方面存在大的性能瓶颈。显著提升DNN求解器在大型异构硬件平台上的可扩展性和计算能力,关键在于子空间迭代,其严重依赖于优化的图剖分、Hessian矩阵预条件子。 计算资源共享的高计算性能,密切依赖于系统级网络调度和优化算法。本项目面向资源共享情形下的10^6核级异构硬件平台,针对历史/在线学习的海量数据,研究具有高可扩展性和高效计算能力的、10^12模型参数的DNN优化模型求解器,针对人脸图像数据集,进行并行软件实现和“数据输入流-DNN求解器-分布式平台”的一体化系统集成,形成大规模分布式深度学习求解软件。
深度神经网络DNN给语音识别、视觉物体识别和文本处理等应用领域带来巨大成功。新型模型/算法不断涌现,其内核均需求解约束非凸优化问题,严重依赖于数据集规模、硬件平台和非线性优化的迭代求解性能。随着数据规模扩大和DNN模型参数增多,非线性优化求解器在GPU集群上的可扩展性和计算能力方面存在大的性能瓶颈。显著提升DNN求解器在大型异构硬件平台上的可扩展性和计算能力,关键在于子空间迭代,其严重依赖于优化的图剖分、Hessian矩阵预条件子。 计算资源共享的高计算性能,密切依赖于系统级网络调度和优化算法。..本项目重点研究了DNN优化求解器设计中的共性关键问题,主要包括:DNN优化问题的高性能并行求解算法,分层分级图剖分和自上而下的多级并行求解框架,相关性评价的度量函数,基于协方差和迹算子理论的两个特征空间中与样本类别高度相关的共性特征的的有效提取算法等。本项目针对DNN优化问题高性能并行求解器的若干关键部件进行算法研究和程序实现,重点研究稀疏表达、高逼近精度的预条件子构造,以及基于Hessian-free的Quasi-Newton非线性求解算法的高性能并行实现。..我们在DNN新型模型的算法研究的基础上,也进行了应用领域的探索性研究。在医学图像分析层面,我们对计算机视觉领域目标检测、分割与分类进行有针对性的研究,提出并实现了基于Faster R-CNN + FCN + MGRF + Fusion 的医学图像辅助诊断模型。在病历文本阅读理解和智能问答层面,我们对机器阅读理解进行了有针对性的研究,提出并实现了基于Paragraph-ranking + BiDAF + Self Attention + MCV 的机器阅读理解模型RBiDAF。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
特斯拉涡轮机运行性能研究综述
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
深度学习算法可重构加速器关键技术研究
无线传感网中面向移动目标检测的最小暴露路径问题的优化新模型与求解算法研究
面向大规模电池组件监测的无线传感器网络数据融合模型及算法研究
面向嵌入式深度神经网络处理器的低功耗设计技术研究