随着多核/众核处理器的发展和普及,广大的应用编程人员需要更多地采用并行编程,以充分利用数量众多的处理器核资源。面对这一变化,传统的并行编程模式暴露出了诸多不足之处,突出表现在并行程序难于编写、难于调试及性能不确定三个方面。这些问题涉及到并行程序的编程、编译、运行、调试和调优等多个层面,彼此相互关联,很难通过某一种方法或技术将其全面解决。因此,对众核处理器并行编程问题开展系统性研究,对于提高众核环境下并行编程的效率和程序运行性能具有重要的意义。.项目计划针对众核处理器并行编程中存在的并行程序难于编写、难于调试和性能不确定三个难点,提出以系统的观点改善众核处理器并行编程的思路,在以数据为中心及面向领域的众核编程模型与方法、并行编程语言扩展、众核并行程序运行时支持及性能优化、并行程序可重现调试方法及众核体系结构支持五个层面开展研究,形成一套可有效提高众核处理器并行编程效率和运行性能的系统性方法
针对传统的并行编程模式在多核/众核平台暴露出的并行程序难于编写、难于调试及性能不确定三个问题,本项目以一种贯穿编程模型、并行调试、运行时和体系结构等多个层次的系统研究方法,重点是1)研究了基于弱一致性存储模型的事务并行编程模型中的快速提交、一致性违背检测以及冲突串行化处理等焦点问题,在GPU上实现了事务存储编程框架,并将研究成果应用于软件定义网络领域的并行编程;2)研究了针对弱一致性存储模型的并行程序可重现调试中的记录与重放的效率问题,提出的全局时钟方法用极小的日志就可以记录并行程序执行的不确定性因素;3)研究了机器学习硬件加速器,可以以极低的能耗获得极高的性能,我们还在国际上提出了首个深度学习处理器指令集。.本项目总计发表50篇高水平论文。我们在计算机学会推荐的A类会议(ISCA, MICRO, ASPLOS,HPCA)发表论文11篇,获得两次最佳论文奖,一次最高评分论文,在A类期刊发表论文10篇,在权威期刊Communication of ACM 和ACM Computing Survey 各发表论文一篇,在微电子领域权威期刊IEEE Journal of Solid-State Circuits发表论文一篇。上述计算机体系结构和微电子领域最高水平的期刊和会议论文共24篇,占全部论文近一半。另外还发表计算机学会推荐的B类期刊和会议11篇,其中在编程领域的著名会议CGO 两次获得最佳论文提名;发表其他SCI期刊10篇;发表微电子领域著名会议(ISSCC)论文1篇;发表国内一级学报4篇。申请发明专利11 项。.本项目培养博士生10 人、硕士生21 人。项目组成员陈云霁获得首届自然科学基金委优秀青年基金和2014年度计算机学会青年科学家奖,杜子东的博士学位论文获得2016年度计算机学会优秀博士论文奖。.本项目在原子代码块并行编程模型、并行程序确定性重放、机器学习加速器方面的研究受到了广泛关注,得到了大量引用。弱存储一致性方面的工作从根本上推动了事务存储和Bulk编程的研究;全局时钟确定性重放的工作将并行程序记录重放的代价大幅度降低,直接推动了该领域的研究成果的应用;机器学习加速器方面的工作开创和引领了该领域的研究,形成了很大的国际影响力。综上所述,本项目完成了预期研究内容,达到了预期成果,圆满完成了研究任务。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
特斯拉涡轮机运行性能研究综述
内点最大化与冗余点控制的小型无人机遥感图像配准
中国参与全球价值链的环境效应分析
众核处理器结构上的并行程序执行模型
面向众核处理器的HEVC并行编码关键技术研究
众核处理器上并行稠密矩阵计算关键技术研究
众核平台的并行编程模型及其运行时支持技术的研究