CPU/GPGPU紧耦合异构多核系统共享Last Level Cache优化研究

基本信息
批准号:61379035
项目类别:面上项目
资助金额:75.00
负责人:楼学庆
学科分类:
依托单位:浙江大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:俞立呈,马建良,傅唯威,叶敏娇,章铁飞,潘平,孟静磊,袁明敏,邵景程
关键词:
CPU/GPGPU异构多核结构设计共享LLC性能优化
结项摘要

Integrated technology of core on chip is fast developing, greatly promoted Heterogeneous multicores on-chip system。In these systems, various resources are shared between CPUs and GPGPUs,the last-level cache(LLC)is one of the most important shared resources that affects the overall system performance especially the on-chip communication and Resource utilization. The project targets a tightly fused multi-core on-chip system of CPU and GPGPU, analyzing the different memory model from the Heterogeneous cores,figure out the optimization method of last-level cache. In detail,this project's research points are as follows: under the GPU and CPU tightly - coupled multiprocessor architecture, we analyze the effects imposed by using shared last-level cache architecture on Computing model, and classify the factors that affect the last-level cache performance,then build up a memory performance model; According to the differences memory reference patterns among of cores on the GPU and CPU tightly-coupled Heterogeneous system, there need be some Mechanisms to manage the last-level cache, typically,dynamic partitioning, reconfigure which including set cache inclusive or exclusive and replace LRU, Data Migration, better cache coherence protocol and data filtering; improve memory reference efficiency to shared last-level cache and efficiency of Task scheduling, reorder memory references from cores on Heterogeneous multicores system,improve the way that thread mapped to Heterogeneous multicores system, dynamiclly reconfigure task mapping according to last-level caches' performance,study the factors the last-level cache imposed on threads' Priority of CPU and GPU; build up the performance evaluation model of shared last-level cache, verify the impact shared last-level cache on computing model.

随着片上核心集成技术的发展,极大地推动了异构多核片上系统的发展,它们通常具有共享LLC,从而使整个系统的通讯和资源使用更加高效。本项目面向CPU+GPGPU的紧耦合异构多核片上系统,根据异构的核心对共享LLC访存模式的差异以及LLC上数据的相互共享和干扰,研究优化LLC的方法。具体内容包括:分析CPU+GPGPU紧耦合异构多核系统下共享LLC的架构对计算模型的影响,建立LLC访存性能模型;针对CPU+GPGPU紧耦合异构多核系统共享LLC数据访问模式,设计共享LLC动态划分,重配置LLC的组织结构,调整插入替换策略等,实现数据迁移,改进一致性以及提供数据过滤方法; 共享LLC访存与任务调度优化,对异构核上的访存进行重排,优化线程在异构核上的映射方式,运行时重配置任务的映射,探索LLC对CPU和GPU线程优先级的影响因素;共享LLC性能评估模型的建立,验证共享LLC对计算模型的影响。

项目摘要

片上核心集成技术的发展极大地推动了异构多核片上系统的发展,它们通常具有共享LLC,从而使整个系统的通讯和资源使用更加高效。.本项目面向CPU+GPGPU 的紧耦合异构多核片上系统,根据异构的核心对共享LLC 访存模式的差异以及LLC 上数据的相互共享和干扰,研究优化LLC 的方法。本项目研究了GPGPU的访存行为模式,提出了GPGPU上的等距离访存融合,实验得到了51%的性能提升。进一步探索了CPU+GPGPU紧耦合异构多核系统上共享LLC 的数据访问模式,提出了紧耦合异构架构的模拟器,总结了CPU和GPGPU并行运行时的访存行为特点,发现LLC主要改善GPGPU的性能,而对CPU的性能提升较小,但若不优化访存调度,CPU会被GPGPU访存严重影响。数据过滤方面,研究了访存调度改进与共享LLC旁路,实验表明在不同测试集上分别提高了6.01%和3.52% 的性能。线程和访存调度方面,提出了同步感知的GPGPU warp调度算法和同步感知的访存调度算法,同时应用两个方法可获得0.02%到21.47%的性能提升。在共享LLC计算模型方面,研究了CPU和GPGPU数据交换优化,提出了两种共享LLC数据交换缓存,平均性能提升分别为60.5%和48.2%。.本项目共发表了学术论文31篇,其中期刊论文10篇、会议论文21篇,申请专利5个(4个已授权),培养研究生8名。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

农超对接模式中利益分配问题研究

农超对接模式中利益分配问题研究

DOI:10.16517/j.cnki.cn12-1034/f.2015.03.030
发表时间:2015
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

特斯拉涡轮机运行性能研究综述

特斯拉涡轮机运行性能研究综述

DOI:10.16507/j.issn.1006-6055.2021.09.006
发表时间:2021
4

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

DOI:10.3969/j.issn.1002-0268.2020.03.007
发表时间:2020
5

氯盐环境下钢筋混凝土梁的黏结试验研究

氯盐环境下钢筋混凝土梁的黏结试验研究

DOI:10.3969/j.issn.1001-8360.2019.08.011
发表时间:2019

楼学庆的其他基金

相似国自然基金

1

面向共享Cache多核处理器的数据库查询执行优化算法研究

批准号:61070035
批准年份:2010
负责人:景宁
学科分类:F0202
资助金额:30.00
项目类别:面上项目
2

面向共享Cache多核处理器的低功耗关键技术研究

批准号:61202076
批准年份:2012
负责人:方娟
学科分类:F0204
资助金额:22.00
项目类别:青年科学基金项目
3

同指令集异构多核系统共享资源管理策略研究

批准号:61602137
批准年份:2016
负责人:贾刚勇
学科分类:F0204
资助金额:21.00
项目类别:青年科学基金项目
4

新型异构多核系统的渐近拟合优化技术研究

批准号:61173039
批准年份:2011
负责人:董小社
学科分类:F0204
资助金额:55.00
项目类别:面上项目