多核平台下的高效线程级猜测执行机制研究

基本信息
批准号:61272143
项目类别:面上项目
资助金额:60.00
负责人:沈立
学科分类:
依托单位:中国人民解放军国防科技大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:甘新标,徐帆,郑重,陈顼颢,朱琪,温家辉,郭辉,王琼
关键词:
多核运行时系统体系结构线程级猜测执行优化
结项摘要

How to utilize the computation resources integrated into processors in a simple and efficient way is an important challenge brought by current multi-core architectures. To solve this problem, programming model, runtime environment and architecture must be combined together reasonably. Although TLS (Thread Level Speculation) mechanism has enough potential to be a candidate, its effect is constrained greatly by the lack of supports from architecture and runtime environment, and the great overhead from TLS mechanism itself. This project will start from a deep analysis of characteristics of current TLS mechanisms. Then, efficient TLS model, efficient supporting mechanisms from multi-core architecture and runtime environment will be studied and proposed. Finally, based on them, a TLS-oriented programming model and corresponding compilation framework will be proposed, with which sequential C/C++ codes or binary codes can be converted to multi-thread codes automatically and effective performance improvement can also be obtained. Researches in this project will obtain some innovation results including co-designed TLS model, efficient supporting mechanisms of TLS from architecture and runtime environment, TLS-oriented compilation techniques and thread identification strategies, etc. They could be used directly in current design of multi-core and even many-core platforms, and have important theoretical meanings and practical values.

如何简洁、高效地利用处理器中集成的丰富计算资源,是多核体系结构带来的一个重要挑战。为解决这一问题,必须将编程模型、运行时环境及体系结构有机地结合在一起。尽管线程级猜测执行(Thread Level Speculation,TLS)机制具备解决该问题的足够潜力,但由于缺乏体系结构和运行时环境支撑,TLS的自身开销又比较大,严重制约了其实际效果。本项目将从深入分析TLS机制自身的特点入手,研究并提出高效的TLS模型,以及多核体系结构和运行时环境对TLS的高效支撑机制,在此基础上总结TLS编程模型,设计编译框架,自动将串行C/C++代码或二进制代码转换为多线程代码,并获得有效的性能提升。本项目研究将在软硬协同的TLS模型、高效支持TLS的体系结构和运行时环境、面向TLS的编译技术和线程划分策略等方面取得创新研究成果。这些成果可以直接应用于多核乃至众核平台设计,具有重要的理论意义和实际应用价值。

项目摘要

与传统的非猜测多线程编程模型相比,线程级猜测执行机制既能提供简洁的并行编程模型,又能有效开发出应用程序特别是串行应用中的线程级并行。然而,由于缺乏处理器体系结构和运行时环境的有效支持,现有的TLS机制存在着不少缺陷,如自身开销大、误猜率高等。为了解决这些问题,本课题在深入分析现有TLS系统和多核处理器体系结构特征的基础上,研究支持TLS的多核体系结构、高效的TLS编程模型和优化手段。本课题取得的研究成果主要有:1)提出了基于猜测变量生命周期的TLS系统设计空间,明确了TLS系统的设计方向;为多核处理器设计了一种基于Local Memory的猜测数据缓存,以实现高效的猜测变量管理与共享;提出了基于硬件计数器的多核处理器功耗模型,以评估TLS系统的功耗;2)提出了一种高效的TLS编程模型,HEUSPEC,并基于LLVM实现了HEUSPEC编译器,在确保获得较高性能加速比的同时,大大降低了开发多线程程序的复杂度;3)提出了面向TLS的运行时机制以及优化策略,并在HEUSPEC系统中实现。上述成果已成功地应用在目前流行的商用多核处理器以及国产的飞腾系列多核处理器平台上。此外,为了将上述成果应用于异构多核处理器平台,本课题还研究了并行应用在异构融合多处理器平台的运行特征。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
3

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018
4

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018
5

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018

相似国自然基金

1

多核多线程DSP适应性存储结构研究

批准号:61070036
批准年份:2010
负责人:郭阳
学科分类:F0204
资助金额:32.00
项目类别:面上项目
2

多核帮助线程应用中高性能的预取质量确保机制研究

批准号:61070029
批准年份:2010
负责人:古志民
学科分类:F0204
资助金额:30.00
项目类别:面上项目
3

基于线程级推测的非规则算法并行化研究

批准号:61602388
批准年份:2016
负责人:刘斌
学科分类:F0204
资助金额:20.00
项目类别:青年科学基金项目
4

基于执行反馈的多核软件动态分析方法研究

批准号:61300017
批准年份:2013
负责人:胡燕
学科分类:F0203
资助金额:23.00
项目类别:青年科学基金项目