Low power is one important objective in developing multicore and manycore processor. With the increase of the number of cores, problems related to line-delay and energy consumption become increasing significant. The structure of a shared Cache is very important to the power management of multicore processors. Research on low-power multicore processors using shared Cache is of great significance to the design and development of manycore- and super-computer. .The proposed project will conduct research on shared Cache partitioning based on way-prediction and reconfiguration to reduce power use of processors. In terms of the program locality principle, it employs both private and shared resource allocation methods to implement a hybrid partitioning strategy for power reduction. Taking into account access frequency and the LRU algorithm, it predicts the data way through which the same data set is accessed next and reduces the frequency of missed ways. Depending on the application context, corresponding associativity and parameters of the cache can be adjusted dynamically to reduce power use, by activating some ways and putting others to a dormant state.
低功耗是多核/众核处理器发展中所追求的重要目标之一。随着处理器核心数量的增多,会带来线延迟增加和功耗增大的问题。共享Cache的结构对多核体系结构的处理器功耗有着重要的影响。面向共享Cache的多核处理器低功耗技术的研究对未来不断发展的众核处理器、艾级超级计算机等的低功耗设计有重要意义。.本项目将在已有相关研究的基础上,着重对多核处理器中共享二级Cache的划分方法、路预测算法和Cache可重构方法进行研究来降低功耗。利用程序运行的局部性原理,通过私有和共享两种资源分配方式相结合来实施共享Cache的混合划分,通过关闭Cache列来降低功耗;通过综合考虑Cache的访问频率和LRU替换算法,预测同一个数据组中下一个预先访问的数据路,避免对不命中的路的访问;根据应用需求动态改变Cache的相联度及相应参数,使每一路或多路能在不同的情况下处于工作或休眠状态,从而降低功耗。
处理器芯片的功耗不但在很大程度上影响着处理器的性能、封装、测试以及系统可靠性等,还在很大程度上决定着未来多核处理器设计的发展方向。本项目的主要研究内容分为几个部分,一是对多核处理器的共享Cache设计更好的划分算法,实现在运行同一个应用时,使用更少的Cache列,关闭剩余列,达到降低系统功耗的目的;二是对共享在Cache划分的基础上对划分给该进程/线程的路进行预测,并结合访问频率,根据上次Cache访问的结果路和访问频率最高的路来决定同一个数据组中下一次预先访问的数据路,根据预测的结果直接访问该路数据,从而大幅度降低功耗;三是设计可重构Cache的自适应算法,使其应用于多核处理器的共享二级Cache上,通过在程序运行的过程中动态地获得程序运行相关参数继而改变二级Cache的相联度,从而在保证性能的基础上降低功耗。.本课题的重要研究成果包括如下几个方面:1. 提出了面向低功耗的多核Cache动态混合划分算法(LPHP)以及兼顾公平性的LP-PF算法。通过多核系统模拟器Simics来实现对多核系统Cache访存状况的模拟,结合SPEC2000测试用例,实验结果表明,在16核处理器系统中,LPHP算法与基于传统LRU替换策略的均分算法相比,功耗降低了20.3%;与LP-CP算法相比,功耗降低了12.77%。LP-PF算法的公平性比LPHP算法提高了51.58%,性能损失非常小;比面向公平性的I-F CP算法,功耗降低了11.71%,公平性提高了18.87%。因此,本课题提出的LP-PF算法无论是在降低系统功耗方面还是提升系统公平性方面都有很大的提高。2. 提出了一种基于共享Cache划分的路预测算法WPP-L2,在降低共享L2 Cache的访问功耗的同时尽量优化对共享L2 Cache的使用。通过多核模拟器对该算法进行验证,在16核处理器系统的共享L2 Cache下实现了WPP-L2路预测算法,WPP-L2比普通的划分算法的执行时间平均提高25.7%,功耗降低65%;3.设计出用于共享Cache重构策略,通过加入重构模块对共享Cache进行动态的关闭或打开,达到重构的目的。实验结果证明该策略平均降低了系统的18%功耗,对性能的损失平均为4%左右。上述在多核处理器中针对共享Cache所做的优化工作对未来不断发展的众核处理器、艾级超级计算机等的低功耗设计有着重要的意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于LASSO-SVMR模型城市生活需水量的预测
拥堵路网交通流均衡分配模型
基于多模态信息特征融合的犯罪预测算法研究
多源数据驱动CNN-GRU模型的公交客流量分类预测
时间序列分析与机器学习方法在预测肺结核发病趋势中的应用
面向共享Cache多核处理器的数据库查询执行优化算法研究
多核处理器中面向对象Cache体系结构技术研究
片上多处理器共享Cache优化关键技术研究
共享二级Cache的片上多处理器Cache块分布技术研究