调试消息传递程序(MPI)是并行计算的重大挑战,确定性重播是辅助调试的重要技术。目前的确定性重播技术在日志的记录和管理中存在以下不足:每个进程产生独立的日志文件,导致日志文件数量多,管理复杂;直接将日志写入磁盘或者通过网络文件系统写入服务器磁盘性能不理想;MPI程序中存在内容相同的消息,现有方法会重复记录这些消息,浪费日志空间。这些不足限制了重播方法的实际应用。本项目提出基于分布式键值对网络存储的确定性重播技术,深入挖掘分布式键值对网络存储与确定性重播技术的结合点,主要研究:面向MPI程序重播的定制的分布式键值对网络存储系统,消除程序员管理日志的负担,保证日志存取速度;独立于MPI运行库,重播引擎和键值对网络存储的数据服务中间件,保证程序移植性;重复消息在线全局删冗技术,进一步减小日志规模。最终的目标是提供透明的低开销的基于分布式键值对网络存储的MPI重播方案。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
拥堵路网交通流均衡分配模型
卫生系统韧性研究概况及其展望
面向云工作流安全的任务调度方法
键值对直接存储架构及机制研究
基于纠删码的异构分布式内存键值存储系统构建及性能优化
基于消息传递的大规模多层网络免疫机制研究
云计算环境下键值存储系统查询优化技术研究