In recent years, computer hardware performance has increased significantly while prices have fallen a lot. This makes the in-memory databases (IMDB) are accepted by more and more applications in key areas. However, the volatility of data in main memory, and the IO bottleneck of hard disk and network significantly challenge the design of IMDB fault-tolerance sub-system that relies on data persistence. On one hand, for logging-based fault-tolerance scheme, the transaction processing speed of IMDB is much faster than that of disk-based database, which leads more log records generated in equal time. In order to limit the number of log records and increase the speed of recovery, more frequent checkpoints are required. On the other hand, for replication-based fault-tolerance scheme, the strong consistency and partition tolerance constraints make it difficult for IMDB to run in high performance. Therefore, it is essential to research on fault-tolerance technologies that effectively balance the performance of recovery and the performance of regular transaction processing. In this research, the characteristics of new CPU architectures and storage devices will be taken into account, and the main research contents cover: efficient generation of logs and fast recovery from logs; light-weight consistent checkpoints; latency optimization oriented consistent replication; and IMDB fault-tolerance oriented benchmarks. Research results will be a series of key technologies that effectively balance the performance of recovery and the performance of regular transaction processing. Furthermore, to demonstrate the application value of the research, the code will be opensourced and integrated with mainstream IMDB systems.
硬件价格下降,性能却大幅提升,使内存数据库凭借卓越的性能在越来越多的关键领域得到深入应用。然而内存数据易失的特性与磁盘、网络IO性能的瓶颈共同给基于持久化的内存数据库容错系统设计带来了巨大挑战。一方面,基于日志恢复的容错机制下,事务处理速度加快,导致产生的日志数量激增,而为了控制日志数量,提高恢复速度,需要更加频繁地生成检查点;另一方面,基于复制协议的容错机制下,强一致性和分区容忍性的制约使内存数据库性能难以发挥。可见,研究能够权衡恢复性能与正常事务性能的内存数据库容错技术至关重要。本课题拟结合新型处理器和存储设备特性,研究日志的高效生成与快速恢复,轻量级一致性检查点,面向延迟优化的一致性复制,以及面向内存数据库容错的测试基准等内容,形成一系列权衡内存数据库数据恢复性能和正常事务处理性能的关键技术。最终,通过代码开源,并与主流开源内存数据库系统集成,体现研究的应用价值。
当前内存数据库已成为电信、金融、娱乐等多种业务领域的关键基础设施。在不断追求高吞吐、低延时的事务分析处理能力同时,如何实现高效的内存数据库容错也成为研究热点。.项目针对内存数据库容错技术所面临的日志数量激增、检查点生成频繁、副本一致性代价高等一系列问题,从有效权衡数据恢复性能和正常事务处理性能这一基本原则出发,研究了若干内存数据库容错关键技术:在日志的高效快速恢复研究方面,提出基于NUMA架构加速内存数据库日志恢复和基于依赖图的命令日志并行恢复;在轻量级一致性检查点研究方面,提出了面向内存数据库一致性检查点的轻量级异步快照,基于内存双快照技术的HTAP(事务分析混合处理)加速;在面向延迟优化的一致性复制方面,提出了基于索引的一致性并行状态机复制,面向复制状态机的一致性协议自适应机制,面向联盟链的交叉容错方法;初步研究了面向内存数据库容错的测试基准;此外还扩展研究了内存数据库索引容错技术;并在分布式时空数据、数据流等场景下进行了内存数据库容错技术的应用。.项目实现了高效的基于副本复制的恢复、高效的日志与检查点恢复、成果实用化等设定的研究目标。发表高水平学术论文16篇,其中期刊论文11篇(CCFA 1篇,CCFB 5篇,CCFC 2篇,CCF中文T1 1篇,CCF中文T2 1篇;SCI 索引9篇,EI索引10篇),会议论文5篇(CCFB 3篇,CCFC 2篇)。SCIE统计总引用数为23。申请发明专利3项。共培养与研究方向相关的博士研究生2人(毕业2人),硕士研究生9名(毕业5人,在读4人)。日志的高效快速恢复、轻量级一致性检查点、面向延迟优化的一致性复制三项研究的相关代码已经开源。.项目的部分研究成果在多源异构数据湖管理系统中得到了应用,一项研究成果实现了转化。
{{i.achievement_title}}
数据更新时间:2023-05-31
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
地震作用下岩羊村滑坡稳定性与失稳机制研究
卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比
不确定失效阈值影响下考虑设备剩余寿命预测信息的最优替换策略
面向众核处理器的内存数据库连接优化技术研究
集群环境下内存空间数据库管理与查询技术研究
容错CORBA系统及其关键技术研究
面向集群式内存的容错机制和数据组织策略研究