Distributed Systems are more and more popular in Big Data area, but users need to tune the systems to gain their desired performance in different applications. If users do not understand the system principle, it is hard to explain the system behavior, analyze the cause of phenomenon and optimize the system. Besides, the practical systems built by industrial community are superior to theoretical research, which leads to the lack of methodology of system optimization. Though log mining based methods can help users understand a system, exist methods encounter high cost and poor scalability problems. As a result, the generated models are unreadable and incorrect. .This project adopts Petri Net theory and improves log mining methods for inferring system models. The project will improve the invariant mining algorithms and proposes a novel two-phase modeling architecture to reduce the modeling cost and overcome exist problems. Based on the system modeling, this project focuses on how to improve the replica consistency and how to improve the replica repairing process to show the advantages of system modeling. Our goal is bridge the gap between system development in industrial community and theoretical study by academic community.
分布式系统在大数据领域被广泛应用,但往往需要用户根据业务需求进行大量优化工作。在不了解系统原理时,用户往往难以解释系统的运转情况、分析问题原因、进而改进系统。工业界在分布式系统上的研发成果超前于学术界在这些系统上的理论分析,进一步导致分布式系统的理解和改进缺少方法论支撑。基于日志挖掘的建模方法虽然可以帮助对系统进行解读和改进,但是现有的日志挖掘方法存在代价大、扩展性差等问题,并导致挖掘得到的模型不可读、不正确。.本项目拟采用Petri网理论,基于系统日志挖掘的手段对分布式系统的建模方法进行研究。通过改进系统不变量特征挖掘算法,创新分阶段的建模框架,解决分布式系统建模代价大、扩展性差、模型不可读、不正确的问题。在建模基础上,项目还将展开基于模型的系统副本一致性和副本修复的改进方法研究,进一步证明系统建模在实践应用中的意义。通过研究,以缩小大数据实践中工业界系统研发成果和学术界方法论间的鸿沟。
针对分布式存储系统实现逻辑复杂、缺少系统模型、模型难刻画等问题,项目组围绕分布式系统日志收集与分析、基于Petri网的分布式系统建模、基于模型的分布式系统优化三个方面展开研究。主要成果包括:.1. 基于Petri网对分布式存储系统Apache Hadoop进行了系统建模,检测出Hadoop(HDFS)存在副本不一致问题,并给出了修改方法。.2. 针对分布式存储系统中的多副本机制,提出查询负载感知的分布式存储系统异构副本机制。该异构副本机制允许不同的副本在逻辑上相同,同时在磁盘上拥有不同的物理数据布局。TPC-H数据集和合成生成的数据集在分布式NoSQL系统Apache Cassandra中的实验验证了本方法的有效性。结果表明,该方法与最新的解决方案相比,性能平均提升近10倍。.3. 针对分布式时序数据存储系统中副本强一致性需求,提出基于Raft协议的双层分布式架构,解决元数据副本的管理问题。针对Raft协议带来的过度线性化问题,提出通过将无关操作进行分组,将其中拥有性能瓶颈的队列由单实例变为多实例。经改进后,多Raft组架构下的2节点2副本分布式系统性能上升至单机的70%-80%。..在上述工作基础上,研制了分布式工业物联网时序数据库Apache IoTDB,被国际开源软件基金会Apache接收,在中航成飞、中车四方、德国普格曼等国内外企业得到应用,获2020年北京市科技进步奖一等奖。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
硬件木马:关键问题研究进展及新动向
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
多源数据驱动CNN-GRU模型的公交客流量分类预测
平行图像:图像生成的一个新型理论框架
业务流程系统变元片段的日志检测与挖掘方法研究
复杂系统建模理论与方法学
日志模式提炼与跨类型日志分析方法研究
系统可靠性建模与分析的理论与方法研究