多故障模式分布式计算系统可靠性分析方法研究

基本信息
批准号:61572442
项目类别:面上项目
资助金额:66.00
负责人:莫毓昌
学科分类:
依托单位:华侨大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:钟发荣,王晖,潘竹生,邓大勇,郝永红,郝衎,贺宁凯,刘华,刘轩
关键词:
可靠性模型可靠性分析冗余容错计算机动态可靠性可靠性建模
结项摘要

Modern distributed computing systems are complex computing systems in which both the systems and/or their components may be subject to complicated failure behaviors and may exhibit multiple failure modes. Their reliability analysis has been widely investigated and far from being solved. This project tries to cope with the problems has been found in reliability models, analysis efficiency, analysis automation, and algorithm implementation. In this project we propose a unified reliability modeling framework and reliability analysis approach based on multiple-valued decision diagram (MDD), which consists of encoding methods of multiple valued variables for dynamic failures, common cause failures and propagated failures, constraint conditions for multiple valued variable ordering, generation method for system MDD model, efficient ordering heuristics for multiple valued variables and approximated reliability analysis based on truncated MDD. The obtained efficient MDD-based solution for modern distributed computing systems with multiple failure modes is important for the academic research on reliability analysis of distributed computing systems. The research achievements can be used to validate the reliability design principles, including both redundant architecture and fault-tolerant mechanisms, and the reliability management rules, including backup and maintenance mechanisms.

针对现代分布式计算系统故障模式越来越多、失效行为越来越复杂这一发展趋势,研究高效的多故障模式分布式计算系统可靠性分析方法显得非常迫切,有着重要的现实意义。但已有分析方法在模型复杂性、计算效率、分析自动化、算法实现等诸多方面存在各种尚待解决的问题,不能很好的满足实际需求。本项目在已有前期研究的基础上提出了基于多值决策图(MDD) 的统一建模框架和全系统分析方法。重点研究:动态故障、共模故障和传播故障的多值变量编码方法和MDD 建模方法;多故障模式多值变量排序约束条件和系统级MDD 生成方法;高性能多值变量启发式排序策略和基于截断MDD 的近似可靠性分析方法。项目预期将获得高效的多故障模式分布式系统可靠性MDD 分析方法,对于完善分布式计算系统可靠性评估的理论研究具有重要意义,可以为冗余系统结构和底层容错机制等高可靠性设计决策的制定提供理论基础,也能够为系统高可靠运营机制的设计提供科学依据。

项目摘要

针对现代分布式计算系统故障模式越来越多、失效行为越来越复杂这一发展趋势,研究高效的多故障模式分布式计算系统可靠性分析方法显得非常迫切,有着重要的现实意义。.针对已有分析方法在模型复杂性、计算效率、分析自动化、算法实现等诸多方面存在各种尚待解决的问题,本项目针对各种类型的分布式系统研究基于多值决策图(MDD)的统一建模框架和全系统分析方法,包括:针对分布式系统中的传播故障、节点独立故障,多性能级别故障等故障模式研究部件-系统两级容错性能建模方法;针对连续节点故障模式下具有骨干节点的线性无线传感器网络研究基于MDD的容错性能建模和评估方法;针对串联、并联、表决、串并联混合等结构特征的计算系统研究基于MDD的自顶向下统一建模分析方法。.项目研究过程中共发表SCI期刊论文14篇,其中8篇为第一作者兼通信作者,包括计算机系统结构领域顶级期刊、中国计算机学会A类期刊IEEE Transactions on Computers(1 篇)、可信计算领域顶级期刊、中国计算机学会A类期刊IEEE Transactions on Dependable and Secure Computing(3 篇)、电子电气系统可靠性领域顶级期刊Elsevier Journal of Reliability Engineering and System Safety(2 篇)、电子电气系统综合类高质量期刊IEEE Transactions on Systems, Man, and Cybernetics(1 篇)、网络工程系统综合类高质量期刊IEEE Transactions on Network Science and Engineering(1 篇)。授权发明专利5项。培养指导硕士研究生6人。完成产学研科技成果转化项目“高可用云计算数据中心关键技术与应用”。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
3

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
4

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
5

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019

莫毓昌的其他基金

批准号:61272130
批准年份:2012
资助金额:82.00
项目类别:面上项目
批准号:60903011
批准年份:2009
资助金额:18.00
项目类别:青年科学基金项目

相似国自然基金

1

变结构多故障系统中多智能体动态联盟的分布式诊断

批准号:61073103
批准年份:2010
负责人:黄志武
学科分类:F06
资助金额:35.00
项目类别:面上项目
2

分布式异构计算系统中的DAG任务智能调度方法研究

批准号:61802096
批准年份:2018
负责人:程雨夏
学科分类:F0204
资助金额:27.00
项目类别:青年科学基金项目
3

航空发动机数控系统的多故障识别方法研究

批准号:60572185
批准年份:2005
负责人:宋华
学科分类:F01
资助金额:18.00
项目类别:联合基金项目
4

多模式失效的叶盘耦合寿命可靠性分析方法研究

批准号:51705309
批准年份:2017
负责人:高海峰
学科分类:E0504
资助金额:26.00
项目类别:青年科学基金项目