基于软件抗衰与检查点技术的云应用系统主动容错服务方法研究

基本信息
批准号:61662051
项目类别:地区科学基金项目
资助金额:40.00
负责人:刘靖
学科分类:
依托单位:内蒙古大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:赵俊峰,高永强,王燕,崔波,杨娜,王鹏,赵玉强,丁凯,雷欣明
关键词:
检查点软件抗衰实时迁移主动容错云应用系统
结项摘要

Cloud applications are typically composed of multiple cloud service components which execute coordinately in different network nodes. It is significant and desiderated to provide an effective and continuous fault tolerant services for cloud applications to enhance its high availability. This research issue has a promising application future. In this proposal, we propose and develop a novel proactive fault tolerance mechanism for cloud application systems based on checkpoint and software rejuvenation technologies. We first propose a failure detection method to monitor whether service components having runtime faults. Based on such metric information, a failure degree evaluation approach is performed to predict which cloud service components deserve foremost to have suitable fault tolerance executions. It is provided in the form of Proactive Fault Tolerance as a Service (PFTasS) to enhance the high availability of cloud application runtime executions. Our main innovative achievements come from three aspect. First, a failure detection and evaluation method is proposed based on the dynamically monitored performance metrics. Second, a proactive fault tolerance mechanism is developed based on checkpoint and software rejuvenation technologies. Third, a dynamic matching and integration method for PFTasS is proposed to optimize of fault tolerant effects. Our holistic proactive fault tolerance mechanism will be applied to at least three typical cloud application systems to validate its usability and service provision ability.

云应用系统由运行在多个网络节点上的分布式协同服务构件组成,为其提供高效且持续可用的容错服务以保障云应用系统的可靠运行,具有重要的科学价值和应用前景。本项目旨在构建一套面向云应用系统的、基于检查点和软件抗衰技术的主动容错新机制,通过监测服务构件运行性能指标预测服务失效,并依据失效评估结果实施有效的主动容错方案,以主动容错即服务(Proactive Fault Tolerance as a Service,PFTasS)的模式为云应用系统提供持续可靠的运行时保障。本项目的主要创新性成果包括:基于性能指标动态监测的云服务构件失效预测与评估方法;基于检查点和软件抗衰技术的云服务构件主动容错方法;面向容错效果最优化的容错即服务动态适配与集成方法。在至少3个典型云应用系统上完成PFTasS机制的实践应用,以确认其可用性及服务提供能力。

项目摘要

本项目旨在构建面向云端应用系统、基于检查点和软件老化与抗衰技术的主动容错新机制,以主动容错即服务的模式为软件系统提供持续可靠的运行时保障。通过扎实深入的开展研究,项目重要研究进展可概述为如下四个创新成果。(1)基于检查点技术的云服务软件主动容错方法:以MapReduce云计算框架为研究对象,提出一种基于多级联动检查点的任务恢复优化策略McTAR,在保证MapReduce程序正确性的前提下,在任务失效或节点失效发生后,能够以最小计算开销尽快恢复任务执行,减少失效带来的执行延迟,提高整体作业的运行效率,进而增强MapReduce计算服务的整体容错效果。(2)基于软件老化与抗衰技术的云端软件容错方法:充分利用机器学习方法提升云端服务软件老化发生的预测精准度,如采用优化后的BP神经网络、ARIMA-LSTM混合模型、生成对抗网络等技术提出并实现了多种软件老化预测方法,以VMM等云平台支撑软件、云应用软件、移动端软件为研究对象,精准预测并合理评定软件老化的发生时机,从而易于安排更为合理的软件抗衰操作,以提高云端软件容错效果及服务可用性。(3)服务软件失效预测与评估方法:引入可靠性分析领域中经典的威布尔分布理论方法,为软件老化状态转移过程进行精准建模,以软件运行性能指标、任务完成概率、抗衰开销等多项参数为基础,利用优化层次分析法构建软件抗衰决定函数模型,实时监测并评估服务软件是否进入老化状态,能够实现以软件抗衰执行为基础的、更为精准有效的服务软件主动容错。(4)基于容错即服务模式的云软件容错服务支撑技术:融合云服务软件容错的具体需求和运行时资源约束,构建云容错即服务适配模式,生成的容错服务能更好地满足用户和云容错服务供应商的需求。此外,在研发过程中,还开展了云服务软件弹性测试方法、变异测试理论方法、分布式软件形式验证技术等研究。项目研究成果共形成学术论文16篇,其中,CCF推荐的B类期刊论文1篇(《IEEE Transactions on Services Computing》)、B类会议论文1篇(IEEE ICWS)、中文A类期刊论文2篇(均发表于《软件学报》),C类会议论文8篇,SCI二区期刊论文2篇,完成软件著作版权登记2项。项目成果为云端软件的容错服务提供多种高效可用的技术解决方案,具有很好的应用前景与实用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
3

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015
4

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018
5

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018

刘靖的其他基金

批准号:71673317
批准年份:2016
资助金额:48.00
项目类别:面上项目
批准号:81700255
批准年份:2017
资助金额:20.00
项目类别:青年科学基金项目
批准号:81301252
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:81202699
批准年份:2012
资助金额:24.00
项目类别:青年科学基金项目
批准号:81571339
批准年份:2015
资助金额:57.00
项目类别:面上项目
批准号:81271508
批准年份:2012
资助金额:60.00
项目类别:面上项目
批准号:71103212
批准年份:2011
资助金额:19.00
项目类别:青年科学基金项目
批准号:61262017
批准年份:2012
资助金额:43.00
项目类别:地区科学基金项目

相似国自然基金

1

计算系统的软件抗衰与自愈技术研究

批准号:60273035
批准年份:2002
负责人:许满武
学科分类:F0203
资助金额:22.00
项目类别:面上项目
2

软件服务化背景下的云服务推荐方法研究

批准号:71201042
批准年份:2012
负责人:丁帅
学科分类:G0112
资助金额:19.00
项目类别:青年科学基金项目
3

云环境中容错软件结构模型设计方法

批准号:61300041
批准年份:2013
负责人:范贵生
学科分类:F0203
资助金额:23.00
项目类别:青年科学基金项目
4

基于服务组合的"系统的系统"软件机理与方法

批准号:61232007
批准年份:2012
负责人:王红兵
学科分类:F0202
资助金额:280.00
项目类别:重点项目