基于容错代价的云计算可生存性理论与关键技术研究

基本信息
批准号:61272072
项目类别:面上项目
资助金额:80.00
负责人:邹德清
学科分类:
依托单位:华中科技大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:李伟明,陈琳,陈刚,王代斌,冯毅,赵考,代炜琦,秦昊,章文荣
关键词:
故障检测云计算故障恢复可生存性
结项摘要

As cloud computing brings ease of use and cost-saving services, its multi-tenancy and highly centralized resource features lead to that system failure causes more serious losses than traditional computing model. The survivability of Cloud computing can be classified into two aspects: 1) for cloud tenants, they need a fault-tolerant solution which meets quality of service requests and minimizes cost. And the solution should reflect the multi-level tenant features. This is the quality of service-oriented pursuit of cloud computing and a key for cloud computing to survive and development; 2) For cloud platforms, they need to eliminate the correlation of failures in this dynamic and complex environment. Also they should isolate faults and narrow the scope of its influence, minimize fault-tolerant cost, and automate the fault detection and recovery, reflecting the platforms' self-healing ability. Our proposal will research in the following three levels: 1) Analysis of the faults complexity, which researches the fault propagation based on faults association analysis in the granularity of platform components; 2) the survivability theory, which researches the platform survivability modeling from the platform and the tenants' point of view respectively and the tenant level-oriented fault-tolerant cost theory; 3) key technologies for survivability, including multi-level, low-cost, fault detection and recovery, and corresponding automation mechanisms. The research results of the project will be used to guide the construction of highly reliable cloud computing environments.

云计算在为租户提供方便易用和低成本服务的同时,其多租户、资源高度集中特性使得系统一旦出现故障所造成的损失远比传统计算模式严重。云计算的可生存性体现在两个方面:1)对租户而言,需要提供一种满足其服务质量需求,且付出代价小的容错方案,并体现租户分等级特征,这也是以"服务质量"为本的云计算追求的目标,是云计算得以生存和发展的一大关键;2)对云平台而言,需要消除动态复杂环境下故障的关联性以隔离故障和缩小其危害范围,并尽可能减小容错开销,实现故障检测和恢复的自动化,体现出平台的自修复能力。拟从三个层面开展研究:1)故障复杂性分析,以组件为粒度开展关联性分析,并以此研究故障传播问题,2)可生存性理论研究,分别从平台和租户的角度研究平台的可生存性建模以及面向租户等级的容错代价理论;3)可生存性关键技术研究,包括多层次、低代价容错架构以及故障自动识别和恢复方法。项目成果将用于指导高可靠云计算平台的设计。

项目摘要

云计算在为租户提供方便易用且低成本的服务时,由于其多租户、资源高度集中等特性使得系统一旦出现故障所造成的损失远比传统计算模式严重,故项目从容错代价着手,开展高效的可生存性理论和技术研究。研究内容主要包括:1)故障诊断与分析:提出面向全系统日志的、基于时间的故障关联分析方法,通过故障关键词矩阵,有效地对故障日志进行实时分类;并改进了传统的故障关联性分析,利用日志故障分类的结果来确定不同时间窗口的大小,提高了故障关联性分析的准确率。新故障日志分类方法,可以对95%以上的日志进行自动分类,关联分析的错误率为20%左右;2)软件更新理论与方法,包括离线更新和在线更新两类,针对离线更新,提出了面向IaaS的软件更新即服务机制,该机制具有较高的软件信息采集效率,同时能在软件支持率100%的情况下,完成对镜像的离线更新;并能高效地验证镜像更新后的可靠性。针对在线更新,提出了面向云计算的动态软件升级机制Replus,Replus可以动态地更新C程序,且非常适用于云平台,同时占用的内存空间更小,对软件性能的影响可忽略不计;3)故障容忍和故障容错,提出了软件内存错误的动态容忍机制,实现了对C/C++程序栈缓冲区的错误和堆缓冲区的错误的主动容忍,能有效地预防因内存错误而终止服务、产生未定义的程序行为或黑客攻击等情况;针对故障容错,提出了面向云计算的轻量级软件容错系统,利用云环境下软件故障容忍机制解决了容错效率问题;利用软件内存故障按需容忍机制解决了容错正确性问题;利用软件栈溢出漏洞修复机制解决了栈溢出漏洞修复问题;利用动态软件升级机制解决了补丁动态应用难题;4)故障自动修复,提出了基于访存虚拟化的栈溢出漏洞修复机制,在SafeStack系统鉴别出引发故障的栈缓冲区后,由访存虚拟化机制将该缓冲区从栈中移到受保护的内存区,而后生成漏洞补丁暂时修复该漏洞,使软件免于后续相同的攻击。本项目从可生存性全周期提出了相应核心技术和方法。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022
2

基于分形维数和支持向量机的串联电弧故障诊断方法

基于分形维数和支持向量机的串联电弧故障诊断方法

DOI:
发表时间:2016
3

基于FTA-BN模型的页岩气井口装置失效概率分析

基于FTA-BN模型的页岩气井口装置失效概率分析

DOI:10.16265/j.cnki.issn1003-3033.2019.04.015
发表时间:2019
4

基于全模式全聚焦方法的裂纹超声成像定量检测

基于全模式全聚焦方法的裂纹超声成像定量检测

DOI:10.19650/j.cnki.cjsi.J2007019
发表时间:2021
5

基于图卷积网络的归纳式微博谣言检测新方法

基于图卷积网络的归纳式微博谣言检测新方法

DOI:10.3785/j.issn.1008-973x.2022.05.013
发表时间:2022

邹德清的其他基金

批准号:60503040
批准年份:2005
资助金额:25.00
项目类别:青年科学基金项目
批准号:60973038
批准年份:2009
资助金额:30.00
项目类别:面上项目
批准号:61672249
批准年份:2016
资助金额:62.00
项目类别:面上项目

相似国自然基金

1

计算系统可生存性理论及其关键技术研究

批准号:60573035
批准年份:2005
负责人:朱建明
学科分类:F0206
资助金额:5.00
项目类别:面上项目
2

面向云计算的拜占庭故障诊断与容错关键技术研究

批准号:61173017
批准年份:2011
负责人:杨震
学科分类:F0201
资助金额:55.00
项目类别:面上项目
3

存储网络系统的可生存性理论与关键技术研究

批准号:60743005
批准年份:2007
负责人:朱建明
学科分类:F0205
资助金额:8.00
项目类别:专项基金项目
4

云计算环境中数据安全的理论与关键技术研究

批准号:61232016
批准年份:2012
负责人:孙星明
学科分类:F0206
资助金额:275.00
项目类别:重点项目