分布式流处理系统实时容错关键技术研究

基本信息
批准号:61602205
项目类别:青年科学基金项目
资助金额:20.00
负责人:李洪亮
学科分类:
依托单位:吉林大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:徐海啸,李想,庄园,刘智亮,崔浩龙,王震,李兰馨
关键词:
流处理系统可靠性实时性分布式系统容错
结项摘要

In recent years, the requirement of realtime stream processing increases dramatically, which leads to the rapid development of distributed stream processing technologies. Distributed stream processing system (DSPS) becomes a new type of distributed system and draw wide attentions. The system scale DSPS increase rapidly. The complexity of stream processing jobs grows with the scale as well. These new developments cause the rasing attentions about the reliability issues of distributed stream processing systems. .Currently, most related works focus on fault-tolerant mechanisms and protocols based on tradition methods in distributed systems. They are lack of the ability to analysis the failure effects to realtime performance, lack of optimized fault-tolerant strateries, and not able to fit the dynamic characters of data streams. .This poposal presents a novel research on the key technologies of realtime fault tolerance of distributed stream processing systems. The proposed research focuses on the realtime performance of fault tolerence. We plan to conduct researches on theoretical models, optimization methods and supporting mechanisms. The proposed reasearch includes: 1) Realtime-performance-oriented node-level fault-tolerant cost model and system-level reliability model, 2) Fault-tolerant strategy optimization methods and dynamic adjustment problems, 3) Supporting mechanisms and protocols of realtime fault tolerace. Comparing with the existing works, the contributions of the proposed research will include: 1) introducing the fault-tolerant affect to realtime preformance into system reliability model, 2) the optimization of fault-tolerant strategies based on topology-aware node-level fault-tolerant cost, 3) fault-tolerant dynamic adjustment supporting auto-scale and burst streams. The proposed research has important theoretical values and extensive application requirements.

近年来,各行业应用中对大规模流数据进行实时处理与分析的需求激增,分布式流处理技术发展迅速。随着系统规模的扩展和处理流程的复杂化,系统鲁棒性问题日益得到关注,分布式流处理系统故障容错问题逐渐成为研究热点。现有工作缺乏面向处理实时性的容错理论模型,缺乏相应的容错策略优化方法,容错方法动态性不足难以适应流数据处理特点。本研究重点关注分布式流处理系统的实时性容错问题,从理论模型、优化策略及支撑机制等层面开展研究,主要研究内容包括:面向处理实时性的节点故障代价模型及系统可靠性模型、容错策略优化及动态调整问题、实时性容错支撑机制及协议等。与现有的工作相比,本研究主要特色包括:将故障对实时性的影响引入到可靠性理论模型中、基于拓扑感知思想根据节点故障代价优化实时容错策略、支持自动并行化和突发性流等场景的容错策略动态调整等。本研究具有重要的理论价值和广泛的应用需求。

项目摘要

随着各行业应用中对大规模流数据进行实时处理与分析的需求激增,分布式流处理技术发展迅速。这类分布式系统规模迅速扩展,数据处理流程日益复杂化,系统鲁棒性问题日益得到关注,分布式流处理系统故障容错问题逐渐成为研究热点。目前亟需建立面向处理实时性的容错理论模型,进而快速发展相应的容错策略优化方法。本项目从理论模型、优化策略及支撑机制等方面,全面开展流数据处理系统的实时容错关键技术研究。本研究首次建立了面向处理实时性的分布式流数据处理系统节点故障代价模型及系统可靠性模型;在该模型基础上,进一步建立了多种实时性容错策略,包括面向容错代价的容错策略、面向处理延迟的容错策略以及面向突发性流负载的容错策略等;最后,开展了实时性容错支撑机制及协议研究,基于开源分布式数据处理框架实现了实时容错流数据处理原型系统SPATE,对本项目的理论研究结果进行验证。与现有的工作相比,本研究主要特色包括:将故障对实时性的影响引入到可靠性理论模型中、基于拓扑感知思想实现了考虑节点故障代价的优化容错策略、支持自动并行化和突发性流等场景的容错策略动态调整等。本研究基于通用分布式流数据处理系统模型,相关成果可适用于各类流行的分布式流数据处理平台,如Storm、Flink等。本研究具有重要的理论价值和广泛的应用需求。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
5

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022

李洪亮的其他基金

相似国自然基金

1

实时数据流处理系统中负载均衡与容错机制的融合方法研究

批准号:61802273
批准年份:2018
负责人:房俊华
学科分类:F0202
资助金额:25.00
项目类别:青年科学基金项目
2

实时分布式流处理系统资源动态调度问题的研究

批准号:61702113
批准年份:2017
负责人:傅正佳
学科分类:F0204
资助金额:23.00
项目类别:青年科学基金项目
3

支持多执行引擎的分布式图处理系统关键技术研究

批准号:61572039
批准年份:2015
负责人:崔斌
学科分类:F0202
资助金额:68.00
项目类别:面上项目
4

实时流数据处理系统中的弹性计算技术

批准号:61702109
批准年份:2017
负责人:王立
学科分类:F0202
资助金额:23.00
项目类别:青年科学基金项目