集群环境下基于内存的高性能数据管理与分析

基本信息
批准号:61332006
项目类别:重点项目
资助金额:300.00
负责人:周傲英
学科分类:
依托单位:华东师范大学
批准年份:2013
结题年份:2018
起止时间:2014-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:周敏奇,陈群,潘巍,曾雷杰,刘辉林,吴刚,王立,索勃,王章辉
关键词:
非一致内存访问数据管理商务智能内存数据容错大规模并行处理
结项摘要

With the increasing intension of market competition and the continuously development of enterprise informatization, it is hard for the conventional business intelligence systems to meet the requirements about the timely decision. The real-time business intelligence is then becoming a goal which more and more enterprises are pursuing. The great advance on computer hardware and architecture offers technical background for the real-time business intelligence. The project mainly will focus on the high performance data management and analytics based on in-memory cluster computing, which is expected to set a solid foundation for the efficient processing of the decision-making big data, taking full advantage of the progress on hardware, and taking the real life application into consideration. The major research topics are as followings. 1) High performance data storage with non-uniform access memory, including column-oriented dense packing storage, memory-sensitive data placement, and compression-aware data processing. 2) Fully using the heterogeneous computation resources, including DAG workflow parallel processing based on function-at-a-core strategy, interactive parallel processing based on processor-affined scheduling, session scheduling strategy, and load balance based on computation priority. 3) High availability of the building systems, such as fault-tolerant data set based on lineage, task recovery based on standby process. 4) The optimization on primary operators and execution plan for the specific applications, to achieve the ad hoc human real-time interactive analysis. The planned research conforms to the current applications and the development of the related technologies. It is of broad interests to the participants from academic and industries. The applicants have profound technical accumulation on the related areas, and have explored preliminarily on the proposed research plan, which ensure this project to be accomplished successfully.

随着市场竞争的加剧和企业信息化程度的提高,传统商务智能系统难以满足当前决策时效性的要求,实时商务智能已成为许多企业追求的目标,硬件和体系结构的发展为之提供了技术条件。本项目旨在研究集群环境下基于内存的高性能数据管理与分析技术,探索符合应用需求、充分发挥硬件效能的决策类大数据处理技术,为实现实时商务智能奠定基础。重点研究:1)非一致访问内存环境下的数据高效存储,包括列式密集存储、内存感知布局和压缩感知处理;2)大规模异构计算资源的充分利用,包括函数至核有向无环工作流式和处理器结合迭代式并行处理,以及会话调度策略和计算优先负载平衡;3)内存系统可靠性保障,包括基于世系的内存数据集容错、热备进程的任务快速恢复等;4)针对特定应用的基本算子和执行计划优化。本项目的研究符合现实应用需求和技术发展趋势,具有广阔的应用前景和学术价值。申请人在数据管理方面积累充分,研究方案可行,能保证本项目顺利完成。

项目摘要

随着市场竞争的加剧和企业信息化程度的提高,传统商务智能系统难以满足当前决策时效性的要求,实时商务智能已成为许多企业追求的目标,硬件和体系结构的发展为之提供了技术条件。本项目旨在研究集群环境下基于内存的高性能数据管理与分析技术,探索符合应用需求、充分发挥硬件效能的决策类大数据处理技术,为实现实时商务智能奠定基础。重点研究内容包括:1)非一致访问内存环境下的数据高效存储,包括列式密集存储、内存感知布局和压缩感知处理;2)大规模异构计算资源的充分利用,包括函数至核有向无环工作流式和处理器结合迭代式并行处理,以及会话调度策略和计算优先负载平衡;3)内存系统可靠性保障,包括基于世系的内存数据集容错、热备进程的任务快速恢复等;4)针对特定应用的基本算子和执行计划优化。本项目的研究符合现实应用需求和技术发展趋势,具有广阔的应用前景和学术价值。..项目针对研究目标,分别取得了如下创新性结果:1)针对集群内存访问的多级性,提出了融合缓存、内存、SSD存储、外存、远程数据访问的多级数据存取模型,实现了数据的高效存取。2)利用集群内大规模异构并行计算资源,提出了细粒度的弹性并行查询处理框架,实现了复杂分析任务子任务自动分配以及高效并行执行与高吞吐量调度。3)针对内存数据易失、复杂任务易溃的特点,提出了本地日志存储、远程基于Paxos的日志同步等容错策略,提升了系统的可靠性、可用性。4)面向商务智能应用的需求,提出了一系列的分析型查询处理算法与优化技术,以及特定的流数据分析和图数据分析处理算法,实现了即席的交互式分析。..项目资助下,项目组成员发表期刊论文22篇,学术会议论文21篇,出版学术专著1部,申请专利8项,其中已授权2项,申请软件著作权5项,获得科研奖励2项。项目通过开源项目Gingko实现了成果的集成和应用示范,验证了成果的先进性和实用性。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
3

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019
4

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
5

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022

周傲英的其他基金

批准号:69743001
批准年份:1997
资助金额:10.00
项目类别:专项基金项目
批准号:60673137
批准年份:2006
资助金额:25.00
项目类别:面上项目
批准号:60003016
批准年份:2000
资助金额:17.00
项目类别:青年科学基金项目

相似国自然基金

1

集群环境下基于内存的大数据分析技术研究

批准号:61602129
批准年份:2016
负责人:王金宝
学科分类:F0202
资助金额:20.00
项目类别:青年科学基金项目
2

内存集群环境下的实时数据处理

批准号:61672233
批准年份:2016
负责人:周敏奇
学科分类:F0202
资助金额:63.00
项目类别:面上项目
3

分布式内存环境下的大图数据管理技术研究

批准号:61572119
批准年份:2015
负责人:袁野
学科分类:F0202
资助金额:66.00
项目类别:面上项目
4

集群环境下内存空间数据库管理与查询技术研究

批准号:41471321
批准年份:2014
负责人:景宁
学科分类:D0114
资助金额:82.00
项目类别:面上项目