The volume of global datasets is increasing explosively in recent years. Especially it has increased from tens of terabyte to petabytes, even to exabytes in some scientific applications and is still growing. The existing management systems for big data analytics cannot provide effective supports for data storage and analytics processing for big data. How to effectively store, manage big data and efficiently support big data analytics is a new challenge faced by researchers. And thus, we study the key theories and techniques, especially the algorithms for big data analytics in cloud computing, including the methods for big data storage and index, some approximate algorithms, parallel algorithms, instance optimal algorithms and parameterized algorithms for big data analytics. We also develop a system for big data analytics in cloud computing to verify the correctness and effectiveness of our proposed methods and algorithms.
近年来,全球的数据量呈爆炸性增长趋势,一些科学应用中的数据量已经从几十个TeraBy tes发展到PetaBytes, 甚至达到Exabytes级别并且在不断扩大。现有的大数据分析处理系统无法对大数据的存储与分析处理提供有效支持。如何有效地存储、管理这些大规模的数据集合,高效地支持各种大数据分析处理是目前面临的一个新的挑战性问题。为此,本课题从数据管理的角度,研究基于云计算的大数据分析处理的关键理论和技术,特别是相关算法的设计,主要包括大数据的存储与索引方法、大数据分析的近似算法、并行算法、实例优化算法和参数化算法,并研制基于云计算的大数据分析处理系统原型,验证课题所提出方法的正确性和有效性。
近年来,全球的数据量呈爆炸性增长趋势,一些科学应用中的数据量已经从几十个TeraBytes发展到PetaBytes,甚至达到Exabytes级别并且在不断扩大。现有的大数据分析处理系统无法对大数据的存储与分析处理提供有效支持。如何有效地存储、管理这些大规模的数据集合,高效地支持各种大数据分析处理是目前面临的一个新的挑战性问题。为此,本课题从数据管理的角度,研究基于云计算的大数据分析处理的关键理论和技术,取得了一系列的研究成果。同时,研制基于云计算的大数据分析处理系统原型,验证课题组所提出方法的正确性和有效性。迄今为止,课题组已在国内外知名期刊和会议上发表重要学术论文14篇,包括国际期刊9篇,国际会议2篇,国内期刊3篇,其中SCI检索9篇,EI检索14篇。国际和国内学术会议专题报告或讲座3人次。发明专利2项。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
面向云工作流安全的任务调度方法
气载放射性碘采样测量方法研究进展
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
基于云计算和MapReduce的区域医疗大数据分析关键技术研究
基于认知计算的大数据分析方法
基于认知计算的大数据分析方法
云计算和大数据环境下高效的隐私保护算法设计与分析