Cloud storage services, such as Dropbox and Google Drive, have quickly gained popularity in recent years. They provide solid supports for the reliable backup, multi-point access, and flexible sharing of users' data. Nevertheless, a variety of research results reveal that the existing cloud storage services generally make simplified, unrealistic assumptions for the users' application scenarios, including the network environment assumption, data update pattern assumption, decent user behavior assumption, and so forth. Once the practical application scenarios (inevitably) deviate from such assumptions, the service performance degrades sharply and a series of problems emerge accordingly, like the resource overuse, efficiency degradation, data conflict, data corruption, etc. This research project attempts to unravel the intrinsic scenario assumptions behind the state-of-the-art cloud storage services, by analyzing the impacts of scenario assumptions and decomposing the root causes. Our key finding lies in the fact that it is mainly the inappropriate choice and utilization of cloud storage enabling techniques that lead to the scenario assumptions as well as the relevant problems. Thereby, we plan to comprehensively investigate the enabling techniques of cloud storage services from multiple perspectives. Specifically, we will study the system architecture, underlying facility, data model, data synchronization protocol, and so on. Meanwhile, we will propose novel designs for a number of enabling techniques, in order to improve the cloud storage service performance under variable scenarios. The eventual goal of our research is to mitigate or even avoid scenario assumptions of cloud storage services. Finally, we aim to develop a full-fledged cloud storage system from scratch, so as to facilitate the validation of our proposed novel designs.
近年来以Dropbox和谷歌网盘为代表的云存储服务迅速流行,为用户数据的可靠备份、多点访问与灵活分享提供了坚实支撑。然而大量研究结果表明:当前云存储服务对用户的应用场景普遍进行了简单化、理想化的预设,包括终端网络环境预设、数据更新方式预设、良性用户行为预设等。一旦实际应用场景(不可避免地)偏离预设,服务性能急剧下降并伴随出现一系列问题,如资源滥用、效率低下、数据冲突和数据污染等。 本项目力图揭示云存储服务内在的场景预设,分析场景预设所造成的影响,并解构其背后的深层原理。我们的核心发现是:对于云存储关键技术不恰当的选择和使用,是产生场景预设及相关问题的主要原因。从而拟开展多个层面全方位的关键技术研究,包括体系结构、基础设施、数据模型、数据同步协议等;并针对多项关键技术提出创新设计,提升变动场景下的服务性能,弱化甚至取消场景预设。同时自主开发一套完整的云存储服务,以验证创新设计的实际效果。
近年来以Dropbox、谷歌网盘、百度网盘为代表的云存储服务迅速流行,为用户数据的可靠备份、多点访问与灵活分享提供了坚实支撑。然而大量研究结果表明:当前云存储服务对用户的应用场景普遍进行了简单化、理想化的预设,包括终端网络环境预设、用户软件环境预设、数据更新方式预设、良性用户行为预设等。一旦实际应用场景(不可避免地)偏离预设,服务性能急剧下降并伴随出现一系列问题,如资源滥用、效率低下、数据冲突和数据污染等。..本项目力图揭示云存储服务内在的场景预设,分析场景预设所造成的影响,并解构其背后的深层原理。我们的核心发现是:对于云存储关键技术不恰当的选择和使用,是产生场景预设及相关问题的主要原因。从而开展了多层面全方位的关键技术研究,包括体系结构、基础设施、应用环境、数据模型、数据同步协议等。发表学术论文28篇(其中CCF A类10篇、B类10篇、ACM/IEEE Transactions论文6篇)、学术专著一部,申请专利7项(其中1项已授权)、软件著作权2项(均登记成功)。获得2015年第三季度IEEE Transactions on Cloud Computing唯一亮点论文奖、2016年CCF-腾讯犀牛鸟基金科研优秀奖、2017年ACM多媒体系统年会(MMSys)唯一最佳学生论文奖等。..具体来说,我们针对云存储服务所依赖的多项关键技术提出创新设计,比如云存储网络流量效率的量化定义与比较研究(IMC’14、TOMPECS’18)、高可用低开销的多云数据存储模型(TCC’15)、基于云存储的离线下载技术瓶颈诊断与克服(IMC’15)、对象云存储系统的同步瓶颈分析与缓解(INFOCOM’16、TPDS’18)、云存储内容分发网络的尾部时延缩减(INFOCOM’16)、面向Web浏览器的云存储差分同步技术(HotStorage’17、FAST’18)、基于对象云存储的完整文件系统维护(ICPP’18)等。这些创新技术能够显著提升变动场景下的云存储服务性能(如数据同步速度提升数十倍)或大幅降低服务开销(如数据同步流量消耗降低数十倍),从而弱化甚至取消场景预设。同时,我们自主开发出一套完整的云存储服务“清云网盘”以验证创新设计的实际效果,该系统已上线稳定运行超过3年并且代码已开源。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
跨社交网络用户对齐技术综述
拥堵路网交通流均衡分配模型
卫生系统韧性研究概况及其展望
面向云工作流安全的任务调度方法
云存储数据安全验证的关键技术研究
云存储系统中节能关键技术研究
云环境下数据存储安全关键技术研究
云存储系统安全关键技术研究