In big data era, data analytics have been extensively used in many business areas (e.g., hotel, e-commerce). Since almost all existing data analytical technologies were developed upon discrete data records, they do not support data analytical queries in continuous data space. In addition, the analyzing progress is complex and the result is highly sensitive to the professional degree of data analysts in nowadays systems. To tackle the above issues, we propose to design a novel declare analytical query language, devise analytical query translation, query optimization, and query execution algorithms in this proposal. We will address three important research questions in our project: (1) “How to design a novel query language which enables data analysts to express analytical queries in the continuous data space conveniently?" (2) “How to architect an efficient system which translates a declarative analytical query into an executable query plan?” (3) “How to execute a query plan efficiently?” The research outputs will provide the fundamental theories for data analytics problems in continuous data space, they also will contribute to the design and implementation of analytical query system. Furthermore, we believe that this project will promote data analytics technology innovations in continuous data space.
随着数据时代的来临,数据分析技术也被广泛的应用到商业的各个领域,如酒店、电子商务等。现有数据分析技术大多基于离散数据记录,因此在连续数据空间中分析能力不足。此外,现有数据分析系统分析过程复杂,分析结果依赖于分析师的从业水平。针对上述问题,本项目在充分利用已有数据分析技术的基础上,通过设计新型声明式分析查询语言,架构分析查询语言语法解析、查询优化、计算执行等算法模块,使之能高效、简捷地解决用户基于连续数据空间的数据分析需求。本项目旨在研究基于连续数据空间的分析查询关键技术,用以增强现有数据分析系统的应用领域,其主要研究内容包括:一、架构基于SQL的声明式分析查询语言系统;二、设计并实现高效的分析查询解析方法;三、突破分析查询的计算性能的理论瓶颈。预期成果将为针对连续数据空间的分析算法提供理论基础,为分析查询系统的设计提供语言系统和计算框架,促进基于连续数据空间的数据分析研究的技术创新。
随着数据时代的来临,数据分析技术也被广泛的应用到商业的各个领域,如酒店、电子商务等。现有数据分析技术大多基于离散数据记录,因此在连续数据空间中分析能力不足。此外,现有数据分析系统分析过程复杂,分析结果依赖于分析师的从业水平。针对上述问题,本项目在充分利用已有数据分析技术的基础上,围绕连续数据空间的分析查询算法理论、核心技术、工程实现展开深入研究,取得了一系列有特色的项目成果。.项目实施期间,项目组共发表相关论文17篇,项目负责人以第一作者或通讯作者发表论文17篇,其中CCF-A类论文11篇,SCI论文6篇。培养硕士毕业生2名,目前项目组有在读博士5名,在读硕士生8名。申请发明专利2项,申请软件著作权3项,已获批软件著作权1项,构建原型展示系统1套。
{{i.achievement_title}}
数据更新时间:2023-05-31
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
一种改进的多目标正余弦优化算法
基于混合优化方法的大口径主镜设计
变可信度近似模型及其在复杂装备优化设计中的应用研究进展
固溶时效深冷复合处理对ZCuAl_(10)Fe_3Mn_2合金微观组织和热疲劳性能的影响
面向数据空间内多模式查询和数据集成的关键技术研究
大数据环境下的流数据连续查询与优化技术研究
路网中空间关键字(连续)k近邻查询算法研究
大规模空间关键字数据流中查询和订阅技术研究