群组查询引擎

基本信息
批准号:61702449
项目类别:青年科学基金项目
资助金额:22.00
负责人:江大伟
学科分类:
依托单位:浙江大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:张哲槟,褚建琛,魏嘉荣,蒋飞跃
关键词:
大数据分析平台大规模数据处理
结项摘要

Modern Internet applications such as e-commerce website or mobile games often produce a large volume of user activity records. Data analysts are interested in cohort analysis, or finding unusual user behavioral trends, in these large tables of activity records. In a traditional relational database system, cohort analysis queries are both painful to specify and expensive to evaluate. This project proposes to extend database systems to support cohort analysis. We do so by extending relational database systems in three steps. First, we extend the relational data model to store user activity records. Second, we design a transaction processing strategy for user activity records management. Finally, we introduce new cohort operators and cohort query processing strategies for efficient cohort query processing.

现代互联网应用如电子商务或手机游戏经常产生海量的用户行为数据。分析师希望通过群组分析从海量的用户行为大数据中发现用户行为趋势,提升决策水平。然而,传统的关系数据库难以支持群组分析。将群组分析任务转换为关系查询不仅过程复杂而且性能低效。本项目提出从三个方面扩展关系数据库,支持群组查询。首先,扩展关系数据模型,支持用户行为大数据存储。其次,引入新的事务处理机制管理行为数据更新事务,维护行为大数据集的行为完整性约束。最后,引入新的群组查询算子和群组查询技术高效处理群组查询。

项目摘要

现代大数据应用,如智慧审计、电子商务、在线游戏,经常产生海量的用户行为数据集。该数据集中的记录描述了用户的某次行为相关的信息。数据分析师亟需一种用户行为趋势发现技术,可以从行为大数据集中发现用户行为趋势(即,用户行为随时间变化的关系),提升企业的决策水平。群组分析是社会科学家提出的一种量化分析人类行为趋势的方法。然而,传统的关系数据库系统无法有效地管理行为大数据,且不支持群组查询,无法将群组分析技术从社会科学推广到其他领域。..课题从数据模型、事务处理、查询处理三方面扩展关系数据库,支持行为大数据管理和群组查询。课题具体研究成果如下:1)提出了两种新的数据完整性约束:复杂完整性约束和聚合代数约束,扩展了关系数据模型,描述行为大数据的数据完整性。进一步,课题提出了复杂完整性约束和聚合代数约束的发现算法,自动从行为大数据集中发现约束条件,提升数据库管理员的工作效率;2)提出了所见即所得的行为大数据抽取技术,从原始非结构化数据中可靠地抽取行为记录,保障行为大数据写事务的数据正确性。提出了基于Wrangling DSL脚本的行为大数据加载技术,利用MapReduce并行编程框架,加速行为大数据写事务的执行速度;3)提出了三个群组查询算子描述群组查询任务,以及算子的优化算法,并成功开发了群组查询系统原型,验证了提出技术的有效性。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
3

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017
4

不同交易收费类型组合的电商平台 双边定价及影响研究

不同交易收费类型组合的电商平台 双边定价及影响研究

DOI:10.13956 /j.ss.1001-8409.2018.07.26
发表时间:2018
5

考虑平台营销努力的直播电商服务供应链质量努力策略

考虑平台营销努力的直播电商服务供应链质量努力策略

DOI:
发表时间:2022

江大伟的其他基金

相似国自然基金

1

关系Top-N 查询引擎和排序函数的研究

批准号:61170039
批准年份:2011
负责人:朱亮
学科分类:F0202
资助金额:55.00
项目类别:面上项目
2

面向搜索引擎的用户个性化查询意图分析

批准号:61202277
批准年份:2012
负责人:陈毅恒
学科分类:F0211
资助金额:22.00
项目类别:青年科学基金项目
3

GIS信息映射引擎的研究

批准号:60172024
批准年份:2001
负责人:唐中实
学科分类:F0113
资助金额:20.00
项目类别:面上项目
4

特异群组挖掘算法研究

批准号:61170096
批准年份:2011
负责人:朱扬勇
学科分类:F0607
资助金额:56.00
项目类别:面上项目