基于分布式流处理的动态图在线查询技术研究

基本信息
批准号:61702320
项目类别:青年科学基金项目
资助金额:19.00
负责人:杨定裕
学科分类:
依托单位:上海电机学院
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:计春雷,王小刚,苏庆刚,肖惜明,张福杰,蔺佳骏
关键词:
流式数据/流式数据处理在线查询动态图
结项摘要

With the rapid development of World Wide Web and Internet of Things, dynamic graph has become an important model for large-scale data management. Efficient online query over dynamic graph is an essential requirement for achieving graph applications, including social network and intelligent traffic. When making query over dynamic graph, however, existing distributed graph processing systems face technical challenges such as, insufficient scalability, significant query latency, and inability of updating the results dynamically. In this project, we focus on dynamic graph and propose an online query method over dynamic graph via distributed stream processing. We study dynamic graph partition processing, online query based on asynchronous mechanism and incremental updating for query results. We aim at addressing key scientific problems in load imbalance of dynamic graph processing, the delay of online query and the inaccuracy of query results. This project facilitates the real-time analysis on dynamic graph, and it effectively provides online query approaches for real-world dynamic graph applications.

随着互联网和物联网的快速发展,动态图已成为大规模数据管理的重要模型。高效的动态图在线查询是实现社交网络、智能交通等图应用的基本要求。然而,现有的分布式图处理系统在处理动态图查询时,仍面临可扩展性不足、实时性不强、以及难以满足查询结果动态变化等技术挑战。本项目以动态图为研究对象,提出基于分布式流处理的动态图在线查询的方法,分别开展面向动态图的分区处理、异步在线查询和在线查询结果的增量更新方法的研究工作,力图解决动态图处理的负载不均衡问题、在线查询的延迟性与查询结果的不准确性等关键科学问题。通过本项目的核心技术研究,将有效提高动态图的实时分析水平,为现实的动态图应用提供行之有效的在线查询方法。

项目摘要

随着互联网和物联网的快速发展,动态图已成为大规模数据管理的重要模型。高效的动态图在线查询是实现社交网络、智能交通等图应用的基本要求。然而,现有的分布式图处理系统在处理动态图查询时,仍面临可扩展性不足、实时性不强、以及难以满足查询结果动态变化等技术挑战。本项目以动态图为研究对象,提出基于分布式流处理的动态图在线查询的方法,分别开展面向动态图的分区处理、异步在线查询和在线查询结果的增量更新方法的研究工作,力图解决动态图处理的负载不均衡问题、在线查询的延迟性与查询结果的不准确性等关键科学问题。通过本项目的核心技术研究,将有效提高动态图的实时分析水平,为现实的动态图应用提供行之有效的在线查询方法。..本项目基于分布式流处理的动态图在线查询技术展开多方面的研究。为解决动态图实时变化造成集群负载不均衡问题,提出了基于聚类与频率分析的实时图分区算法,快速处理实时图数据,为实时分析提供了一个统一的、高扩展性基础架构;针对海量轨迹数据,提升用户查询与降低存储空间,分析并实现25个轨迹压缩算法,给轨迹数据存储和空间数据库的设计提供指导意见;提出在动态路网中识别K条最短路径问题并设计了两层路径的索引机制,解决分布式实时K条最短路径查询与增量更新问题。此外项目组还提出一个基于分布式流处理系统的内存访问与计算的优化算法、在小样本上预测分布式系统的最优配置模型等方面的研究。..项目组在执行过程中对基于分布式流处理的动态图查询技术、算法进行研究并获得了较丰富的成果。目前已经在国内外学术期刊与会议上共发表论文19篇(包含CCF 推荐会议/期刊论文12篇),其中SCI源刊论文10篇,EI国际会议/期刊论文7篇,2篇国内期刊;申请技术发明专利3项;产生3个开源项目。部分成果CCF A类/B类会议和期刊上,如SIGMOD、VLDB、Information Science、TSC、Empir. Softw. Eng、Wirel. Networks、ICA3PP、FGCS等,部分研究成果还处于审稿中。接下来,将围绕动态图查询算法在交通轨迹应用、传感器应用、社交网络应用拓展研究。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
3

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
4

混采地震数据高效高精度分离处理方法研究进展

混采地震数据高效高精度分离处理方法研究进展

DOI:10.3969/j.issn.1000-1441.2020.05.004
发表时间:2020
5

国际比较视野下我国开放政府数据的现状、问题与对策

国际比较视野下我国开放政府数据的现状、问题与对策

DOI:
发表时间:2016

杨定裕的其他基金

相似国自然基金

1

基于EMD距离的数据流分布式相似性查询处理关键技术研究

批准号:61402494
批准年份:2014
负责人:许嘉
学科分类:F0202
资助金额:26.00
项目类别:青年科学基金项目
2

云环境下大规模动态图数据查询处理与优化技术研究

批准号:61472169
批准年份:2014
负责人:宋宝燕
学科分类:F0202
资助金额:82.00
项目类别:面上项目
3

关联数据上基于图的分布式查询处理技术研究

批准号:61702171
批准年份:2017
负责人:彭鹏
学科分类:F0202
资助金额:20.00
项目类别:青年科学基金项目
4

分布式不确定skyline查询处理关键技术研究

批准号:61472126
批准年份:2014
负责人:周炎涛
学科分类:F0204
资助金额:82.00
项目类别:面上项目