Skyline query is a fundamental data management operator and plays an important role in environmental monitoring, location based services, GPS navigation system and so on. With the progress of human society and the development of network technology, the above applications produce large amounts of uncertain data. It is urgent to extract key information from the uncertain data and offer strong decision support for users. Motivated by this, we research the skyline query for large-scale uncertain data. Firstly, we study a novel uncertain skyline query model. It avoids reporting many results with dominance relationship which is different from the traditional model. We also investigate an uncertain skyline query with a size constraint where a new evaluation system is proposed to measure query results. Secondly, to gain the results which can better satisfy users’ requirements, we focus on uncertain dynamic skyline queries. Thirdly, to improve query performance, we will propose effective indexes and pruning strategies due to the features of large-scale uncertain datasets and the proposed queries. Finally, we will construct heterogeneous parallel computing plateform for managing large-scale uncertain data. It is noticeable that, in this plateform, progressive and scalable algorithms for the proposed queries will be developed, respectively. Generally, this research will promote the cross development of data management and high performance computing, and provide theoretical basis for high-performance data management for large scale uncertain data.
Skyline查询作为一种基础的数据管理操作,它在环境监控、基于位置服务、GPS导航等应用领域中发挥着重要作用。随着互联网及社交网络技术的革命, 这些应用中产生了大规模不确定数据。如何高效地从这些数据中提取关键信息,为用户提供决策支持,已成为亟待解决的问题。本项目首先针对通用不确定Skyline查询面临的结果数量过多、结果间存在支配关系等问题,提出一种查询新模型、建立一种综合考虑数据对象支配能力及被支配情况的结果评价体系,研究基于规模约束的不确定Skyline查询模型;然后,依据用户偏好信息探讨不确定动态Skyline查询模型;其次,为了提高查询性能,提出有效的索引技术和高效的剪枝策略;最后,基于超算异构资源建立不确定数据管理平台,分别针对所提出的查询问题,提出渐进、可扩展的并行算法。本项研究将为高性能不确定数据管理技术奠定一定的理论基础,促进数据管理及高性能计算领域的交叉发展。
Skyline查询作为一种基础的数据管理操作,它在环境监控、基于位置服务、GPS导航等应用领域中发挥着重要作用。如何高效地从这些数据中提取关键信息,为用户提供决策支持,已成为亟待解决的问题。项目针对Skyline查询的重要变体问题,探索查询新模型;为了提高查询性能,提出有效的索引技术和高效的剪枝策略;最后,基于超算异构资源建立不确定数据管理平台,分别针对所提出的查询问题,提出渐进、可扩展的并行算法。..项目资助期间,立足于时空数据查询研究的前沿,提出了新的Skyline查询新模型,并通过有效的索引和剪枝技术显著减少了搜索空间,提升查询性能;设计了Skyline查询的高性能算法,通过引入分层及并行算法设计技术,加速查询过程,满足用户实时性查询需求;研究了图查询中核分解、众包数据管理中基于时空数据的任务分配等时空查询处理关键技术。本项研究将为高性能数据管理技术奠定一定的理论基础,促进数据管理及高性能计算领域的交叉发展。..共发表学术论文 20余篇,包括IEEE/ACM Transactions 论文11 篇,被SCI 收录16篇。项目申请人担任国际期刊JSA 的客座编辑,获授权发明专利8项。项目相关成果获得中国产学研合作促进会一等奖。..培养了博士后1名,博士研究生4名,硕士研究生6名,其中1人获得湖南大学优秀博士论文奖、1人获得国家奖学金、4人获得湖南大学学校奖学金、2人获得湖南省研究生创新基金资助、1人获得2015年高性能计算协同创新中心优秀研究生创新项目资助,已初步形成具有较高学术水平和工程应用能力的并行时空数据管理研究团队。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
一种改进的多目标正余弦优化算法
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
多源数据驱动CNN-GRU模型的公交客流量分类预测
基于混合优化方法的大口径主镜设计
不确定数据流的分布并行Skyline查询技术研究
面向不确定数据的Skyline查询关键问题研究
海量不确定数据流的分布并行Skyline查询处理模型与算法研究
无线数据广播环境下位置相关Skyline查询问题研究