Trajectory data have been becoming an important data type for many new applications. It widely exists in traffic management, animal protection, environment monitoring, logistics management, public health, and other aspects of social lives. In practical applications, however, trajectory processing including data collection, pre-processing, data storage cannot guarantee a high usability such as accuracy, continuity, and equivalence. Therefore, data management for weak usability trajectories becomes very complex and challenging. Existing data management techniques cannot support weak usability trajectories and cause many serious problems. This proposal aims to reveal internal relationship between trajectory usability and processes of generating trajectories for new applications, and provides an important basis for data management with high usability in real applications. Main research contents include: theory and evaluation model of trajectory data usability, the trajectory data analysis and back-tracing algorithm, data correction algorithms for position locating and pre-processing, provenance-driven self-adaptive storage strategies, and approximate data query processing for weak usability trajectories. The goals of this proposal are to study the key techniques, to design, implement, and evaluate related algorithms. We aim to provide a breakthrough in database theory and technology, provide solid foundation for future applications.
轨迹数据作为新型应用信息传播的重要载体,广泛存在于交通、动物保护、环境、物流、公共卫生等社会生活的方方面面。然而实际应用中,数据的采集、预处理、存储等过程无法保证产生高可用性的轨迹数据,体现在轨迹数据的精确性、连续性和等效性等方面均有待改善。针对弱可用性轨迹数据的数据管理技术变得十分复杂而具有挑战性。现有的轨迹数据管理方法对弱可用轨迹数据的考虑不足,在全球范围内造成了极其恶劣的后果。项目旨在揭示新型应用下的轨迹数据可用性和轨迹数据处理各阶段的内在联系,为实现更加适合实际应用的保障数据可用性的轨迹数据管理提供重要的依据。主要研究内容包括:轨迹数据的可用性理论与评价模型、轨迹数据的溯源分析与溯源算法、溯源驱动的轨迹定位与预处理修正算法、溯源驱动的自适应存储策略、支持轨迹弱可用的近似数据查询处理技术。设计、实现和评价相关的算法, 争取在数据库理论和技术上取得一定的突破,为今后的实际应用奠定基础。
轨迹数据是作为新型应用信息传播的重要载体,在实际应用中具有广泛的应用前景。然而,在数据的采集、预处理、存储等过程无法保证获得高可用的轨迹数据,本申请在研究过程中,围绕轨迹数据的精确性、连续性、等效性等方面解决了若干的研究问题。以弱可用轨迹数据管理为主线,考虑目前应用需求的个性化、多样性、迅速变化的发展环境,开展溯源驱动的轨迹数据的弱可用性机理的研究,对于轨迹数据管理、数据收集、及相关的采样等理论研究都具有重要的指导意义。主要研究的内容包括:⑴构建了轨迹数据的可用性理论与评价模型研究,围绕轨迹数据的收集、数据表达的转换、存储组织结构、查询处理、位置服务等几个方面。⑵加强了轨迹数据的溯源分析与溯源算法设计与研究,对于研究轨迹数据的可用性具有重要的实用价值。⑶完善了轨迹定位与预处理修正方法,针对现有的采用基于平滑、回归等技术对轨迹数据进行修正,保证给定精确度和连续性前提下既修正轨迹数据。⑷改善了面向轨迹数据的灵活存储策略,针对现有采用的压缩存储结构,根据变化的存储空间和应用需求,提供自适应的存储策略。⑸扩展了对弱可用轨迹数据的近似查询处理能力,针对轨迹数据的近似查询处理中查询目标难以统一,提出了轨迹数据的查询元操作处理技术。此外,我们的工作还借助于溯源分析的研究方法,深入分析室内轨迹数据的可用性与物理设备的采集、预处理技术、存储等处理过程的内在关系以及查询、导航技术,并基于此,完善轨迹数据可用性理论,研究溯源驱动的若可用性轨迹数据管理中的关键技术。截止项目结题日期为止,取得的主要成果:设计并实现溯源驱动的弱可用轨迹数据管理原型系统;资助硕士研究生12名和博士研究生6名;邀请国内外教授来华交流访问达到三十余次;对关键技术进行攻关,发表高水平的论文50余篇,其中CCFA类论文12篇英文论文和CCF A类论文10篇中文论文,申请中国国家发明专利22项等。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
气载放射性碘采样测量方法研究进展
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
多源数据驱动CNN-GRU模型的公交客流量分类预测
基于PLC-IP3-Ca2+/NO-cGMP-PKG信号通路的半夏泻心汤防治糖尿病胃轻瘫的机理研究
分子伴侣Calnexin/Calreticulin和Erp57在流感病毒HA蛋白成熟过程中的作用研究
顾及位置隐私保护的轨迹时空数据管理方法
源于k-匿名隐私保护模型的不确定性数据管理及可用性问题
大数据驱动的高速铁路高可用性研究
海量众包数据管理的关键技术