普适计算和传感器网络的飞速发展使得数据流技术在现实生活中得到越来越广泛的应用,面对大量、时变的数据流,如何在线、准确地识别出数据流上的变化并挖掘变化所蕴含的语义,成为一个重要和现实的问题。. 本课题通过对典型应用领域内数据流特征的深入分析,提出了伪周期数据流的概念,其主要特征是:数据流上以数据区段为单位呈现一定的相似性,但各数据区段并没有严格一致的时间跨度,并在取值上也存在差异。根据上述特点,研究对此类数据流的周期分割和模式提取方法,提出对比时间跨度不同的数据段来发掘变化的方法。研究变化的度量策略与分析手段,能够区分激烈的质变与较平缓的渐变,并通过渐变来警示质变,同时判定变化的有效性以去除噪声干扰,比传统变化检测方法具有更好的适用性和健壮性。在对变化的表示与存储中,充分利用变化之间的联系来减少对存储空间的消耗,为用户追踪、分析变化的历史提供可能。同时研制基于理论研究成果的原型系统。
普适计算和传感器网络的飞速发展使得数据流技术在现实生活中得到越来越广泛的应用,面对大量、时变的数据流,如何在线、准确地识别出数据流上的变化并挖掘变化所蕴含的语义,成为一个重要和现实的问题。.. 本课题通过对典型应用领域内数据流特征的深入分析,提出了伪周期数据流的概念,其主要特征是:数据流上以数据区段为单位呈现出一定的相似性,但各数据区段并没有严格一致的时间跨度,并且在取值上也存在差异。根据上述特点,研究了对此类数据流的周期分割和模式提取方法,能够根据数据特征来自动确定分段点,能够自动调整截取数据流的时间间隔,以保持数据流固有的伪周期特性;提出了在线对比时间跨度不同的数据流区段和既有模式来发掘变化的方法;研究了变化的度量策略与分析手段,能够区分激烈的质变与较平缓的渐变,并通过渐变来警示质变,同时判定变化的有效性以去除噪声干扰,比传统变化检测方法具有更好的适用性和健壮性。在对变化的表示与存储中,设计了不丧失数据特征、具有良好压缩效果的模式提取方法,提出了新颖的数据结构(模式生长图)来存储数据流上的变化历史,在模式生长图中仅存储数据流上新变化的片段,复用了未变部分,充分利用了变化之间的联系来减少对存储空间的消耗,为用户追踪、分析变化的历史提供了可能。.. 在理论研究成果的基础上,研制了面向伪周期数据流变化管理的原型系统PDVM,并在课题组收集到的各种大数据集上进行了充分的实验,通过原型系统和实验分析对理论研究进行了验证和完善。在百万量级的真实数据集上的实验证明,PDVM比传统方法在具有伪周期性质的数据流变化管理应用中具备更大的优势和更好的实用性。课题组部分成果成功应用于医疗重症监护数据流的降噪处理(将虚警率由71%下降至12.4%)以及山西移动经营分析系统的关键指标预测上(将上网流量日指标预测的平均绝对误差比由32.04%下降至8.99%)。. . 基于课题研究成果,在核心期刊《计算机学报》,《计算机研究与发展》以及ApWeb,DASFAA,WAIM等国际学术会议上共发表论文21篇,其中已被EI收录7篇、已被ISTP收录7篇。完成硕士学位论文10篇。获得全国数据库学术会议优秀研究生论文奖2项。
{{i.achievement_title}}
数据更新时间:2023-05-31
监管的非对称性、盈余管理模式选择与证监会执法效率?
黄河流域水资源利用时空演变特征及驱动要素
近 40 年米兰绿洲农用地变化及其生态承载力研究
疏勒河源高寒草甸土壤微生物生物量碳氮变化特征
吉林四平、榆树台地电场与长春台地磁场、分量应变的变化分析
新疆维族早发型PD患者的临床特点及PARK2、PINK1、Vps35及EIF4G1基因突变相关性研究
数据流上面向可伸缩模式的查询方法研究
不确定数据流上对象簇管理关键技术研究
异构数据中心能耗管理方法研究
电梯全寿命周期故障预测与智能健康管理方法研究