诸如医疗等实际应用领域更关注数据流上连续的数据区段而并非单个数据点,如何灵活地在数据流上表达基于模式的查询请求并完成查询处理,就成为一个重要和现实的问题。本课题深入分析了典型应用领域内数据流模式查询的需求和特征,提出了可伸缩模式查询的概念,支持用户在查询目标内设置重复、缺失和倒置语义,通过提取查询目标中相对不变、可相互区分的稳定因素来形成基模式,通过基模式组合来得到复杂目标模式,以"不变(有限基模式集合)"应"万变(基模式的各种组合出现)",既保证了可伸缩模式丰富的查询语义,又实现了查询表达的确定性和简洁性。进而通过在连续数据段和基模式这两种不同表达形式之间的比对把数据流实时转换成基模式流,通过查询重写在可伸缩模式查询网络上执行查询处理和优化,并保证在大数据量爆发和高噪声环境下查询的有效性。最终为用户提供一种灵活的、语义丰富的、通用的可伸缩模式查询方式。同时研制基于理论研究成果的原型系统。
普适计算和传感器网络的飞速发展使得数据流技术在现实生活中得到越来越广泛的应用,诸如医疗等实际应用领域更关注数据流上连续的数据段而并非单个数据点,如何灵活地在数据流上表达基于模式的查询请求并完成查询处理,就成为一个重要和现实的问题。.本课题深入分析了典型应用领域内对数据流模式查询的需求和特征,提出了可伸缩模式的概念,支持用户在查询目标内设置重复、缺失和倒置语义,通过提取查询目标中相对不变、可相互区分的稳定因素来形成基模式,通过基模式组合来得到复杂目标模式,以“不变(有限基模式集合)”应“万变(基模式的各种组合出现)”,既保证了可伸缩模式丰富的语义,又实现了查询表达的确定性和简洁性。在用户定义的查询目标上,为避免在波段之间交叉重叠处的可伸缩语义混乱和波段匹配的二义性,先通过划分机制把查询目标表示为一系列首尾相接、可相互区分、互不交叉重叠的基本波段,然后对这些基本波段进行模式提取后生成原查询目标上的基模式覆盖。进而通过在连续数据区段和基模式这两种不同表达形式之间的比对把数据流实时转换成基模式流,通过查询重写将可伸缩约束转换到基模式覆盖上,得到基于可伸缩模式的查询表示形式,通过作用在基模式上的操作集合、适用于可伸缩模式查询处理的缓存技术和模式存储结构,实现了可伸缩模式查询处理及优化,并保证在大数据量爆发和高噪声环境下查询的有效性。最终为用户提供了一种灵活的、语义丰富的、通用的可伸缩模式查询方式。.在理论研究成果的基础上,研制了数据流上面向可伸缩模式查询的原型系统,在研究组收集到的重症监护数据流上进行了充分实验,通过原型系统和实验分析对理论研究进行了验证和完善。通过千万量级真实数据集上的实验表明,本课题提出的可伸缩模式查询处理方法在时间和空间消耗两个方面都能够满足医疗领域的实际需求。另外在准确率、召回率和处理效率方面进行的对比实验表明,采用基于优化后的模式复合图来进行可伸缩模式查询处理方法要优于目前相关研究方法ZStream和NFAb,能够有效辅助医疗决策。.基于课题研究成果,在核心期刊《计算机学报》,《计算机研究与发展》以及ICDE,ApWeb,WAIM,BIBM等国际学术会议上共发表论文25篇,其中已被EI收录16篇。完成博士学位论文1篇,硕士学位论文16篇。获得发明专利3项。获得全国数据库学术会议NDBC2012优秀研究生论文奖,以及CCF第一届大数据创新大赛二等奖。
{{i.achievement_title}}
数据更新时间:2023-05-31
监管的非对称性、盈余管理模式选择与证监会执法效率?
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
基于全模式全聚焦方法的裂纹超声成像定量检测
基于可拓学倾斜软岩巷道支护效果评价方法
极区电离层对流速度的浅层神经网络建模与分析
新疆维族早发型PD患者的临床特点及PARK2、PINK1、Vps35及EIF4G1基因突变相关性研究
云计算环境下面向SaaS多租户的可伸缩数据放置关键问题研究
基于Spark的大图数据最优子模式匹配查询方法研究
面向全基因组关联研究的动态数据挖掘与深度查询方法
面向3G的可伸缩视频编码、分析和调度研究