随着计算机应用的日趋深入,计算机所管理的数据正从原子型的数据转换到聚集类型的数据(集合、序列、树、图),如大量的DNA序列、XML文本、分子结构数据等。但这类数据结构复杂,包含大量的语义信息,缺乏有效的存储和访问的方法,特别是高效的索引结构。本项目的总体思路是利用频繁模式生成技术产生数据的语义特征,并通过对语义特征的有效组织建立相应的索引结构,以索引结构为基础研究相应的查询和分析方法。围绕这个思路,本项目的研究内容包括:1、集合数据的索引结构:前缀树,基于块的前缀树的存储结构和相关查询算法,以及在XML数据存储系统中的应用。2、基于精确和模糊频繁模式的长序列数据的索引结构,及相关的精确和模糊的查询方法,并以此为基础的新的BLAST算法。3、基于频繁模式的图和树数据的组织方法,包括:两种数据的频繁模式发现方法,基于聚类的图数据的索引结构,基于新的索引结构的图和树类型数据的查询和分析。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
面向云工作流安全的任务调度方法
面向概率数据流的聚集查询处理技术
大规模模糊RDF数据存储与查询关键技术研究
外包数据的密文存储及查询的关键技术研究
面向云存储的多源数据安全查询机制和算法研究