信息技术发展使个人数据管理问题日益突出。个人数据具有大规模、分布、异构的特点,查询往往基于复杂语义,传统结构化查询和关键字查询方法无法满足要求。由于缺乏实验数据、评价体系等基础工作支撑,个人数据空间研究面临挑战。本项目拟从建立实验平台和评价体系等基础工作开始,以构建具有一定应用价值的个人数据空间系统为目标,对大规模异构数据的数据模型、存储、查询等基本问题深入研究,争取取得突破性的研究成果。具体研究内容包括:针对数据空间本质特征提出基于图的数据空间模型;提出基于访问概率的多层次数据空间存储与索引策略;提出基于图的数据空间查询理论与方法。在此基础上进行实现技术研究,研发具有实际应用价值的个人数据空间原型系统。本项目本质上研究的是大规模异构数据管理基础理论和方法,研究成果即可以应用于开发实际的个人数据空间系统,也是进一步研发企业数据空间系统的基础,具有重要科学意义和应用价值。
随着人们产生信息和获取信息的途径日趋增多,个人信息量迅猛增长,个人数据管理日益成为一个重要的问题。课题组以构建个人数据空间系统为目标,对相关理论和技术问题展开研究,具体包括:适应个人数据特征的数据模型、多层次数据空间存储策略、数据空间查询理论及方法、高效的数据空间更新策略、数据空间系统实现关键技术。. 通过四年的研究,课题组取得了如下成果:提出了基于图的个人数据空间概念模型和基于四元组的数据空间逻辑模型,该模型可以刻画数据空间的时序特征;提出了基于数据与主体相关性的多层次数据空间存储策略以及相关性的定义和计算模型;提出了基于同义词的个人数据空间查询策略,以及个人同义词表的自动构建方法;提出了个人数据引用关系模型和相应的查询策略;研究了个人数据空间更新技术,提出了基于日志的数据更新方法。在上述成果基础上开发了个人数据空间管理系统,其实现了数据空间自动构建、更新、基于同义词查询等特色功能。在个人数据空间研究成果基础上,对面向主题的数据空间模型、数据更新、语义查询及系统实现技术进行了初步探讨和预研,凝练出一些有价值的研究问题,取得了一些阶段性成果。研究过程中建立了两个数据集:基于多个用户操作收集的个人数据集和基于DBLP文献数据扩展得到的计算机领域文献数据集。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
多空间交互协同过滤推荐
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
基于图数据库理论的海量RDF数据存储和查询方法研究
基于Spark的大图数据最优子模式匹配查询方法研究
基于双索引的子图和超图查询方法研究
基于概率图模型的数据降维算法研究