随着XML数据在各行各业的广泛应用,XML数据规模不断增大,由此带来的针对分布式海量XML数据管理问题,成为学术界和企业界一个亟待解决的重要课题。本项目研究可扩展的高效XML数据的存储,索引,查询和更新机制。首先,我们拟研究针对XML的key-value存储方案;其次,我们考察基于map-reduce编程框架的分布式XPath和XQuery查询处理和优化技术;然后我们拟研究分布式的基于B树结构的XML索引和更新机制,最后我们将建立一个海量分布式XML数据的存储和查询的原型系统。针对目前海量半结构化数据管理的挑战,本研究不但具有学术价值,而且还具有广泛的应用前景。
可扩展标记语言(eXtensible Markup Language,XML)是Internet上一种新的数据表示、存储和交换标准。XML推荐标准1.0版发布于1998年2月,之后迅速在全球掀起了XML应用的浪潮。 随着XML数据在各行各业的广泛应用,XML数据的规模不断增大,由此带来的针对海量XML数据的存储和高效查询等机制的研究成为学术界和企业界一个亟待解决的重要课题。为了满足针对海量XML数据高效处理的需求,可扩展的XML数据管理技术就成为了我们研究的方向。本课题组的全体成员通过四年的努力,在分布式海量XML数据管理技术方面有所新的发现和突破,基于该课题发表了一批国际一流的学术论文,推动了该领域的研究和发展。 ..具体的来说,本课题(1)研究了XML的存储和关键词查询技术,提出了针对海量数据的高效查询改写的算法,成果发表在SIGMOD, ACM TODS等顶级期刊会议上;(2)研究了多种XML查询的算法,包括分布式XPath和XQuery查询处理, 扩展树结构,通配符结构等,大大提高了XML数据查询处理的能力;成果发表在VLDB Journal等期刊中;(3)研究了海量异构数据的索引更新和Hadoop Mapreduce 的性能优化技术,提出了一套新的体系结构,研究成果发表在VLDB 2014等国际会议中,获得广泛关注。.. 本课题在国际交流合作、论文发表、人才培养及专利申请方面均取得一定成果,包括:1)在国内外一流会议期刊发表论文16篇,其中国际数据库顶级会议SIGMOD 发表研究长文两篇,VLDB 一篇,国际数据库顶级期刊VLDB Journal 一篇,和 ACM Trandaction on data management 两篇等;2)申请发明专利3项,软件著作权7项,出版关于XML的全英文专著一本;3)培养硕士研究生12名,博士研究生3名;4)研究内容作为本科生和研究生教材,相关课程获教育部IBM精品课程称号,相关教材获得北京市精品教材的称号;5)与新加坡国立、南洋理工、法国电信研究院、南丹麦科技大学等建立学术交流互访活动;6)课题组组长担任ICDE,SIGMOD等国际顶级会议的Proceeding chair, workshop chair, PC member 等学术兼职。
{{i.achievement_title}}
数据更新时间:2023-05-31
低轨卫星通信信道分配策略
Wnt 信号通路在非小细胞肺癌中的研究进展
基于LBS的移动定向优惠券策略
基于天然气发动机排气余热回收系统的非共沸混合工质性能分析
下调SNHG16对胃癌细胞HGC-27细胞周期的影响
模糊XML数据管理若干关键技术研究
连续不确定XML数据管理关键技术研究
云计算环境下海量XML数据管理关键技术研究
面向时空应用的大规模复杂模糊时空XML数据管理关键技术研究