云计算环境下医学RDF大数据的分布式查询处理与优化技术研究

基本信息
批准号:61363018
项目类别:地区科学基金项目
资助金额:45.00
负责人:杜方
学科分类:
依托单位:宁夏大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:张海燕,马小英,马丽,赵晓楠,郑娇,王登位,周长城
关键词:
云计算RDF数据分布式大数据查询处理
结项摘要

With high scalability and capability of distributed parallel computing, managing massive RDF data has been a hot research topic for both academic and industrial communities. RDF data is the basic component of Semantic Web, it grows at an exponential rate on the Web. Among these there are a lots of Medicine RDF data, which form numbers of medical-oriented RDF knowledge bases, such as Uiniprot and DrugBank etc. In the research program, we proposed two main problems: one is distributed storage of RDF data and distributed query processing over RDF data. To solve the problems we plan to do research in the following four parts: find the features of Medicine RDF data; design partitioning strategy of RDF over Cloud platform; design algorithm of query decomposition over Cloud platform; implement SPARQL query processing and optimization over Cloud platform. Through the research work, we plan to analysis the feature of Medicine RDF big data, learn the key technical of high performance query processing. The work will make contributions both to data construction of regional Medicine and query processing on big data over Cloud platform.

云计算平台具有高度的可扩展性和分布式并行计算能力。云计算平台下的大数据查询处理引起了学术界和产业界的极大关注。RDF数据是语义网的基本构成,目前正在以指数级的速度在互联网上日益增长,这其中包含了大量的医学相关数据,形成了如Uniprot、DrugBank等很多医学领域RDF知识库。本项目以医学领域的RDF大数据为研究对象,探索在云计算平台下实现高效的RDF查询处理及优化的基础理论和关键技术。围绕RDF大数据的分布式存储和分布式查询处理两个科学问题,本课题拟在以下四个方面展开研究,包括医学RDF数据特点;基于云平台的RDF数据划分方法;基于云平台的查询分解算法;基于云平台的SPAQRL查询处理与优化。通过研究,实现对医学RDF大数据的分析理解,掌握云平台上RDF大数据高效查询处理的关键技术,为地区医学领域数据建设和云平台下大数据查询处理的研究贡献力量。

项目摘要

云计算平台具有高度的可扩展性和分布式并行计算能力。云计算平台下的大数据查询处理引起了学术界和产业界的极大关注,而对语义数据的查询更是目前的研究趋势。RDF数据是语义网的基本构成,目前正在以指数级的速度在互联网上日益增长,这其中包含了大量的医学相关数据,形成了如Uniprot、KEGG、ChEMBL、DrugBank等很多医学领域RDF知识库。本项目以医学领域的RDF大数据为研究对象,探索在云计算 平台下实现高效的RDF查询处理及优化的基础理论和关键技术。围绕RDF大数据的分布式存储和分布式查询处理两个科学问题,本课题在以下四个方面展开了研究,1)利用生物医学知识库,分析医学RDF数据特点,生成针对地方疾病的生物医学知识网络;2)根据云平台的分布式特点实现对RDF数据的有效划分;3)在云平台上设计查询分解及优化方法实现查询;4)面向地方疾病、利用机器学习的方法实现对数据的分析利用。通过项目的研究,形成了地方疾病生物医学知识网络,此基础上提出了有效的数据组织、存储、查询的方法,实现了地方生物医学数据的智能分析,为后续研究及地区医学的发展做出了贡献。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
3

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

DOI:10.3969/j.issn.1674-0858.2020.04.30
发表时间:2020
4

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
5

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021

杜方的其他基金

相似国自然基金

1

云计算环境下海量数据查询优化与智能处理的研究

批准号:61173162
批准年份:2011
负责人:李克秋
学科分类:F0207
资助金额:58.00
项目类别:面上项目
2

云环境下大规模动态图数据查询处理与优化技术研究

批准号:61472169
批准年份:2014
负责人:宋宝燕
学科分类:F0202
资助金额:82.00
项目类别:面上项目
3

云环境下社交空间关键字查询处理与优化技术研究

批准号:61672145
批准年份:2016
负责人:赵相国
学科分类:F0202
资助金额:63.00
项目类别:面上项目
4

云计算环境下基于BSP模型的大规模图数据查询处理技术

批准号:61272179
批准年份:2012
负责人:于戈
学科分类:F0202
资助金额:81.00
项目类别:面上项目