Knowledge graph is knowledge base in machine brain, and it is one of basic tools of artificial intelligence applications. Large-scale RDF knowledge graph has brought new opportunities for current data management, traditional RDF data management systems in centralized single node cannot meet application requirements since deficiency both in storage capacity and computing power. Therefore, based on these challenges and shortcomings, in distributed heterogeneous parallel environment, the project designs data partitioning algorithms in terms of RDF data semantic model and complex graph features, proposes query feature-aware SPARQL optimization algorithms, an optimal cost estimation model, effective pruning heuristic strategies, and query graph simplification algorithms, implements an extensible very large-scale RDF data management system prototype in heterogeneous distributed parallel environment. This research can not only explores efficient new management technology for massive data in artificial intelligence applications, but also promote the cross-development of high performance computing, artificial intelligence, and database systems.
知识图谱是机器大脑中的知识库、人工智能应用基础工具之一。大规模RDF知识图谱为数据管理带来了新的机遇,传统集中式单节点的RDF数据管理系统因计算和存储能力不足在处理超大规模RDF数据集时性能急剧下降,无法满足应用需求。为此,针对异构并行环境下超大规模RDF数据管理中存在的不足,本项目拟设计分布式异构并行环境下基于RDF数据语义模型及复杂图特性的数据划分算法,提出查询特征感知的SPARQL査询优化算法及相应的最优成本估算模型、有效的剪枝启发式策略以及查询图简化算法,实现一种异构分布式并行环境下通用可扩展的超大规模RDF数据管理系统原型。本项研究将不仅探索人工智能应用中海量数据的高效管理新技术,对于促进高性能计算、人工智能及数据库领域的交叉发展也具有一定意义。
项目资助期间,立足于高性能异构并行计算、大数据与人工智能的研究前沿,研制了高性能计算稀疏线性系统的快速异构并行算法,基于此设计并实现了大规模高效能的RDF图数据管理查询原型系统—gSmart。主持承担国家重点研发计划子课题、国家自然科学基金面上项目、之江实验室开放课题等国家和省部级项目5项,资助发表论文13篇,包括IEEE TPDS、ACM TOPC、ACM TKDD、IEEE IoT等CCF推荐A类/中科院1区国际顶级期刊论文7篇,ESI 1‰全球热点论文1篇,ESI 1%全球高被引论文2篇,申请国家发明专利4项,授权1项。研究成果获得2020年度吴文俊人工智能科技进步一等奖,项目负责人入选2021年度湖南省湖湘青年科技创新人才(湖湘青年英才)。
{{i.achievement_title}}
数据更新时间:2023-05-31
面向云工作流安全的任务调度方法
服务经济时代新动能将由技术和服务共同驱动
圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察
一种改进的多目标正余弦优化算法
基于混合优化方法的大口径主镜设计
云计算环境下基于图模型的海量RDF数据管理关键技术研究
云计算环境下海量RDF数据管理系统核心技术研究
分布式内存环境下的大图数据管理技术研究
异质网络环境下动态知识图谱构建技术研究