大规模图数据的拓扑表达性和超低复杂度可计算性研究

基本信息
批准号:61873281
项目类别:面上项目
资助金额:65.00
负责人:王淑栋
学科分类:
依托单位:中国石油大学(华东)
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:王珣,宋弢,王硕,丁桐,孟凡,刘高伟,姚加敏,马同茂
关键词:
基因网络图分析大规模图数据图挖掘多模态数据
结项摘要

Big data consisting of cloud of nodes and complex links are called large-scale graph, with node diversity, structural complexity and link diversity, which can model, express and analyze big data produced from traffic, Internet, social, commercial, biological and other fields. Therefore it is of great importance to study basic theory of information and computation of large-scale graphs. This project aims to solve two key scientific problems: one is expression of data and topology in large-scale graph and the other is ultra low computability. The emphasis is on developing properties of information representation, computing method of information processing and other basic theory research of large-scale graph. The main work includes: representation and visualization of multimodal data in large-scale graph; accessibility of distributed nodes in large-scale graph and frequent sub-graph mining, especially the centrality and similarity of nodes, reliability of nodes and edges; multimodal retrieval method, ultra-low complexity clustering algorithm, and ultra-low complexity matching algorithm of large-scale graph; modeling method of gene networks and application demonstration in gallstone disease.

大规模图是一类“节点云团+复杂链接关系”的大数据,具有节点多样性、结构复杂性、链接多样性等特点,交通、互联网、社交、商业、生物等领域产生的大数据都可以基于大规模图建模来表达和分析,因此开展大规模图信息与计算基础理论研究意义重大。本项目旨在解决大规模图的“数据和拓扑的表达性”和“超低复杂度的可计算性”两个关键科学问题,重点开展大规模图的性质、信息表达、信息处理的计算方法等基础理论研究,内容包括:研究大规模图数据多模态的表示方法与可视化,解决大规模图数据的表达性;研究大规模图节点的分布式可达性和频繁子图挖掘,特别是研究节点的中心性及相似性、节点和边的可靠性,解决大规模图的拓扑结构可表达性问题;研究大规模图的多模态检索方法、多模态数据超低复杂度聚类算法、超低复杂度大规模图匹配算法等,解决大规模图的超低度可计算性问题;最后开展基因网络的大规模图建模方法及胆石病识别中的示范应用。

项目摘要

本项目开展了大规模图数据的表示方法、拓扑结构、多模态数据处理算法等研究,并建立了基因网络的大规模图分析方法。在理论研究方面,提出了一种融合原始网络中节点的一阶和二阶相似性的算法,来实现大规模图的表示方法;分析了大规模图节点的中心性、相似性、可靠性等拓扑结构的性质,提出了基于元子图的异构图注意力网络模型;改进了大规模图的多模态哈希检索方法,建立了模态和模态间关系分析的并行算法;设计了基于核与核度的大规模图多模态数据超低复杂度聚类算法;提出了基于高斯相似性的静态图匹配算法,实现了特征的快速选择、缩小了索引规模,提高了匹配效率。在应用方面,从DNA芯片及其他新测序技术获取的大规模基因数据出发,挖掘基因间复杂的相互关系,构建基因网络,建立基于大规模图的基因网络分析方法,主要包括基于条件互信息的基因网络分析方法以及基于大规模网络节点中心性的基因网络分析方法等内容。上述方法主要用于识别与发现复杂疾病风险有关的基因,预测疾病-基因的关联关系,揭示复杂疾病的基因组学规律,为人类遗传学研究中复杂疾病相关基因定位提供新思路和新方法。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
4

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
5

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021

王淑栋的其他基金

批准号:61572522
批准年份:2015
资助金额:67.00
项目类别:面上项目
批准号:61170183
批准年份:2011
资助金额:59.00
项目类别:面上项目
批准号:60874036
批准年份:2008
资助金额:37.00
项目类别:面上项目
批准号:60503002
批准年份:2005
资助金额:26.00
项目类别:青年科学基金项目

相似国自然基金

1

大规模图数据中可达性索引技术研究

批准号:61602427
批准年份:2016
负责人:富丽贞
学科分类:F0202
资助金额:20.00
项目类别:青年科学基金项目
2

基于大规模图数据的可达性查询处理技术

批准号:61873337
批准年份:2018
负责人:陈子阳
学科分类:F0310
资助金额:63.00
项目类别:面上项目
3

大规模图中图性质求解的低复杂度分布式算法研究

批准号:61572216
批准年份:2015
负责人:华强胜
学科分类:F0201
资助金额:66.00
项目类别:面上项目
4

大规模图数据的符号表示和管理技术研究

批准号:61762024
批准年份:2017
负责人:董荣胜
学科分类:F0202
资助金额:40.00
项目类别:地区科学基金项目