Aiming at the issues of reconstruction and overlapping communities detection in functional gene networks (FGN), the project try to develop a new reconstruction approach with low-depending on molecular-interaction data, and a corresponding method to detect overlapping module of FGN. Firstly, the measurement for semantic similarity of GO terms is proposed taking full account of GO's structural information. And then the composite average and threshold selection based on clustering coefficient are used to reconstruct the genome-wide functional gene network. Secondly, we will study a novel overlapping detecting method in network based on gene label propagating. The concept of transmission intensity of genes is given to describe their topological information. Moreover, to improve the detecting efficiency and stability, we introduce an updating order based on node degree distribution and a label initializing method with cliques. Finally, with regard to the hierarchy structure of overlapping modular relationship and dynamic nature of FGN, the project is to study extracting method of hierarchy structure in overlapping modular according to directed acyclic graph (DAG) and overlapping modular detecting method for dynamic network based on 'co-occurrence matrix'. This project will be significant to exploiting the new bioinformatics methods, incorporating algorithm theories into the biology science, which can be potentially applied to structural understanding of biological complex network.
生物网络作为一种复杂网络是近几年信息科学的研究热点之一,本项目针对功能基因网络重构及其模块识别问题,发展对分子互作数据依赖性低的重构方法,并研究适合于该网络的交叠模块识别方法。首先,提出一种充分考虑基因本体(GO)结构信息的语义相似性计算方法,进而采用组合平均法和基于聚类系数的阈值选择方法构建全基因组的功能基因网络。然后,研究基于"基因标签传播"的交叠模块识别方法,提出"传播强度"概念,用以描述基因间拓扑结构;并提出基于度分布的基因更新序列以及基于Clique的基因标签设置方法,进一步提高识别的准确性与稳定性。最后,针对基因模块的层级性和网络动态性,分别给出基于有向无环图(DAG)描述的层级结构获取方法和基于"共现矩阵"的动态网络交叠模块识别方法。本项目对开拓新的生物信息学方法、研究算法理论与生物科学的结合都具有重要的理论意义,并在生物复杂网络结构分析方面具有潜在的应用价值。
生物网络是生物信息学的研究对象之一,而功能基因网络作为源于而又高于组学数据的一种网络形式,近几年受到人们关注。该项目利用信息理论与算法,围绕功能基因网络的重构与模块识别方法这两个问题开展工作,并重点研究了基于主流知识表示方法——基因本体(GO)的功能相似性计算方法、以及更好体现生命活动的蛋白质网络中复合体识别算法。项目属于生物信息学、计算生物学交叉学科研究方向,取得如下重要结果:.(1)在基因功能相似性计算方面,借鉴生物学机理,提出了基于细胞分化的GO语义相似性算法——最短语义分化距离。提出了一种基于哈希表的蛋白质功能相似度计算方法,提高了计算速度。.(2)在功能基因网络重构方面,提出了基于距离不等式的 K-medoids 聚类算法,降低了计算复杂度。并从多角度研究了蛋白质功能网络预测方法,分别考虑了动-静态混合型时序蛋白质、蛋白质结构域组成和主-被动协作关系等因素。.(3)提出了一种基于多标签传播的复合体识别算法,定义了传播强度,算法具有更高的识别准确率和良好的鲁棒性。构建了识别复合体的最小二乘法模型,具有较高的功能富集性。.(4)在交叠模块的层级化结构获取方面,构造了一种蛋白质模块度函数,并采用基于度相关性的初始簇选择方法,提高了层次聚类方法识别复合体的效率和针对性。.(5)提出了一种基于时序蛋白质网络的复合体识别方法,体现动态和静态两类蛋白质的特性,提高了识别复合体的准确性。提出了基于伪3D聚类算法的双层网络模块识别方法,能自动确定最优的模块划分等。.共发表论文44篇,其中期刊论文38篇(包括国际刊物25篇)、会议论文6篇;SCI、EI、中文核心期刊分别收录25篇、10篇、11篇。授权软件著作权2项。结合本项目研究工作,培养博士生8人、硕士生7人。.本项目将对进一步理解功能基因网络具有重要的理论意义,对利用信息科学的本体表示和模块识别算法研究生物信息学问题具有借鉴作用。
{{i.achievement_title}}
数据更新时间:2023-05-31
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
跨社交网络用户对齐技术综述
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
城市轨道交通车站火灾情况下客流疏散能力评价
基于细粒度词表示的命名实体识别研究
基于功能网络的疾病microRNA预测及模块识别方法
基因组尺度代谢网络自动重构及模块化的研究
基于网络重构和多尺度模块分解的人类疾病基因预测方法研究
基因调控网络重构与分析的研究