The occurrence and development of complex human diseases are closely related to the protein dynamics. Therefore, it is appealing to identify protein complexes from dynamic protein-protein interaction (PPI) networks. .Based on the dynamic characteristics of protein networks, we are going to construct the dynamic PPI networks based on the time series gene expression data. In order to improve the correct rate of identification, we will propose efficient algorithms for identifying protein complexes in dynamic networks by using the fruit fly optimization mechanism, MCL method combined with topological potential field, granular computing in quotient space, and so on. Furthermore, we intend to employ swarm intelligent optimization mechanism to optimize the models and their parameters. In particular, we are going to design the calculation steps and parameter selection principle. Finally we will establish the PPI networks of normal cell physiological state and a particular disease state, analyze the inherent relationship between the mechanism of dynamic change of protein complexes and its function, and look for the disease-related proteins and the deep rationales that these dynamic changes lead to the human diseases. .This project can help predict protein functions, molecular disease markers and drug targets while providing experimental and theoretical fundamentals for the diagnosis and treatment of complex diseases.
人类重大疾病的发生和发展都与蛋白质的动态变化过程密切相关,在动态蛋白质相互作用(Protein-protein Interaction, PPI)网络中识别蛋白质复合物非常关键。.本项目针对蛋白质网络的动态性,基于时间序列的基因表达数据,构建动态PPI网络;采用果蝇优化机理、基于拓扑势场的马尔科夫聚类、商空间下的粒计算等理论方法来提出动态蛋白质网络复合物挖掘算法,以期提高复合物识别的正确率,进而利用群智能优化机理对模型及参数进行优化,设计算法的计算流程及参数选取依据;建立细胞正常生理学状态和特定疾病状态下的PPI网络,分析蛋白质复合物动态变化的机制与其功能的内在关系,寻找致病蛋白质以及这些动态变化导致人类疾病的深层原因。.此方面的研究可以帮助我们预测蛋白质功能,寻找疾病分子标记和药物靶标,为相关疾病的诊治提供实验基础和理论依据。
针对小世界、无尺度特性的PPI网络蛋白质复合物挖掘问题,首先,在对PPI网络数据、基因表达数据、基因本体数据和亚细胞定位数据、转录组测序技术得到的RNA-seq数据以及PPI网络拓扑特性分析的基础上,构建动态蛋白质相互作用加权网络。接下来,基于布谷鸟优化算法、萤火虫优化算法、蚁群优化算法、飞蛾扑火优化算法、花授粉优化算法、相邻亲和度思想、马尔科夫聚类模型、密度聚类算法OPTICS和PageRank计算模型,在构建的动态蛋白质相互作用加权网络上挖掘蛋白质复合物,并对如何挖掘特殊的蛋白质复合物进行了研究。同时,对识别关键蛋白质进行了研究,蛋白质的关键性不仅与蛋白质在网络中网络特性有关,还与其生物特性以及蛋白质复合物有密切的关系,结合蛋白质在PPI网络中的网络特性和生物特性,采用群智能优化算法、随机游走算法和信息熵等方法识别关键蛋白质,仿真实验结果表明,这些方法识别关键蛋白质的准确性明显提升。项目后期,重点对蛋白质在疾病基因识别、疾病控制等病理过程中起着重要的作用进行了研究。随着高通量测序技术的发展,出现了大量的疾病相关的数据,为研究蛋白质在病理过程中的作用提供了数据基础。DNA数据、RNA数据和蛋白质数据从三个不同维度描述了疾病机理,三者之间具有一定的相互作用,因此,结合PPI网络、疾病相似性网络、circRNA相互作用网络和代谢物相互作用网络等建立了多层异构网络,从不同的组学角度出发,对疾病基因预测,识别与疾病相关联的circRNA、代谢物、微生物和生物通路等进行了研究。仿真实验表明,结合多组学数据、融合机器学习方法和复杂生物网络构建方法的研究思路,对阐明疾病机理、疾病治疗、预防和药物设计有很大的推动作用,同时,发布的描述circRNA和疾病关联关系在线数据库CircR2Disease可以为生物信息相关企业以及研究人员开展疾病相关研究提供数据来源。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
跨社交网络用户对齐技术综述
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
基于LASSO-SVMR模型城市生活需水量的预测
内点最大化与冗余点控制的小型无人机遥感图像配准
基于网络水平的关键蛋白质识别方法及其应用研究
蛋白质网络动态演化模型及应用算法研究
基于收敛聚类模型的蛋白质复合物识别方法研究
面向动态蛋白质网络的功能模块挖掘方法及其应用研究