It is urgent to find effective computational approaches to enhance the confidence of the protein-protein interactions (PPI) network in the field of bioinformatics. Thus, in order to reconstruct high confidence PPI network, the graph wavelets and structured sparse probabilistic graph models will be built in this project. The project mainly studies the followings: (1) considering that the present graph wavelets are all defined on the undirected graphs, the graph wavelets applied to directed or undirected graph will be defined in the project; (2) the high and low frequency graph wavelet filters will be constructed in this project by means of the spectrum signatures of the graph adjacency matrix, which will be used to de-noise PPI network; (3) unlike the traditional probabilistic graph models, by virtue of the sparse regularization method, structured learning theory and ensemble learning method as well, structured sparse probabilistic graph model that fits the topology structure will be established in the project to simulate the generating procedure of the PPI network, which aims at reducing the model error. Furthermore, the reliable index which is designed by using parameter estimations integrated with multi-information of proteins will be applied to evaluate PPI and reconstruct PPI network. Therefore, the present study will establish a good foundation for further researches, such as analyzing protein functions, exploring life development, studying difficult pathology, and developing drugs, etc, which benefit self-physiology and health of human beings.
寻找有效的计算方法提高蛋白质相互作用网络的精度是生物信息学领域一个亟待解决的问题。因此,本项目拟通过构建图小波及结构化稀疏概率图模型实现高精度蛋白质网络重构。项目主要研究:(1)考虑到目前图小波均定义在无向图上,拟定义对有向图及无向图均适用的图小波;(2)拟利用图邻接矩阵的谱特征定义高频和低频图小波滤波器,并将其作用于蛋白质相互作用网络,对其进行初步去噪;(3)与传统概率图模型不同,本项目拟利用稀疏正则化方法、结构学习理论及集成学习方法构造契合蛋白质相互作用网拓扑结构特点的结构化稀疏概率图模型,将模拟蛋白质相互作用网络的生成过程,减少建模误差。进一步,将利用融合了多源蛋白质信息的模型参数估计结果设计置信度指标,以评估蛋白质相互作用关系,重构高精度蛋白质网络。本项目的研究将为进一步挖掘蛋白质功能、探索生命发育、研究疑难病理、开发药物等诸多惠及人类自身生理与健康的研究奠定基础。
在本项目资助下,课题组利用概率图模型及多尺度分析工具在高精度生物分子网络重构、多源数据融合及应用、蛋白质复合物挖掘等方面取得了如下研究成果。第一,提出了基于稀疏概率图模型和Bernoulli分布的线虫蛋白质相互作用关系重构方法,模型契合了生物分子网络的演化特点,通过格式、无自环、无非编码蛋白等筛选准则整合了现有7个线虫公共PPI数据,得到了一个带有评估权重的相对完整的线虫PPI数据库,并制作了检索网页,目前访问量4117次。第二,融合单细胞基因表达数据,PPI,PDI,遗传数据,基因敲除实验数据等,推断线虫细胞中多个基因对基因nhr-25的调控作用,结果包括调控方向和基因因果反应效果(激活或抑制)。第三,提出了自适应黑洞多目标算法(AMOBH),此方法有效避免粒子群算法陷入局部最优解的困扰,开发了AMOBH工具箱,目前访问量370次,下载量73次。基于此模型,以拓扑结构特性和GO功能相似性作为多目标优化策略中的目标函数挖掘蛋白质复合物,此算法较传统的基于多目标优化的蛋白质复合物挖掘算法,运算快,特别在具有重叠性的蛋白质复合物挖掘中具有明显优势。第四,提出了基于图小波的具有层次性的蛋白质复合物挖掘算法,通过图小波变换,得到PPI中异尺度节点的图小波变换系数,根据相关性,挖掘不同层次的蛋白质复合物。此方法克服了传统算法忽视PPI网络层次性的问题。除按照原研究内容开展上述研究外,还开展了基于张量分解的图匹配算法设计、模糊全间隔支持向量机建模、生物标志物检测等研究工作。. 项目的研究通过融合多源数据,提高了PPI网络的重构精度,基因调控网络推断的准确性及蛋白质复合物挖掘的精准性。模型通过融合基因表达信息,反映了蛋白质网络的动态变化特性,突破了传统方法受静态网络的局限性。本项目的开展为预测蛋白质功能,揭示功能模块动态变化引起人类病变的机理研究提供了一定的实验基础和理论依据,为进一步探究复杂疾病机理,药物研发等诸多惠及人类生理与健康的研究提供理论指导方法。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
粗颗粒土的静止土压力系数非线性分析与计算方法
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于稀疏概率图模型的多癌症多组学生物网络构建方法研究
概率图模型对偶优化及其在视频序列分析中的应用研究
概率方法在超图与有向图划分中的应用
基于概率图模型的张量分析及应用