Disease gene prediction is a big challenge in the field of human health. Finding disease gene and related protein complex is an important foundation to the understanding of disease mechanisms, prevention and genetic diagnosis. However, the performance of existing methods is limited by the constraints of protein complexes information, phenotype similarity and Protein-Protein Interactions(PPI) database. Therefore, our study is try to address these three problems. Firstly, incorporating rich biological sources reconstructs the PPI Network by designing multi-layer network conversion algorithm. Secondly, we propose a protein complexes identification algorithm based on attributed PPI network. This combination of biology properties and topology structure is helpful to performance. Thirdly, learns the vector of phenotype by Skip-gram model from the mass of unlabeled biomedical literatures and calculates their similarities. Finally, heterogeneous network will be composed by the above three results for predicting the disease genes and related complexes. The results of this project will provide a strong reference for biologists. Furthermore, the network reconstruction method also has great significance for drug target discovery and related research.
致病基因的预测问题是人类健康领域面临的重大挑战之一, 寻找致病基因及相关复合物是认识疾病发生机理、研制疾病基因诊断与防治的重要基础。然而现有研究方法的性能受到蛋白质复合物信息有限、表型相似度计算依据不足、蛋白质关系中噪音数据的制约。因此本项目针对这三个方面的问题展开研究,设计基于多层网络模式转换策略并融合丰富资源特征的蛋白质关系网络重建算法,解决蛋白质关系中的噪音问题;提出基于属性网络的复合物识别算法,将生物属性与拓扑结构有机的结合从而提高复合物识别的性能;研究利用Skip-gram模型从海量未标生物医学文献中学习疾病表型的词向量从而计算表型相似度;最后研究利用这三个结果组成异构网络进行致病基因及相关复合物的预测,从根本上提高预测的性能。所识别致病基因及复合物将为生物学家提供有力参考,同时所研究的网络构建算法对基于网络研究的药物标靶发现等其他方面的相关研究具有一定的借鉴意义。
本项目组围绕致病基因预测问题展开研究,并取得了一系列研究成果,发表期刊、会议论文13篇,其中第一作者的论文包括CCF b类高水平论文3篇,中科院二区论文3篇。具体研究成果:1)在关系抽取方面,针对信息更新延迟问题,我们提出融合用户生成内容的深度学习方法,在F值方面取得了0.712。2)在复合物抽取方面,为了融合更多的生物证据我们提出融合基因本体信息的属性图嵌入算法用于复合物识别,实验结果表明我们的方法取得了较好的性能。3)在致病基因预测方面,我们提出基于多路径的随机游走图嵌入算法,每个蛋白质向量与表型向量通过相似度计算获得可能的致病基因。通过去一法验证取得了较高的性能。项目的研究成果为关系抽取、复合物抽取研究、致病基因预测等研究提供理论框架和方法体系,具有较强的科学意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
跨社交网络用户对齐技术综述
城市轨道交通车站火灾情况下客流疏散能力评价
基于FTA-BN模型的页岩气井口装置失效概率分析
丙二醛氧化修饰对白鲢肌原纤维蛋白结构性质的影响
基于异构网络的药物副作用预测方法研究
基于组织特异网络模型的致病基因预测算法研究
复杂疾病致病调控变异及其靶基因预测方法研究
基于复杂网络的致病ncRNA预测模型及算法研究