基于异构网络的致病基因及其复合物预测方法研究

基本信息
批准号:61502071
项目类别:青年科学基金项目
资助金额:21.00
负责人:徐博
学科分类:
依托单位:大连理工大学
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:何增有,薛昕惟,陈鑫,赵哲焕,刘晓霞,吴军,冯钦林,郭凯
关键词:
蛋白质关系网络蛋白质复合体致病基因
结项摘要

Disease gene prediction is a big challenge in the field of human health. Finding disease gene and related protein complex is an important foundation to the understanding of disease mechanisms, prevention and genetic diagnosis. However, the performance of existing methods is limited by the constraints of protein complexes information, phenotype similarity and Protein-Protein Interactions(PPI) database. Therefore, our study is try to address these three problems. Firstly, incorporating rich biological sources reconstructs the PPI Network by designing multi-layer network conversion algorithm. Secondly, we propose a protein complexes identification algorithm based on attributed PPI network. This combination of biology properties and topology structure is helpful to performance. Thirdly, learns the vector of phenotype by Skip-gram model from the mass of unlabeled biomedical literatures and calculates their similarities. Finally, heterogeneous network will be composed by the above three results for predicting the disease genes and related complexes. The results of this project will provide a strong reference for biologists. Furthermore, the network reconstruction method also has great significance for drug target discovery and related research.

致病基因的预测问题是人类健康领域面临的重大挑战之一, 寻找致病基因及相关复合物是认识疾病发生机理、研制疾病基因诊断与防治的重要基础。然而现有研究方法的性能受到蛋白质复合物信息有限、表型相似度计算依据不足、蛋白质关系中噪音数据的制约。因此本项目针对这三个方面的问题展开研究,设计基于多层网络模式转换策略并融合丰富资源特征的蛋白质关系网络重建算法,解决蛋白质关系中的噪音问题;提出基于属性网络的复合物识别算法,将生物属性与拓扑结构有机的结合从而提高复合物识别的性能;研究利用Skip-gram模型从海量未标生物医学文献中学习疾病表型的词向量从而计算表型相似度;最后研究利用这三个结果组成异构网络进行致病基因及相关复合物的预测,从根本上提高预测的性能。所识别致病基因及复合物将为生物学家提供有力参考,同时所研究的网络构建算法对基于网络研究的药物标靶发现等其他方面的相关研究具有一定的借鉴意义。

项目摘要

本项目组围绕致病基因预测问题展开研究,并取得了一系列研究成果,发表期刊、会议论文13篇,其中第一作者的论文包括CCF b类高水平论文3篇,中科院二区论文3篇。具体研究成果:1)在关系抽取方面,针对信息更新延迟问题,我们提出融合用户生成内容的深度学习方法,在F值方面取得了0.712。2)在复合物抽取方面,为了融合更多的生物证据我们提出融合基因本体信息的属性图嵌入算法用于复合物识别,实验结果表明我们的方法取得了较好的性能。3)在致病基因预测方面,我们提出基于多路径的随机游走图嵌入算法,每个蛋白质向量与表型向量通过相似度计算获得可能的致病基因。通过去一法验证取得了较高的性能。项目的研究成果为关系抽取、复合物抽取研究、致病基因预测等研究提供理论框架和方法体系,具有较强的科学意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015
4

基于FTA-BN模型的页岩气井口装置失效概率分析

基于FTA-BN模型的页岩气井口装置失效概率分析

DOI:10.16265/j.cnki.issn1003-3033.2019.04.015
发表时间:2019
5

丙二醛氧化修饰对白鲢肌原纤维蛋白结构性质的影响

丙二醛氧化修饰对白鲢肌原纤维蛋白结构性质的影响

DOI:10.7506/spkx1002-6630-20190411-143
发表时间:2020

徐博的其他基金

相似国自然基金

1

基于异构网络的药物副作用预测方法研究

批准号:61602347
批准年份:2016
负责人:王银鹰
学科分类:F0213
资助金额:21.00
项目类别:青年科学基金项目
2

基于组织特异网络模型的致病基因预测算法研究

批准号:61402349
批准年份:2014
负责人:邓岳
学科分类:F0213
资助金额:25.00
项目类别:青年科学基金项目
3

复杂疾病致病调控变异及其靶基因预测方法研究

批准号:31871327
批准年份:2018
负责人:李俊
学科分类:C0608
资助金额:60.00
项目类别:面上项目
4

基于复杂网络的致病ncRNA预测模型及算法研究

批准号:61873221
批准年份:2018
负责人:王雷
学科分类:F0305
资助金额:66.00
项目类别:面上项目