There has been a rapid development of genome-wide techniques in the last decade along with significant lowering of the cost of gene sequencing, which generated widely available genomic data. However, the interpretation of genomic data and prediction of the association of genetic variations with diseases and phenotypes still require significant improvement. Missense mutations can render proteins nonfunctional and may be responsible for many diseases. The effects caused by missense mutations can be pinpointed by in silico modeling that makes it more feasible to find a treatment and reverse the effect. Specific human phenotype is largely determined by stability, activity, and interactions between proteins and with other biomolecules which work together to provide specific cellular functions. Therefore, the analysis of the effects of missense mutations on proteins and their complexes would give us important clues for identifying functionally important missense mutations and understanding the molecular mechanisms of diseases. In this project, we will continue our research towards developing powerful computational methods and tools to estimate the effects of sequence variants and disease mutations on protein stability, binding affinity and function, and provide a mechanistic understanding for impact of each mutation. Meanwhile, we will actively collaborate with experimental groups and hospitals to promote fruitful interplay between computational prediction and experimental investigation and contribute to the disease diagnose, prevention and treatment.
随着全基因组技术的快速发展及基因测序成本的显著降低,产生了大量的基因组数据。然而,对于基因组数据的解释以及遗传变异与疾病和表型之间关联的预测,仍需要显著提高。错义突变可以使蛋白质失去功能,可能导致许多疾病的发生和发展。由错义突变造成的影响可以通过计算机模拟来确定,更可行地找到治疗手段并逆转效应。特异性人类表型在很大程度上由蛋白质的稳定性,活性和与其它生物分子的相互作用共同决定,以此提供特定的细胞功能。因此,分析错义突变对蛋白质及其复合物的影响,将为我们识别功能重要的错义突变和了解疾病的分子机制提供重要的线索。在这个项目中,课题组将继续从事计算方法和工具的开发,以估计序列变体和疾病突变对蛋白质稳定性,结合亲和力和功能的影响,并调查突变影响的分子作用机制。同时,我们将积极与实验课题组和医院合作,促进计算预测与实验调查之间的有效互动,为疾病诊断,预防和治疗做出贡献。
随着基因组测序技术的快速发展和成本的显著降低,产生了大量的基因组数据。然而,对于基因组数据的解释以及遗传变异与疾病表型之间关联的预测,仍需要显著提高。错义突变,可以通过影响蛋白质的稳定性及其与其它生物分子之间的结合强度,致使蛋白质的功能削弱、甚至丧失,从而导致许多疾病的发生和发展。因此,本研究开发了PremPS(https://lilab.jysw.suda.edu.cn/research/PremPS/)、MutaBind2(https://mutabind.org/v2)、PremPDI(https://lilab.jysw.suda.edu.cn/research/PremPDI/)和PremPRI(https://lilab.jysw.suda.edu.cn/research/PremPRI/)方法,分别用于估计错义突变对蛋白质稳定性、蛋白质-蛋白质、蛋白质-DNA和蛋白质-RNA之间相互作用的影响,并定量计算折叠自由能和结合亲和力的变化。这四种方法基于分子力学力场和快速侧链优化算法,综合使用序列和结构的特征建立了多元线性回归或随机森林预测模型。在实验和预测值之间取得了良好的一致性,优于所有现有方法。以上方法可以应用于许多任务,例如发现功能上重要的变异体,了解其作用的分子机制以及设计新的蛋白质和蛋白质-蛋白质/核酸相互作用抑制剂。同时本研究通过计算核苷酸和密码子的变异性,研究了背景过程对形成观察到的癌症突变谱的贡献,并开发了针对泛癌和特定癌症类型的概率模型,以此找到可能在癌症中处于选择状态的突变。测试结果表明即使没有涉及对现有数据的训练,我们的方法与目前可获得的最先进的方法相比,仍具有相似的或更好的预测效果。此外本研究还撰写了一篇综述论文,总结了主要的计算方法和工具用来区分癌症驱动和乘客错义突变。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于分形L系统的水稻根系建模方法研究
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于LASSO-SVMR模型城市生活需水量的预测
基于亲和力的罗非鱼IgM结构多样性的功能解释和调控机制
蛋白质与小分子结合亲和力变化的结构基础研究
16SRNA反SD序列的位置和结合强度对翻译的影响
蛋白质非共价结合蓝莓花色苷稳定性的影响机理