Protein methylation catalyzed by methyltransferase plays an irreplaceable role in the gene expression regulation and signal transduction and is implicated in the process of a variety of human disease such as breast cancer as well as neurodegenerative disorders. Identification of methylation substrates and sites is the foundation for understanding methylation dynamics and regulatory networks and related pathogenic mechanisms. Based on urgent problems to be solved for the prediction of protein methylation at present, the project intends to develop methyltransferase specific methylated substrate and site prediction models by combining functional information, sequence information, physicochemical property with structural information. Feature selection and their contribution to the methylation site prediction will be discussed in details by using PCA and Group Lasso, and the most beneficial feature information are selected. Methylation sequence features and preferences of functional regulation, evolutionary conservation and sequence motif should be further investigated, which will help explore the molecular mechanisms of methylation and its regulatory networks. Based on the above models and bioinformatics, we further develop the online predictive analytics platform and customized models which will provide reliable biological information resources and research tools for comprehensive understanding protein methylation as well as new ideas for screening potential drug targets of related diseases.
甲基转移酶催化的蛋白甲基化在基因表达调控和信号转导中发挥着不可替代的作用,且与乳腺癌、神经退行性病变等重大疾病的发生发展密切相关。甲基化底物和位点的识别是理解甲基化修饰动力学及其调控网络和相关致病机制的基础。本项目拟针对蛋白甲基化预测中亟待解决的问题,将甲基化修饰功能信息与位点肽段的序列信息、物化环境和结构信息融合,系统构建甲基转移酶特异甲基化底物和位点预测模型;采用主成分分析和Group Lasso分析不同特征信息在甲基化预测中的作用,挖掘不同甲基转移酶甲基化底物的序列模体、甲基化序列特征与功能调控的偏好、不同物种间甲基化修饰的进化保守性等生物信息,探讨甲基化修饰分子机制及其调控网络;基于上述模型和生物信息构建甲基转移酶特异蛋白甲基化在线预测分析技术平台,为整体认识甲基化修饰提供可靠的生物信息资源和研究手段,为甲基化相关疾病的潜在药物靶标筛选和药物设计提供新思路。
蛋白质甲基化底物和位点的识别是理解甲基化修饰动力学及其调控网络和相关致病机制的基础。本项目组将甲基化修饰功能信息与位点肽段的序列信息、物化环境和进化信息融合,发展了一种识别不同类型精氨酸和赖氨酸甲基化的预测新方法。基于先前开发的甲基化预测工具系统分析了氨基酸突变对甲基化位点及相关癌症疾病的影响,发现与甲基化有关的变异蛋白更倾向于在细胞质、细胞核和细胞膜中活动,与多个癌症通路和信号通路有着密切关联,甲基化相关的癌症突变位点更趋向于发生在频繁突变的氨基酸,多数处于无序和保守区域。这些详细分析为探讨甲基化相关的氨基酸突变引起疾病的可能发病机制以及药物靶标筛选提供重要参考。同时我们系统综述了氨基酸突变对蛋白翻译后修饰影响的预测方法进展和未来发展趋势。此外,我们引入特征选择算法去优化特征向量,探讨其对翻译后修饰预测模型性能的影响。在发展人类赖氨酸糖化预测模型中,采用XGboost优化筛选特征向量;引入弹性网络算法Elastic net对九种原核生物赖氨酸乙酰化蛋白质序列特征、物理化学特征和进化信息特征进行优化;将Elastic net算法用于酪氨酸翻译后修饰预测模型构建中的特征向量筛选;提出两步特征选择方法去优化真菌特异性磷酸化预测模型。实验结果表明经过特征选择方法优化筛选特征向量后,剔除了冗余和噪声信息,特征向量的维数大大降低,节省了训练时间,挖掘了重要特征,增强了模型的可解释性,且模型的预测准确性均有显著提升。我们同步开发了上述模型的在线预测分析平台或软件,为蛋白翻译后修饰研究提供可靠的生物信息资源和研究手段。项目已按计划完成,在本项目的资助下,已在Bioinformatics、Briefings in Bioinformatics和ACS期刊Journal of Chemical Information and Modeling等国际重要学术刊物上发表SCI论文9篇,申请发明专利2项。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
寒热辨证的多层次信息挖掘及相关生物分子网络
融合多种信息识别激酶特异的蛋白质磷酸化位点
生物代谢网络融合遗传风险的复杂疾病特异代谢通路识别研究
RNA甲基化修饰高通量测序数据的生物信息方法开发以及RNA甲基化修饰调控网络的系统重建