Apoptosis proteins are one kind of proteins with specific functions, and play an important role in the growth and homeostasis of organisms. Since the function of apoptosis proteins correlates with their subcellular location in cell, the study of their subcellular location is very helpful for understanding the mechanism of apoptosis. In this project, the main objectives include two aspects: first, based on the growing of the experimental data of apoptosis proteins subcellular location and the urgent need of their function research, detailed database of apoptosis proteins subcellular location with sequence homology and multiple-location information will be performed and further perfected; second, based on deep and systematic analysis of the sequence characteristics, motif and domain composition of apoptosis proteins for the different subcellular location, the effective combination vectors including above sequence characteristics and the information such as protein pseudo amino acid composition, gene ontology annotation, evolutionary, chemical shift and so on will be constructed. We will extract information parameters of subcellular location, and develop increment of diversity combined with support vector machine algorithms that is proposed in our protein subcellular location study. This proposed effective algorithm and theory will be able to predict subcellular location of apoptosis protein including multiple-location, to further improve the predictive capability, enhance prediction credibility, and to predict unknown subcellular location of apoptosis proteins.
细胞凋亡蛋白质是一类具有特定功能的蛋白质,在生物体的生长发育和动态平衡中起重要作用。细胞凋亡蛋白质的功能和它在细胞内的定位密切相关,研究它的亚细胞定位信息对于了解细胞凋亡的机制非常有帮助。本项目针对细胞凋亡蛋白质亚细胞定位实验数据的不断增长及其功能研究的迫切需要,进一步建立、完善和细化与序列同源性有关的、包括多定位信息的细胞凋亡蛋白质亚细胞定位数据集。在此数据集的基础上,深入系统地分析不同亚细胞位置的细胞凋亡蛋白质的序列特征、保守模体特征和功能域特征,提取与亚细胞定位相关的信息学参数。将这些信息参数与蛋白质的伪氨基酸组成信息、基因本体论注释信息、进化信息和化学位移信息等,组成有效的组合向量,发展我们在蛋白质亚细胞定位问题中所提出的离散增量组合算法,提出预测包括多定位的细胞凋亡蛋白质亚细胞定位的有效算法和理论,进一步提高预测能力,增强预测可信度,预测未知亚细胞位置的细胞凋亡蛋白质。
细胞凋亡蛋白质的功能和它在细胞内的定位密切相关,研究它的亚细胞定位信息对于了解细胞凋亡的机制很有帮助。在细胞凋亡过程中抗凋亡与促凋亡蛋白质对细胞凋亡的调控起着不同的作用,如果抗凋亡或者促凋亡蛋白质失活,将导致癌症和其它疾病的发生。本项目建立了与序列相似性有关的、包括多定位信息的细胞凋亡蛋白质亚细胞定位数据子集。在此数据子集的基础上,深入系统地分析了不同亚细胞位置的细胞凋亡蛋白质的序列特征、保守模体特征和功能域特征,提取与亚细胞定位相关的信息学参数。将这些信息参数与蛋白质的伪氨基酸组成信息、基因本体论注释信息、进化信息和化学位移信息等,组成有效的组合向量,综合离散增量和支持向量机等算法,提出了预测包括多定位的细胞凋亡蛋白质亚细胞定位的有效算法和理论,获得了很好的预测效果。将相应的特征提取方法和算法应用到抗凋亡及促凋亡蛋白质数据集的分类研究中,并提出了改进的KNN算法—均值K紧邻算法,也获得较好的预测结果。进一步分析了RNA与细胞凋亡蛋白质亚细胞位置之间的关系,发现细胞凋亡蛋白质的3-mer mRNA序列频数信息、mRNA序列模式信息与mRNA二级结构等信息,在不同亚细胞位置的细胞凋亡蛋白质中具有一定特异性,融合了mRNA序列和结构特征,有助于提高细胞凋亡蛋白质的亚细胞定位预测精度。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于LASSO-SVMR模型城市生活需水量的预测
基于SSVEP 直接脑控机器人方向和速度研究
基于多源信息融合的蛋白质亚细胞定位预测算法研究
面向蛋白质亚细胞定位的特征提取与预测模型研究
分形与统计相关方法在蛋白质亚细胞定位及功能预测中的应用
蛋白质亚线粒体定位及其特征信息和预测算法的挖掘