针对蛋白质亚细胞定位实验数据的不断增长及其功能研究的迫切需要,进一步建立和完善包括多定位的凋亡蛋白的亚细胞定位、核蛋白亚核定位、亚线粒体定位和拟南芥亚细胞定位等数据子库。在系统深入分析不同亚细胞定位蛋白质序列所包含的信息内容的基础上,进一步研究不同亚细胞定位蛋白质所包含的特征模体、特征简单超二级结构和特征功能域,并提取与亚细胞定位相关的蛋白质特征信息参数。将这些信息参数与蛋白质的伪氨基酸组成、Gene Ontology (GO) 注释信息相结合,并利用离散增量理论和推广的位置关联的矩阵进行信息参数的整合,组成有效组合向量,提出预测包括多定位的凋亡蛋白和拟南芥蛋白的亚细胞定位、核蛋白的亚核定位、线粒体的亚线粒体定位的有效算法和理论,并根据预测结果不断改进和完善有效信息参数的选取和理论预测算法,提高预测能力,增加预测可信度,预测未知定位蛋白的亚细胞定位,为更好地深入理解蛋白质功能提供帮助。
在蛋白质亚细胞定位相关的数据库基础上,进一步完善和建立了蛋白质亚线粒体和亚叶绿体定位、拟南芥、分枝杆菌和细胞凋亡蛋白的亚细胞定位及核蛋白亚核定位数据子库。探索和分析了不同亚细胞定位蛋白的序列信息特征和与结构相关的信息参数,首次提出了计算具有生物学意义的蛋白质骨架原子化学位移的方法,并建立计算平均化学位移网站。将与蛋白质结构相关的化学位移和氨基酸亲疏性在蛋白质序列上的分布作为信息参数结合到蛋白质的组分信息、进化信息和 gene ontology (GO)等其他特征信息,发展了我们以前的最小离散增量算法。提出K近邻最小离散增量分类方法和局域位置关联权重矩阵,并将离散增量算法与SVM和局域位置关联权重矩阵算法相结合,提出了预测蛋白质亚线粒体、拟南芥和分枝杆菌亚细胞定位和核蛋白亚核定位等多种融合算法。通过统计分析和比较选取合理的信息特征参选,利用这些新的算法预测了相应的蛋白质亚细胞、亚线粒体定位、亚叶绿体定位和亚核定位,获得较好的预测结果。为了更进一步检验这些算法的实用性,将这些算法应用到mesophilic proteins and thermophilic proteins、bioluminescent proteins and nonbioluminescent proteins、acidic and alkaline enzymes、蛋白质DNA/RNA-binding 位点预测和DNA promoter预测,均取得很好的预测结果。特别是蛋白质DNA/RNA-binding 位点预测的预测,我们不仅获得了较前人较好的结果,而且预测出一些新的结合位点,有些已经被实验证实。另外,进一步对蛋白质DNA-binding 位点预测的假正结果深入分析,结果发现许多“假正”结果实际上位于DNA-binding 区或者是其它配体和蛋白的作用位点,这些结果PDB的最新注释相一致。建立部分数据库和预测算法的在线网站。(http://wlxy.imu.edu.cn/college/biostation /fuwu/index.asp)。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
农超对接模式中利益分配问题研究
基于LASSO-SVMR模型城市生活需水量的预测
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于多模态信息特征融合的犯罪预测算法研究
泡桐丛枝病发生特异相关蛋白质的亚细胞定位及功能研究
分形与统计相关方法在蛋白质亚细胞定位及功能预测中的应用
蛋白质亚核定位及其特征信息的理论研究
蛋白质共价修饰相关序列模体的计算发现