生物序列分析是计算分子生物学研究的核心内容,传统的分析方法主要是以序列比对模型为主,而随着"后基因组(post-genome) "时代的到来,生物序列分析的非比对方法作为对传统方法的补充和发展已逐渐成为计算分子生物学研究中的一个热点领域。利用数理统计、组合优化等数学工具,我们将对非比对方法中的数学模型及其在基因识别、非编码序列研究、种系树构建等方面中的应用进行深入研究:在生物序列图形表示模型的研究中,提出计算上简单可行、适用于较长序列的数值特征;在概率向量表示模型的研究中,寻求更加有效的距离度量去刻画对应生物序列之间的相似程度,进一步提高生物序列分析的准确性;基于HMM模型提出新的蛋白质分类方法。我们将根据蛋白质序列中氨基酸的生物化学性质构建状态空间,使得我们可以直接使用蛋白质的一级序列进行分类;使用简化的Viterbi算法进行打分,从而可以降低算法的复杂度。
生物序列分析的非比对方法是 “后基因组(post-genome)”时代对生物序列大数据研究的一种主要方法。本项目利用数理统计、代数理论等数学工具,对非比对方法中的概率向量模型、几何表示模型及 -联体的特征分布模型在生物序列分析、种系树构建等方面的应用进行了研究。在概率向量模型的研究中,提出了修正欧式距离度量去刻画对应生物序列之间的相似程度,并通过对蛋白质序列分类和HIV-1亚型825条全基因组序列的种系树构建验证了这种距离的有效性;在生物序列图形表示模型的研究中,提出计算上简单可行、适用于较长序列的数值特征;通过对34种哺乳动物线粒体基因组序列以及40种跨膜蛋白序列的种系树构建,研究了基于生物序列 -联体的特征分布构建种系树的有效性问题。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
基于LASSO-SVMR模型城市生活需水量的预测
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究
序列比对( Alignment)的随机分析与快速算法
面向异构并行系统的生物序列比对并行策略及算法研究
基于高语义序列比对的网络攻击特征自动提取方法
大规模生物序列比对及其基于异构系统的并行处理技术研究