相对于有限的几种模式生物,非模式生物代表的类群更为广泛,所处的环境更为复杂,涉及生物系统演化的各个关键环节,因此成为进化基因组研究的绝佳材料。当前绝大多数的计算方法和数据分析平台都是针对模式生物建立起来的,在应用于非模式生物时存在诸多障碍。如何从缺乏参考序列的基因组片段中识别遗传变异尤其是结构变异,如何处理低覆盖度的测序数据,这是非模式生物进化基因组学研究中的关键难题。针对上述问题,本研究计划拟基于低覆盖度、非模式生物的高通量测序数据,重点开发遗传变异识别和基因组稀有变异检测的算法,以及进化基因学整合分析的工具,同时利用最新的并行计算技术,建立一套高度整合的进化基因组分析平台。本研究所建立的识别算法和计算平台,将有助于相关研究人员从海量的、零散的数据中挖掘出基因与表型的关系,促使人们更深入地理解非模式生物环境适应和进化的分子机制。
相对于有限的几种模式生物,非模式生物代表的类群更为广泛,所处的环境更为复杂,涉及生物系统演化的各个关键环节,因此成为进化基因组研究的绝佳材料。当前绝大多数的计算方法和数据分析平台都是针对模式生物建立起来的,在应用于非模式生物时存在诸多障碍。我们针对非模式生物进化基因学研究中的关键科学问题,开展了相应计算生物学的研究,取得了如下成果:(1)针对不同长度INDEL,针对性地识别断点信息特征模式,并引入动态评分系统,对基于多信号模型的错误及冲突信号进行辨别及取舍,因此本方法对不同大小的INDEL均具有高识别率,并可以稳定地控制假阳性率;(2)建立了复杂形式结构变异的识别工具,可以评估插入片段大小及其标准偏差、短序列质量、短序列定位的质量、支持序列的比例、覆盖度和基因组关联信息对结构变异预测可靠性的影响,并通过扫描短序列在参考基因组上的比对结果,确定结构变异发生的热点区域;(3)基于上述断点特征,建立了不依赖于参考基因组注释信息的环形RNA识别新算法(CIRI)。针对环形RNA结构特点,利用环形RNA测序数据与基因组比对时产生的成对交叉剪切信号,建立了高效、无偏差的识别工具;(4)建立了基于非拼接策略的基因预测及变异识别的算法工具,可以有效规避非模式生物基因组拼接的难题,从非拼接的短序列或片段化的拼接序列中,准确识别编码基因及其变异位点;(5)利用上述工具和算法,对褐藻及其17个株系进行了测序拼接、基因预测和遗传变异识别,此外还应用到非模式生物纤毛虫的系统发育基因组学研究中。在研期间,在基因组学和生物信息学刊物上发表论文4篇(Nucleic Acids Res 1篇,Genome Biology 1篇,BMC Genomics 1篇,Protein&Cell 1篇),已投稿论文2篇。
{{i.achievement_title}}
数据更新时间:2023-05-31
监管的非对称性、盈余管理模式选择与证监会执法效率?
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
低轨卫星通信信道分配策略
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
疏勒河源高寒草甸土壤微生物生物量碳氮变化特征
基因组水平计算进化方法的研究和应用
极端微生物宏基因组微进化的计算生物学研究
遗传变异与选择对基因组编码区与非编码区作用模式的比较
植物胚乳印迹基因的比较和进化基因组学研究以及计算生物学预测