伴随新一代高通量低成本测序技术的发展,其生成的超大通量短测序片段拼接技术成为目前测序生物信息学研究的最前沿热点问题。在本申请书中,我们首次提出了基于色域空间(color space)编码技术的超大通量短序列拼接技术思路和技术平台建设。在传统的序列拼接算法基础上,提出了基于高覆盖率测序结果的质量优先无错拼接的算法构想,并完成了初步的准备工作。针对新一代测序平台提供的mate pair信息,我们首次提出了利用mate pair信息校正和提高拼接质量的算法构想。同时,考虑到多种测序技术的联合应用问题,研发一套统一格式的测序数据联合分析系统,以解决不同测序技术平台产生数据格式相互无法移植交流的问题。为解决传统拼接比对算法对高性能计算硬件的依赖,我们提出了基于FPGA定制算法硬件加速模块的构想,可以在节约硬件投资的前提下提高计算效率数百倍。
{{i.achievement_title}}
数据更新时间:2023-05-31
DNAgenie: accurate prediction of DNA-type-specific binding residues in protein sequences
Wearable Electrocardiogram Quality Assessment Using Wavelet Scattering and LSTM
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
神经退行性疾病发病机制的研究进展
混凝土SHPB试验技术研究进展
BAC克隆高通量测序及短序列拼接方法的研究
基于多参考基因组的高通量测序片段映射方法研究
增加高通量DNA测序阅读长度方法研究
荧光组合编码的高通量DNA连接测序方法研究