基于新一代测序数据的全基因组拼接组装算法研究

基本信息
批准号:61173085
项目类别:面上项目
资助金额:55.00
负责人:王亚东
学科分类:
依托单位:哈尔滨工业大学
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:朱晓,姜玥,刘永壮,姜虹旭,权威,曾培龙,国宏哲
关键词:
新一代测序数据全基因组拼接组装reads引导
结项摘要

近几年,新一代测序技术对基因组科学的研究产生了深远影响,尤其是基于新一代测序技术的基因组从头测序已经成为研究热点。一般而言,测序新物种产生2-20亿条reads的海量短序列(相当于20-200 GB的数据量),对从头测序的全基因组拼接组装提出了严峻的挑战。因此,发展短序列拼接组装算法生成全基因组序列是从头测序面临的巨大挑战!.本项目拟结合新一代测序数据的碱基出错特征,优化配对数据,设计分批的数据处理策略,提出基于拼接信息累计与数据特征相结合的评分方法,并进一步提出reads引导的短序列拼接的核心算法,最后采用GC含量校正拼接结果中重复段的拷贝数,从而发展快速、高精度的全基因组短序列拼接组装算法,建立拼接组装系统。本项目的完成将使我国在基因组从头测序的理论与实践方面上一新台阶。

项目摘要

在本项目的资助下,项目负责人及团队系统研究了基于高通量测序数据的基因组拼接方法,提出了基于支持向量机的分叉处理方法、基于向前查看策略的分叉处理方法,并在这两种方法的基础上,结合配对数据提出了基于多重启发式的配对数据引导的拼接方法。并且,针对拼接结果中的拼接错误,提出了基于参考序列和配对数据的拼接错误识别方法。相应的论文分别发表在BMC Bioinformatics、PLoS ONE等期刊上。. 此外,我们还研究了与高通量测序数据相关的结构变异检测方法、蛋白质多序列比对方法、基因组可视化、de novo突变检测、以及高错误率测序片段比对算法,取得了较好的研究成果,相关论文发表在《Bioinformatics》、《Nucleic Acids Research》等期刊上。. 在本项目的支持下,课题组共发表已标注基金号的SCI论文19篇,开发了2套基因组拼接软件,1套结构变异检测软件,1套蛋白质多序列比对软件,1套个人基因组浏览器,1套高错误率测序片段比对工具。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于全模式全聚焦方法的裂纹超声成像定量检测

基于全模式全聚焦方法的裂纹超声成像定量检测

DOI:10.19650/j.cnki.cjsi.J2007019
发表时间:2021
3

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
4

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
5

混采地震数据高效高精度分离处理方法研究进展

混采地震数据高效高精度分离处理方法研究进展

DOI:10.3969/j.issn.1000-1441.2020.05.004
发表时间:2020

王亚东的其他基金

批准号:41601007
批准年份:2016
资助金额:22.00
项目类别:青年科学基金项目
批准号:69975005
批准年份:1999
资助金额:12.00
项目类别:面上项目
批准号:60671013
批准年份:2006
资助金额:29.00
项目类别:面上项目
批准号:U1404815
批准年份:2014
资助金额:30.00
项目类别:联合基金项目
批准号:60973078
批准年份:2009
资助金额:29.00
项目类别:面上项目
批准号:60273083
批准年份:2002
资助金额:22.00
项目类别:面上项目

相似国自然基金

1

基于新一代测序技术的K单体型组装算法研究

批准号:61363035
批准年份:2013
负责人:吴璟莉
学科分类:F0213
资助金额:45.00
项目类别:地区科学基金项目
2

基于低深度测序数据的全基因组关联研究

批准号:31900487
批准年份:2019
负责人:刘斯洋
学科分类:C0608
资助金额:25.00
项目类别:青年科学基金项目
3

新一代测序技术宏基因组数据分析的统计算法研究与应用

批准号:61370131
批准年份:2013
负责人:艾冬梅
学科分类:F0213
资助金额:73.00
项目类别:面上项目
4

基于新一代测序数据的泛癌miRNA调控模块发现算法研究

批准号:61602283
批准年份:2016
负责人:梁成
学科分类:F0213
资助金额:20.00
项目类别:青年科学基金项目