生物信息学中的序列分析相关问题研究

基本信息
批准号:61379108
项目类别:面上项目
资助金额:75.00
负责人:潘毅
学科分类:
依托单位:中南大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:李建璜,宋虹,盛羽,彭小清,丁小军,卢诚谦,兰伟,贺奕铭,黎琦
关键词:
生物信息学比对拼接序列分析
结项摘要

The development of sequencing technology and massive sequence data has provided unprecedented opportunities and challenges to the research of bioinformatics. How to exploit computer technology to solve the current problems of sequence analysis has become a major concern in national strategic needs and large-scale project needs. The project centers on the study of sequence mapping algorithm, reads assembly algorithm, multiple sequence alignment algorithm and SNP sequence associated with disease analysis algorithm based on next generation sequencing technology. Through studying the problems in short reads alignment and assembly, we find out ways to improve the performance of their algorithms using their outputs and properties of short reads. Also, multiple sequence alignment algorithms can pre-process the SNP sequence of healthy and sick people and make a solid foundation for the further analysis of the relationship between SNP and disease. The project will provide effective methods for the analysis of massive sequence data, come up with new ideas for disease diagnosis and treatment and promote the development of medical technology and the research of bioinformatics.

测序技术的发展和随之产生的海量序列数据对现代生命科学研究带来了前所未有的机遇和挑战。如何采用计算机技术解决序列分析的前沿问题成为国家重大战略需求和重大工程需求的关键任务。本项目分别研究新一代测序技术下的片段比对算法、短片段组装算法、多序列比对算法与SNP序列与疾病关联性分析算法。通过收集序列数据和其他相关生物数据,并对其数据本身进行特症挖掘,基于多序列比对的结果,在云计算平台下参考比对短片段,然后组装这些短片段,进行SNP与疾病关联分析,最后再使用实际生物数据以及反馈信息对相关算法进行验证与改进。本项目的研究将为海量序列数据的分析提供高效的计算方法,为疾病诊断与治疗的研究提供新思路。

项目摘要

在本基金的资助下,按照研究计划中的研究内容和技术路线,本项目重点研究了新一代测序技术下的序列组装算法、序列比对算法和SNP序列与疾病关联分析算法,取得的主要研究成果如下:1. 基于新一代测序技术下的双端读数提出了迭代种子扩展的拼接算法ISEA,可以获得更长和更准确的scaffolds;针对宏基因组组装计算量大的问题,提出了宏基因组组装工具框——DIME;为了定位和纠错contigs中的组装错误,我们提出了基于双端读数分布的纠错方法MEC。2. 为解决现有工具部分读数无法比对到参考基因组的问题,提出了一种基于碱基测序质量的修剪策略来确定片段中最长最可信的部分的方法 RAUR 来重新比对那些未比对上的片段。开发了甲基化可视化比对工具VAliBS,能够辅助辅助DNA甲基化研究。3. 提出了用于解决微同源缺失和微插入缺失的结构变异检测算法Sprites。此外,本项目还提出了一种新的寻找高阶SNP组合和复杂疾病关系的方法,基于能量分布的差异,能同时分析所有的SNPs。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

潘毅的其他基金

批准号:21472082
批准年份:2014
资助金额:90.00
项目类别:面上项目
批准号:21772085
批准年份:2017
资助金额:64.00
项目类别:面上项目
批准号:11704303
批准年份:2017
资助金额:24.00
项目类别:青年科学基金项目
批准号:51108389
批准年份:2011
资助金额:23.00
项目类别:青年科学基金项目
批准号:20072015
批准年份:2000
资助金额:16.00
项目类别:面上项目
批准号:51878559
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:31371034
批准年份:2013
资助金额:30.00
项目类别:面上项目
批准号:61772557
批准年份:2017
资助金额:64.00
项目类别:面上项目
批准号:51303179
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:20772056
批准年份:2007
资助金额:8.00
项目类别:面上项目
批准号:51309092
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:81173181
批准年份:2011
资助金额:57.00
项目类别:面上项目
批准号:31000462
批准年份:2010
资助金额:19.00
项目类别:青年科学基金项目

相似国自然基金

1

零和序列相关问题

批准号:10826026
批准年份:2008
负责人:庄举娟
学科分类:A0408
资助金额:3.00
项目类别:数学天元基金项目
2

时间序列分析中几种假设检验问题的研究

批准号:11571348
批准年份:2015
负责人:朱柯
学科分类:A0402
资助金额:45.00
项目类别:面上项目
3

蛋白质序列分析、结构预测和折叠动力学及其相关问题

批准号:90103031
批准年份:2001
负责人:王炜
学科分类:A2014
资助金额:67.50
项目类别:重大研究计划
4

循环平稳时间序列分析中几个重要问题的研究

批准号:69572019
批准年份:1995
负责人:张贤达
学科分类:F0111
资助金额:10.00
项目类别:面上项目