新一代测序技术下单体型组装问题计算模型和算法研究

基本信息
批准号:61070145
项目类别:面上项目
资助金额:32.00
负责人:谢民主
学科分类:
依托单位:湖南师范大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:姜涛,余慧敏,罗轶,刘新求,欧阳章东,王萌,杨韫饴
关键词:
单体型NPSNP参数计算
结项摘要

单体型在复杂疾病致病基因定位等领域有重要的应用,而直接测定单体型代价过分昂贵,因此利用DNA片段数据组装出单体型的计算问题深受研究,已有多个计算模型。这些模型绝大多数是NP-难及APX-难的,已有启发式算法的验证实验均隐含着一个片段覆盖单体型的大部分区域,已有精确算法则受片段覆盖深度不能太大的约束。目前开始使用的新一代测序技术存在着能直接测序的片段较短、测序误差较大和覆盖深度大的特点,因此已有模型和算法的有效性受到了挑战。本项目将深入分析新一代测序技术产生数据的特征,结合分子遗传学规律提出适用新一代测序技术的具有更高单体型重建精度的计算模型,对目前研究的单体型组装问题进行扩展,使之适应病毒群需要组装出多个单体型的场合。进而利用参数计算、图论算法和聚类分析等技术,寻求实用有效算法。本项目的开展将进一步激发单体型计算模型及算法研究,有力地促进单体型检测及其应用。

项目摘要

在本基金的支持下,课题组在新一代测序技术下单体型组装计算问题组合优化模型的构建、高效算法的设计与分析上取得了显著的进展。通过对单体型组装问题相关真实生物数据的整合和数据特征的抽取,课题组完成了模拟数据生成器的设计和测试平台的建设;结合图论和聚类分析等技术提出了一个新的平衡优化划分单体型组装模型;课题组根据单体型组装的实质是利用片段包含的两个杂合SNP位点之间的组合模式来组装一条染色体上较大区域的SNP序列,把片段数据转化成两位点连锁图,提出了新的连锁图标签优化单体型组装模型。这些新的单体型模型比已有的模型在单体型重建精度上有明显的改善。通过对新一代测序技术下真实生物数据特征的挖掘,课题组发现了测序片段数据具有一些小参数特征:一个片段覆盖的杂合SNP位点和覆盖一个SNP位点的片段数通常都比较小;进而利用参数计算理论,为多个NP-难的单体型组装优化模型设计了快速的参数化动态规划精确算法。动态规划递推过程中要保留的中间计算结果的多少是影响动态规划算法时空复杂度的决定因素,课题组通过大量的测试发现只保留一部分较优的中间结果能大大加快算法的速度,而对最终计算结果没有显著影响。为了进一步加快单体型的重建,课题组为单体型组装设计了基于top-k个中间最优解的启发式动态规划算法。项目促进了单体型计算模型及算法研究,项目的研究成果为生物信息学中大量复杂的计算问题的实用算法设计提供了新思路,也将促进单体型在复杂疾病全基因关联分析中的应用。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
2

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
3

气载放射性碘采样测量方法研究进展

气载放射性碘采样测量方法研究进展

DOI:
发表时间:2020
4

五轴联动机床几何误差一次装卡测量方法

五轴联动机床几何误差一次装卡测量方法

DOI:
发表时间:
5

适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理

适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理

DOI:10.19783/j.cnki.pspc.200521
发表时间:2021

谢民主的其他基金

批准号:61772197
批准年份:2017
资助金额:63.00
项目类别:面上项目
批准号:61370172
批准年份:2013
资助金额:73.00
项目类别:面上项目

相似国自然基金

1

基于新一代测序技术的K单体型组装算法研究

批准号:61363035
批准年份:2013
负责人:吴璟莉
学科分类:F0213
资助金额:45.00
项目类别:地区科学基金项目
2

新一代测序技术宏基因组数据分析的统计算法研究与应用

批准号:61370131
批准年份:2013
负责人:艾冬梅
学科分类:F0213
资助金额:73.00
项目类别:面上项目
3

基于新一代测序数据的全基因组拼接组装算法研究

批准号:61173085
批准年份:2011
负责人:王亚东
学科分类:F0213
资助金额:55.00
项目类别:面上项目
4

单体型问题及其算法研究

批准号:60970085
批准年份:2009
负责人:徐云
学科分类:F0213
资助金额:30.00
项目类别:面上项目