基于图论方法的DNA序列编码研究

基本信息
批准号:61672051
项目类别:面上项目
资助金额:32.00
负责人:朱恩强
学科分类:
依托单位:北京大学
批准年份:2016
结题年份:2018
起止时间:2017-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:李菲,李泽鹏,郭亦鸿,罗川,麻晶晶,杨扬,蒋飞,刘小青,王宏宇
关键词:
约束条件图论优化算法DNA计算码字设计
结项摘要

DNA sequence encoding and design are critical to genetic engineering, especially to the development of bio-computer. Restricted by specific hybridization and the melting temperature, particularly by the contradiction of short length of DNA strands and simultaneously large number of encoded sequences, DNA encoding problem turns out to be NP-complete. This problem calls for finding largest sets of single DNA strands that do not crosshybridize to themselves or to their complements, which can be formulated as a combinatorial optimization problem. As a consequence, this project will combine the encoding problem with techniques in graph theory, including maximum independent set, graph coloring, graph connectivity, and so on, aiming at establishing a set of accurate DNA encoding system. Specifically, this research will be carried out from the following 4 aspects: (1) propose a new method, called hybridization distance, for measuring the similarity between two DNA sequences; (2) transform the DNA encoding problem into maximum independent set problem to find largest sets of DNA strands under various constraints; (3) design the algorithm of DNA encoding based on five DNA kinds of constraints, viz., the length of DNA strands, GC content, hybridization distance, Tm value and specific hybridization; (4) realize the encoding algorithm by designing corresponding softwares, and show the applications of the encoding designed.

在基因工程,特别是生物计算机的研制过程中,DNA编码理论和设计方法是关键。特异性杂交和解链温度,特别是链短且编码序列多这一矛盾的需求,使得DNA编码设计非常困难,并已被证明是NP-完全的问题。编码问题旨在寻找满足不与自身或其补序列互相交叉杂交的最大的DNA单链的集合,可以描述成一个组合优化问题。 因此,本项目拟有机地将DNA编码与图论方法,包括图的独立集理论,图着色理论,图的连通性理论等结合,力争建立一套完整的精准的DNA编码体系。本项目的研究内容主要分为以下4个方面: (1) 提出杂交距离的方法用来衡量DNA序列之间的相似度;(2) 将编码问题转化成图的独立集问题来寻找满足不同约束条件下的最大编码集合;(3) 设计在编码长度,GC含量,杂交距离,值和特异性杂交这五种约束条件下的DNA编码方法;(4) 研发编码相应的软件并给出应用。

项目摘要

DNA编码设计在生物计算机的研制过程中至关重要。在实际设计中,DNA编码会受到多种因素的影响和制约,如特异性杂交、解链温度、链短且编码序列多等,从而使得DNA编码非常困难,该问题已被证明是NP-完全的。编码问题旨在寻找满足不与自身或其补序列互相交叉杂交的最大的DNA单链的集合,可以描述成一个组合优化问题。 为此,本项目通过研究图的独立集,图的邻点着色和无圈着色以及图的连通性等多种组合优化问题,得到用于求解DNA编码问题的若干算法和理论。此研究为进一步建立完整的DNA编码体系提供了理论依据和指导。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
2

滚动直线导轨副静刚度试验装置设计

滚动直线导轨副静刚度试验装置设计

DOI:
发表时间:2017
3

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
4

物联网中区块链技术的应用与挑战

物联网中区块链技术的应用与挑战

DOI:10.3969/j.issn.0255-8297.2020.01.002
发表时间:2020
5

An improved extraction method reveals varied DNA content in different parts of the shells of Pacific oysters

An improved extraction method reveals varied DNA content in different parts of the shells of Pacific oysters

DOI:10.1051/alr/2019003
发表时间:2019

朱恩强的其他基金

批准号:61872101
批准年份:2018
资助金额:62.00
项目类别:面上项目

相似国自然基金

1

DNA计算中编码序列集合设计

批准号:30870573
批准年份:2008
负责人:张强
学科分类:C2105
资助金额:32.00
项目类别:面上项目
2

基于特征和方法的编码与序列设计

批准号:11771007
批准年份:2017
负责人:曹喜望
学科分类:A0608
资助金额:48.00
项目类别:面上项目
3

DNA序列的高维空间数字编码与DNA计算研究

批准号:60171040
批准年份:2001
负责人:陈惟昌
学科分类:F0124
资助金额:18.00
项目类别:面上项目
4

DNA计算在图论中的应用

批准号:10471081
批准年份:2004
负责人:王世英
学科分类:A0409
资助金额:18.00
项目类别:面上项目