基于下一代测序技术的重复基因结构及拷贝数目变异与癌症关联性研究

基本信息
批准号:61501392
项目类别:青年科学基金项目
资助金额:19.00
负责人:连帅彬
学科分类:
依托单位:信阳师范学院
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:王鹏,张晓丽,钟莉娟,范春凤,马东东,马文娟,董群华
关键词:
重复基因序列查找基因组装拷贝数目变异检测下一代基因测序技术关联性研究
结项摘要

It is urgent to research and design the accurate algorithms of assembling repetitive genomes and detecting copy number variations (CNVs) for bioinformatics, what’s more, the associations with cancers are still primary. Fortunately, due to the fast development of next generation sequencing technologies, it is possible to detect repetitive genomes and copy number variations and to analyze their associations with cancer in whole genome scale. Consequently, the combinations of multi-disciplinary approaches will be used in this project to integrate and analyze the biomedical sequencing data. The main research contents are including: 1) the methods likely signal filtering will be used in genome assembly process to filter out the sequencing biases and to improve the confidence of assembling repetitive genomes; 2) several methods of estimating depth will be combined to improve the correctness of detecting break locus and the accuracy of estimating copy numbers of small CNVs (<500bp); 3) the expression information and corresponding variant genomes will be integrated to build the dynamic network structures, and then to perform cluster analysis and compute state transition probability by using Hidden Markov Model(HMM), and then statistical test of the associations between cancers and variant genomes will be performed, finally biological experiments are used to verify the results. As a whole, the results presented in this project will establish a good foundation for further researches, such as pathogenic mechanism, drugs developments, and etc, which will benefit self-physiology and health of human beings.

研究设计精确的重复基因组装算法与拷贝数目变异(CNVs)检测算法依然是生物信息学亟待解决的科学问题,并且与癌症之间的关联性研究尚处于初级阶段。下一代测序技术的快速发展使得可以在全基因组范围内检测重复基因序列及CNVs并分析其与癌症之间的关联性。基于此,本项目拟采用多学科方法整合分析下一代生物医学测序数据。主要研究内容:1)在基因组装过程中,拟采用信号滤波等方法消除测序数据中的覆盖偏差,提高组装重复基因序列的置信度和正确率;2)拟整合多种深度估计方法(贝叶斯估计、最大似然估计)等,提高小CNVs(<500bp)的断点检测正确率与拷贝数估计精度;3)拟结合基因表达量信息,构建变异基因与表达量之间网络结构,进行聚类分析,引入隐马尔科夫模型,计算状态转移概率,统计分析变异基因与癌变的关联性,并进行生物实验加以验证。本项目研究为进一步研究致病机理、药物开发等诸多惠及人类自身生理与健康等问题奠定基础。

项目摘要

癌症是一种负责的基因组系统疾病。在细胞癌变机制中,RNA代谢的改变正变得越来越重要。RNA结合蛋白参与整个转录后调控的所有步骤,决定了细胞内每个转录本的命运和功能。同时基因的邻近关系也严重影响着基因的功能,相邻基因更易于共表达、组织特异性基因更容易趋于聚类等。因此,本项目重点开展了:(1)邻近基因的特性分析,包括空间相邻,进化相邻以及线性相邻基因对的表达特性、修饰特性以及转录调控特性;(2)重复基因序列查找算法设计与分析;(3)RBP基因在20种癌症中的差异表达分析,包括差异表达RBP与临床TMN信息的关联性,共表达调控网络构建等;(4)设计了多款基因表达量网络聚类分析算法。基于本项目的主要研究成果包括:(1)邻近基因对更容易具有共表达、共调控及共修饰,同时空间相邻可以有效增强线性相邻和进化相邻基因对的共表达、共修饰及共调控强度。而且共位置基因更容易具有相似特性,适当的组合基因的共位置信息可以有效的增强基因的相似共性;(2)研究发现RBP基因在20种癌症中的表达谱与非RBP基因具有显著差异,同时上下调RBP基因在20种癌症中的具有明显的反向表达,此外分析了显著差异RBP基因与癌症临床分类TNM信息的关联性;(3)从头重复基因查找算法可以精确而快速的以从参考基因组中查找到设定长度的重复基因序列,为重复基因序列的查找提供了一个较好的算法;(4)时频信号的频谱及变换分析为基因表达及聚类算法设计提供较好的借鉴。这些研究成果,首先对于理解基因在染色体上的位置关系与基因表达特性、调控特性以及修饰特性的理论提供了理论支持,同时为理解基因邻域关系如何影响基因交互及功能提供另外一个视角。其次,RBP在20种癌症中的表达差异性分析结果为理解RBP基因在癌症中的表达谱以及其在人类癌症中扮演的角色提供了理论支持。最后,重复基因查找算法及基因表达网络聚类算法的设计为精确查找重复基因及分析差异基因共表达网络聚类提供了重要的生物信息算法,为后续的其他研究提供了技术支持。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018
5

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

DOI:
发表时间:2020

连帅彬的其他基金

相似国自然基金

1

基于家系基因组测序数据的拷贝数变异检测方法研究

批准号:31701147
批准年份:2017
负责人:刘永壮
学科分类:C0608
资助金额:21.00
项目类别:青年科学基金项目
2

面向新一代测序的癌症拷贝数异常检测及其关键变异的计算发现研究

批准号:61571414
批准年份:2015
负责人:李骜
学科分类:F0124
资助金额:60.00
项目类别:面上项目
3

面向测序技术的外显子组拷贝数变异检测算法研究与应用

批准号:31301092
批准年份:2013
负责人:林勇
学科分类:C0608
资助金额:23.00
项目类别:青年科学基金项目
4

癌症体细胞拷贝数变异功能模式的鉴定方法与应用研究

批准号:61201312
批准年份:2012
负责人:袁细国
学科分类:F0124
资助金额:25.00
项目类别:青年科学基金项目