基于高通量RNA-seq数据转录组拼接的关键技术与算法研究

基本信息
批准号:61432010
项目类别:重点项目
资助金额:280.00
负责人:李国君
学科分类:
依托单位:山东大学
批准年份:2014
结题年份:2019
起止时间:2015-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:高琳,栾贻会,刘丙强,覃桂敏,吴吉昌,贾松卫,柳军涛,Russell Luther Malmberg,Xiuzhen Huang
关键词:
组合最优化癌症研究转录组拼接转录组测序算法
结项摘要

The complex diseases such as cancer are in close relation to alternative splicing in the process of transcription, thus the identification of types, specificity and the expression level of transcription products is especially important to cancer mechanism research and clinical diagnosis. High-throughput RNA-seq technology has provided an unprecedented opportunity to reveal the very complex structures of a eukaryote’s transcriptomic landscape. However, it represents a highly challenging task to accurately and efficiently assemble the huge amount of short RNA-seq reads into transcriptome with alternative transcripts. To solve these key computing problems described above, our project will develop a new assembly technology, which combines the interval graph model and converts the assembly problems into combinatorial optimization problems. Focusing on the characteristics of high throughput sequencing data and the algorithmic obstacles caused by alternative splicing, we will develop a new algorithm to greatly increase the accuracy, reduce the time and space complexity, thus overcoming the deficiency of current assembly algorithms. The new algorithm will be applied to predict transcriptomes for RNA-seq data from specific cancer tissues. The difference analysis on transcriptomes, combining with traditional microarray study, will benefit the prediction of oncogenes. In addition, the existed cancer related signaling pathways and metabolic pathways will be involved to analyze the differential expression at transcription level, aiming at exploring the essential mechanism of cancer development.

研究表明癌症等复杂疾病与转录过程中的可变剪接密切相关,因此认知转录产物的种类、特异性及表达量对于癌症机理研究及临床诊断具有重要意义。高通量的RNA-seq测序技术为揭示和研究真核生物转录组的复杂结构提供了前所未有的机遇。然而如何准确有效地将海量测序片段组装成完整的转录组成为目前面临的一个重要挑战。本项目针对基于RNA-seq的转录组拼接问题,利用图论技术将问题模型化,进而将转录组拼接归结为经典的组合最优化问题;通过系统研究相关理论问题,针对海量数据的特征、可变剪接带来的障碍,设计高效准确的算法,解决拼接问题的计算瓶颈;在准确预测转录组的基础上,将算法应用于癌症相关的RNA-seq数据,结合传统的基于基因表达芯片的研究,筛选与特定癌症紧密相关的特定基因,并利用信号传导通路和代谢通路信息进行综合分析,寻找致病基因在转录体水平上差异表达的原因,更加深入的揭示癌症的发生规律和进化机理。

项目摘要

研究表明癌症等复杂疾病与转录过程中的可变剪接密切相关,因此认知转录产物的种类、特异性及表达量对于癌症机理研究及临床诊断具有重要意义。高通量的RNA-seq测序技术为揭示和研究真核生物转录组的复杂结构提供了前所未有的机遇。然而如何准确有效地将海量测序片段组装成完整的转录组成为目前面临的一个重要挑战。本项目针对基于RNA-seq的转录组拼接问题,利用图论技术将问题模型化,进而将转录组拼接归结为经典的组合最优化问题;通过系统研究相关理论问题,针对海量数据的特征、可变剪接带来的障碍,设计高效准确的算法,解决拼接问题的计算瓶颈;在准确预测转录组的基础上,将算法应用于癌症相关的 RNA-seq 数据,结合传统的基于基因表达芯片的研究,筛选与特定癌症紧密相关的特定基因,并利用信号传导通路和代谢通路信息进行综合分析,寻找致病基因在转录体水平上差异表达的原因,更加深入的揭示癌症的发生规律和进化机理。本项目突破了几个经典的转录组拼接算法的计算瓶颈,发表高质量的学术论文70余篇,并研发了相应的算法软件和网络服务平台。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
2

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015
3

转录组与代谢联合解析红花槭叶片中青素苷变化机制

转录组与代谢联合解析红花槭叶片中青素苷变化机制

DOI:
发表时间:
4

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018
5

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022

李国君的其他基金

批准号:81273108
批准年份:2012
资助金额:16.00
项目类别:面上项目
批准号:19401027
批准年份:1994
资助金额:2.60
项目类别:青年科学基金项目
批准号:60873207
批准年份:2008
资助金额:35.00
项目类别:面上项目
批准号:19971053
批准年份:1999
资助金额:8.00
项目类别:面上项目
批准号:81373028
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:10271065
批准年份:2002
资助金额:10.50
项目类别:面上项目
批准号:61771009
批准年份:2017
资助金额:50.00
项目类别:面上项目
批准号:60673059
批准年份:2006
资助金额:27.00
项目类别:面上项目
批准号:51776172
批准年份:2017
资助金额:62.00
项目类别:面上项目
批准号:50476052
批准年份:2004
资助金额:23.00
项目类别:面上项目
批准号:31571354
批准年份:2015
资助金额:25.00
项目类别:面上项目
批准号:30000140
批准年份:2000
资助金额:15.00
项目类别:青年科学基金项目
批准号:60373025
批准年份:2003
资助金额:18.00
项目类别:面上项目
批准号:51076126
批准年份:2010
资助金额:35.00
项目类别:面上项目
批准号:61272016
批准年份:2012
资助金额:60.00
项目类别:面上项目
批准号:61070095
批准年份:2010
资助金额:38.00
项目类别:面上项目

相似国自然基金

1

基于参考基因组的转录组拼接算法研究及其在癌症中的应用

批准号:61801265
批准年份:2018
负责人:柳军涛
学科分类:F0124
资助金额:25.00
项目类别:青年科学基金项目
2

仅基于RNA-Seq数据拼装可变剪接转录组的计算方法研究

批准号:61272016
批准年份:2012
负责人:李国君
学科分类:F0213
资助金额:60.00
项目类别:面上项目
3

基于新一代测序数据的全基因组拼接组装算法研究

批准号:61173085
批准年份:2011
负责人:王亚东
学科分类:F0213
资助金额:55.00
项目类别:面上项目
4

基于双向聚类算法的高通量组学数据融合方法研究

批准号:61103167
批准年份:2011
负责人:宁康
学科分类:F0213
资助金额:21.00
项目类别:青年科学基金项目