基于高通量RNA-seq数据转录组拼接的关键技术与算法研究

基本信息

批准号：61432010

项目类别：重点项目

资助金额：280.00

负责人：李国君

学科分类：

依托单位：山东大学

批准年份：2014

结题年份：2019

起止时间：2015-01-01 - 2019-12-31

项目状态：已结题

项目参与者：高琳,栾贻会,刘丙强,覃桂敏,吴吉昌,贾松卫,柳军涛,Russell Luther Malmberg,Xiuzhen Huang

关键词：

组合最优化癌症研究转录组拼接转录组测序算法

结项摘要

The complex diseases such as cancer are in close relation to alternative splicing in the process of transcription, thus the identification of types, specificity and the expression level of transcription products is especially important to cancer mechanism research and clinical diagnosis. High-throughput RNA-seq technology has provided an unprecedented opportunity to reveal the very complex structures of a eukaryote’s transcriptomic landscape. However, it represents a highly challenging task to accurately and efficiently assemble the huge amount of short RNA-seq reads into transcriptome with alternative transcripts. To solve these key computing problems described above, our project will develop a new assembly technology, which combines the interval graph model and converts the assembly problems into combinatorial optimization problems. Focusing on the characteristics of high throughput sequencing data and the algorithmic obstacles caused by alternative splicing, we will develop a new algorithm to greatly increase the accuracy, reduce the time and space complexity, thus overcoming the deficiency of current assembly algorithms. The new algorithm will be applied to predict transcriptomes for RNA-seq data from specific cancer tissues. The difference analysis on transcriptomes, combining with traditional microarray study, will benefit the prediction of oncogenes. In addition, the existed cancer related signaling pathways and metabolic pathways will be involved to analyze the differential expression at transcription level, aiming at exploring the essential mechanism of cancer development.

研究表明癌症等复杂疾病与转录过程中的可变剪接密切相关，因此认知转录产物的种类、特异性及表达量对于癌症机理研究及临床诊断具有重要意义。高通量的RNA-seq测序技术为揭示和研究真核生物转录组的复杂结构提供了前所未有的机遇。然而如何准确有效地将海量测序片段组装成完整的转录组成为目前面临的一个重要挑战。本项目针对基于RNA-seq的转录组拼接问题，利用图论技术将问题模型化，进而将转录组拼接归结为经典的组合最优化问题；通过系统研究相关理论问题，针对海量数据的特征、可变剪接带来的障碍，设计高效准确的算法，解决拼接问题的计算瓶颈；在准确预测转录组的基础上，将算法应用于癌症相关的RNA-seq数据，结合传统的基于基因表达芯片的研究，筛选与特定癌症紧密相关的特定基因，并利用信号传导通路和代谢通路信息进行综合分析，寻找致病基因在转录体水平上差异表达的原因，更加深入的揭示癌症的发生规律和进化机理。

项目摘要

研究表明癌症等复杂疾病与转录过程中的可变剪接密切相关，因此认知转录产物的种类、特异性及表达量对于癌症机理研究及临床诊断具有重要意义。高通量的RNA-seq测序技术为揭示和研究真核生物转录组的复杂结构提供了前所未有的机遇。然而如何准确有效地将海量测序片段组装成完整的转录组成为目前面临的一个重要挑战。本项目针对基于RNA-seq的转录组拼接问题，利用图论技术将问题模型化，进而将转录组拼接归结为经典的组合最优化问题；通过系统研究相关理论问题，针对海量数据的特征、可变剪接带来的障碍，设计高效准确的算法，解决拼接问题的计算瓶颈；在准确预测转录组的基础上，将算法应用于癌症相关的 RNA-seq 数据，结合传统的基于基因表达芯片的研究，筛选与特定癌症紧密相关的特定基因，并利用信号传导通路和代谢通路信息进行综合分析，寻找致病基因在转录体水平上差异表达的原因，更加深入的揭示癌症的发生规律和进化机理。本项目突破了几个经典的转录组拼接算法的计算瓶颈，发表高质量的学术论文70余篇，并研发了相应的算法软件和网络服务平台。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：2016

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

DOI：10.19328/j.cnki.2096-8655.2022.02.002

发表时间：2022

李国君的其他基金

批准号：81273108

批准年份：2012

资助金额：16.00

项目类别：面上项目

批准号：19401027

批准年份：1994

资助金额：2.60

项目类别：青年科学基金项目

批准号：60873207

批准年份：2008

资助金额：35.00

项目类别：面上项目

批准号：19971053

批准年份：1999

资助金额：8.00

项目类别：面上项目

批准号：81373028

批准年份：2013

资助金额：70.00

项目类别：面上项目

批准号：10271065

批准年份：2002

资助金额：10.50

项目类别：面上项目

批准号：61771009

批准年份：2017

资助金额：50.00

项目类别：面上项目

批准号：60673059

批准年份：2006

资助金额：27.00

项目类别：面上项目

批准号：51776172

批准年份：2017

资助金额：62.00

项目类别：面上项目

批准号：50476052

批准年份：2004

资助金额：23.00

项目类别：面上项目

批准号：31571354

批准年份：2015

资助金额：25.00

项目类别：面上项目

批准号：30000140

批准年份：2000

资助金额：15.00

项目类别：青年科学基金项目

批准号：60373025

批准年份：2003

资助金额：18.00

项目类别：面上项目

批准号：51076126

批准年份：2010

资助金额：35.00

项目类别：面上项目

批准号：61272016

批准年份：2012

资助金额：60.00

项目类别：面上项目

批准号：61070095

批准年份：2010

资助金额：38.00

项目类别：面上项目

相似国自然基金

基于参考基因组的转录组拼接算法研究及其在癌症中的应用

批准号：61801265

批准年份：2018

负责人：柳军涛

学科分类：F0124

资助金额：25.00

项目类别：青年科学基金项目

仅基于RNA-Seq数据拼装可变剪接转录组的计算方法研究

批准号：61272016

批准年份：2012

负责人：李国君

学科分类：F0213

资助金额：60.00

项目类别：面上项目

基于新一代测序数据的全基因组拼接组装算法研究

批准号：61173085

批准年份：2011

负责人：王亚东

学科分类：F0213

资助金额：55.00

项目类别：面上项目

基于双向聚类算法的高通量组学数据融合方法研究

批准号：61103167

批准年份：2011

负责人：宁康

学科分类：F0213

资助金额：21.00

项目类别：青年科学基金项目

基于高通量RNA-seq数据转录组拼接的关键技术与算法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

一种基于多层设计空间缩减策略的近似高维优化方法

基于MCPF算法的列车组合定位应用研究

新型树启发式搜索算法的机器人路径规划

"多对多"模式下GEO卫星在轨加注任务规划

李国君的其他基金

基于秀丽隐杆线虫模型的化学品急性毒性快速筛检及毒性评价体系研究

图论中的禁用子图与圈形结构

基于串线的3-维蛋白结构预测的新技术研究

图的连通因子与正交因子分解问题及其算法研究

抑制素蛋白Prohibitin 1在锰致脉络丛上皮细胞周期阻滞效应中的分子调控机制及对多巴胺神经元的影响

图论与组合技术在理论计算机科学中的应用

基于de bruijn graph梳理的宏基因组拼接算法开发

DNA数据挖掘中的组合理论与算法设计

固体氧化物燃料电池电极微观结构内的多物理场耦合效应及多目标优化研究

轴流式叶轮机械叶栅端部复合成型技术的机理研究

癌症基因组中关键驱动突变信号通路的理论问题研究及算法设计

帕金森氏病的环境致病机制的研究--锰致线粒体的损伤

近似算法的设计与分析

两相非定常空化空泡时空演化机理及其对高效离心泵水动力特性影响的研究

仅基于RNA-Seq数据拼装可变剪接转录组的计算方法研究

原核生物转录因子结合位点的算法预测及应用

相似国自然基金