Currently, three interrelated questions exist in the field of genomics that need to be addressed urgently: (1), how to accurately identify splice isoforms that are produced from the same gene through alternative splicing (AS), (2), how to accurately quantify gene expression by taking into account AS; (3) how to identify associations between gene expression and diseases. These three questions result from the fact that a single multi-exon gene is able to through AS generate multiple isoforms that have different structures and carry different functions. Due to their high complexity, these isoforms are often treated as a single entity without being differentiated. In this project, the idea of utilizing the information of intron retention (IR), which is a mode of splicing, was proposed to address these questions. We will establish a multi-omic data integrative analysis approach for systematical identification of intron retention and use its information to improve gene annotation and gene expression estimation. Further, we will apply our approach to study Alzheimer’s disease (AD), aiming at discovering novel biomarkers as well as potential gene therapy targets that would be of use for drug development and the treatment of AD. The approach proposed in this project is generalizable, and is expected to be widely used in other fields such as cancer research.
基因组学领域目前存在着三个相互关联且亟需解决的重要问题: (1)如何对由同一个基因利用可变剪接机制产生的不同RNA产物进行准确鉴定; (2)如何对基因表达产物进行准确定量, (3)如何对基因产物与疾病的关联进行研究。问题的根本原因在于: 利用可变剪接,单个基因能够产生多个具有不同结构和功能的RNA。由于产物复杂,人们通常将其当作一个整体而不进行区分。然而,这三个看似简单的问题,实则尚未得到有效解决。针对这三个问题,本项目创新性地提出了从内含子保留的角度,建立多组学数据整合分析方法对其进行解析的思路。通过对基因组、转录组和蛋白组数据的整合分析,对内含子保留进行鉴定,进而提高基因产物鉴定和表达估计的精度;进一步,将内含子保留思路应用于老年痴呆症(AD)的生物标志物及基因靶标的挖掘,研究成果可望为AD药物开发和治疗带来新的思路。项目所提出的方法具有一般性,可望在其他疾病如癌症研究中得到广泛应用。
近年来研究表明内含子保留(Intron Retention, IR)与基因表达调控与复杂疾病病理机制(如癌症)存在关联。本项目针对内含子保留的组学分析相关问题展开了研究。第一,本项目提出了有效的内含子保留检测方法iREAD,其有助于提高基因产物鉴定和表达估计的精度。 与已有方法IRFinder方法相比,提出的方法具有更高的精度。第二,本项目开发了针对内含子保留分析的整合基因组、转录组和蛋白质组的多组学数据分析方法,并将其应用于阿尔茨海默症疾病(AD)的分析,具体如下:采用iREAD对人类和小鼠AD样本进行IR检测,表明IR广泛存在于人类和小鼠的大脑中;接着,通过对RNA-Seq和样本匹配的蛋白质组学数据分析,发现高水平IR与与蛋白质表达水平下调相关;结合基因组数据和IR表达数据,对IR的遗传因素进行了挖掘;构建了一个基于剪接因子的内含子调控网络,对IR与剪接因子的关联进行了挖掘,发现网络中存在与AD神经病变的严重程度相关的模块; 提出了基于差异IR分析的疾病相关基因发现流程。与仅基于外显子读数的传统差异基因表达分析相比,该流程能发现一些额外的差异表达基因,蛋白质相互作用网络和脑部特异性基因功能网络分析均表明这些基因与AD相关。综上所述,本项目针对内含子保留,提出了IR检测算法以及多组学数据整合分析方法,并从IR的角度对AD进行了系统分析,为理解IR的分子决定因素以及探索新的AD生物标志物和病理机制提供了新的思路。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
多组学数据整合分析癌症细胞生存必需基因
基于多组学数据整合的疾病基因预测方法研究
整合多组学数据的复杂性状关联分析与分子设计新方法研究
基于代谢网络的多组学数据整合研究