Alternative splicing event occurs frequently in various of eukaryotic genomes. It makes it possible to produce different proteins from the same gene. Thus, it is an important mechanism for expressing gene and producing proteomics diversity. The genome-wide analysis of alternative splicing has indicated that approximately half of human genes have alternative splice forms. These alternative splicing evens occur in the different tissues, different cells and different developmental stages. It is inherent in the entire life process, and is also closely related with many diseases. It is expensive and time-consuming for traditional molecular biological experiments to identify alternative splicing sites. In this project, based on our previous studies in the field of alternative splicing of genes, we will collect alternative splicing data from various of experiments. We will firstly investigate the DNA structure characteristics around alternative splicing sites by using statistical analysis, and then establish a physics model based on DNA structure parameters. Subsequently, we will use the correlation analysis and causal analysis to study the regulatory mechnism of epigenetics on alternative splicing events. Moreover, we will develop various prediction algorithms and construct efficient soft tools to accurately identify the alternative splice sites in enkaryotic genomes based on DNA structure characteristics and epigenetics information. On the basis of above studies, the regulatory roles of DNA structure and epigenetics in alternative splicing will be elucidated, which will push the study of relevant fields.
选择性剪接是一种普遍存在于真核生物中的基因调控机制。它使得一个基因序列产生不同的mRNA,编码多种蛋白质,是调节基因表达和产生蛋白质组多样性的重要机制。人类基因组中一半以上基因存在选择性剪接,而且选择性剪接存在于不同组织细胞和不同发育阶段,贯穿整个生命过程,并与疾病密切相关。利用传统的分子生物学实验方法来识别选择性剪接位点不仅昂贵,而且费时费力。本项目将在我们前期对选择性剪接事件研究的基础上,从已发布的实验验证的选择性剪接数据出发,对选择性剪接位点附近DNA的结构特征进行统计学分析,并构建调控选择性剪接的物理学模型;采用关联分析和因果分析研究表观遗传信息对选择性剪接的调控机制;进而,发展高效的机器学习方法,构建高精度的、组织细胞特异性的基因选择性剪接位点预测模型,建立一套高效简洁的识别软件。通过以上研究,力图阐明DNA的结构与表观遗传因素对选择性剪接的调控机制,推进相关领域的研究。
选择性剪接是真核生物中一种重要的基因多样性表达的调控方式,剪接异常几乎是所有细胞命运决定和身份转变的分子特征。本项目主要是利用生物信息学研究方法,重点围绕哺乳动物不同发育阶段、不同细胞类型,通过整合国际公共数据平台多组学高通量数据,依照数据集整理→差异基因与差异剪接分析→核心剪接因子识别→基于结构和表观修饰的功能→生物信息分析工具开发的研究思路展开研究,在该项目资助下,研究人员在Briefings in Bioinformatics、Molecular Therapy-Nucleic Acids等期刊发表论文9篇,其中1篇入选ESI 1%全球高被引论文,完成2项计算机软件著作权登记,主要成果概括如下: .(1)建立了小鼠着床前卵子、合子、2-细胞、4-细胞、8-细胞、桑椹胚、囊胚阶段的可变剪接的动态图谱和ZGA过程中的变化规律,证实了早期胚胎发育过程中可变剪接与基因表达同步激活的生物学现象。.(2)构建了覆盖斑马鱼MZT、原肠运动、体节发生、咽胚期、受精后2-5天共18个时序阶段的差异可变剪接事件。发现剪接因子的表达同样具有发育阶段特异性,且在MZT过程中表达量明显偏高。证实了剪接事件的包含率能够作为新的样本聚类分析参数,为斑马鱼胚胎发生过程中可变剪接的调控提供了新的理论见解。.(3)以牛的SCNT胚胎和AI胚胎的组学数据为研究对象,探索了SCNT胚胎植入期间异常基因表达和可变剪接对SCNT胚胎正常发育的影响,发现了剪接模式变化与基因表达调控协同在胚胎发育的调控过程中发挥着重要作用。剪接因子和表观遗传修饰共同介导了AS对SCNT胚胎发育的调控,为后续的植入后胚胎发育研究提供了新的理论思路。.(4)可变剪接是造成翻译后蛋白质异构体多样性及功能差异巨大的关键因素之一,开发完成了基于氨基酸字母表约化分类的蛋白质结构域分析平台Raaclogo,很好地解决了由于可变剪接翻译成不同的蛋白质异构体之间的序列保守性和功能域差异分析中存在的特征维度高和冗余性大的科学难题,该平台将为新的蛋白质合成和药物设计等合成生物学研究提供免费、用户友好性的蛋白质大数据分析服务。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
监管的非对称性、盈余管理模式选择与证监会执法效率?
基于SSVEP 直接脑控机器人方向和速度研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于表观遗传信息的可变剪接位点识别及其调控机制的研究
基于DNA序列、结构及表观遗传信息的酵母复制起始位点的预测与实验研究
SIRT1基因选择性剪接的表观遗传调控及意义
基于表观遗传和长程关联信息的人类基因组复制/转录起始位点识别与偶联机制分析