Microexon is a type of exon whose length is a multiple of 3 nucleotides with a maximum of 51 nucleotides. Microexons are often overlooked in gene annotation because the short length makes them computationally difficult to be identified. With the rapid development of RNA-sequencing technology, microexons can be identified from RNA-seq data. Two recent papers discovered hundreds of highly conserved microexons from RNA-seq data sets in different mammalian species, outlined the features regulating the inclusion of these microexons. Alternative splicing of some microexons is regulated by neuronal-specific RNA-binding proteins and modifies the function of proteins involved in neurogenesis. However, there is no systematic analysis of microexons in plants up to now. In the preliminary work, we have identified about 3,000 genes containing microexons from gene annotation in different rice species. In this analysis, microexons will be identified in each set of RNA-seq data in different tissues, developmental stages, and different growth conditions independently. The identified microexons will be classified into constitutive splicing (CS) and alternative splicing (AS), then the expression levels of microexon genes are analyzed to investigate whether they have tissue-specific, development-stage-specific or condition-specific expression and inclusion pattern, the identified AS microexons will be validated with RT-PCR. Furthermore, the conservation of microexons in different plant species will be analyzed. Finally, the protein domains and tertiary structures of microexons will be predicted to identify whether or not alternative inclusion of micro-exons alter protein–protein interactions. We will investigate the functions of 2-3 representative AS microexon genes in flag leaf with overexpression or gene inactivation technologies. This is the first time to systematically analyze the distribution, expression and potential functions of microexons in rice, which has important theoretic meaning and a bright future in rice molecular breeding.
微外显子(microexon)是指长度不超过51个碱基而且一般是3倍数的外显子,因为长度太短通常难以识别。最新文献报道人类基因组中存在数以百计的神经系统特异表达微外显子基因,它们的错误调节可引发疾病,目前植物中尚没有微外显子基因的系统研究报道。本项目通过分析多个水稻品种不同组织、不同发育时期及不同生长和胁迫条件下的转录组数据,首先识别水稻中的微外显子基因,分析组成型剪接与可变剪接微外显子是否具有组织特异性、发育时期或环境条件特异性的剪切和表达模式并进行RT-PCR实验验证,进一步探讨水稻中的微外显子基因在其它植物中的保守性。预测水稻可变剪接微外显子基因的蛋白三维结构,分析可变剪接区域能否改变蛋白相互作用,采用突变体库筛选、基因失活、超表达等实验方法研究2-3个抽穗期剑叶可变剪接微外显子基因的初步功能。本课题首次系统地研究水稻中的微外显子分布、表达及潜在功能,具有重要理论意义和广泛应用前景。
通过分析籼稻MH63和ZS97苗期和抽穗期的根、叶、穗等组织在不同条件下的转录组数据,发现~60%的微外显子在各样本中均表现为组成型剪接,其它则在不同组织和条件下表现为可变剪接。此外~54%的微外显子基因为古老基因,只有~13%的微外显子具有稻属特异性。微外显子基因在稻属中高度保守,通常具有一致结构域,在转录水平表达具有一定组织特异性。富集于核糖核苷结合功能分子功能GO类。在MH63中,>50%的微外显子与蛋白的功能结构域重叠。三倍数长度的微外显子可变剪接导致局部结构发生变化,而不改变蛋白整体的结构。但微外显子所处结构域的核心结构仍可能具有功能位点或翻译后修饰位点,而影响蛋白的功能。非三倍数长度的微外显子则可能引入终止密码子,导致基因结构和功能发生变化。.AP2/ERF基因家族是一类具有抗胁迫响应和生长调节相关的植物转录因子基因家族。水稻中该家族微外显子主要集中于AP2结构域,仅存在于陆生植物中,不同物种的AP2亚家族基因的两个AP2结构域R1和R2在系统发育树中分别聚集。对AP2结构域中的微外显子分析发现包含相同类别微外显子的AP2结构域序列也高度一致。进一步发现微外显子中存在大量同义突变,因此AP2结构域中的微外显子可能在进化上存在着纯化选择。有些微外显子存在于包括小立碗藓等多个低等植物中,而有些微外显子仅在包括拟南芥、水稻等被子植物中存在。这说明不同微外显子出现的时期不同,或是一些物种中的微外显子发生了丢失。.MIKC基因主要存在于陆生植物中,含有MADS-box结构域和K-box结构域,在陆生植物中具有重要功能。微外显子主要集中于K-box结构域中,在MADS-box结构域中几乎没有微外显子存在。K-box结构域中一般含有两个微外显子,并且串联存在于该结构域C端。K-box结构域的序列保守性较差,两个微外显子均处于K-box结构域的第三个基序中。并且含微外显子的K-box结构域的第三个基序相同,而无微外显子的K-box结构域则具有不同基序。本研究加深了对微外显子基因结构和功能的理解。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
特殊结构新型长非编码RNA的系统发掘、进化表达及潜在功能研究
TFL2基因表达谱的进化及其在水稻中的功能研究
水稻镉吸收和积累相关基因的发掘和功能鉴定
水稻渐绿型黄叶突变体grc的基因克隆及功能初步研究