Protein-RNA interactions widely exist in a variety of biological processes such as posttranscriptional regulation of gene expression. Therefore, investigating protein-RNA interactions is of pivotal importance. The project presented here tries to comprehensively apply bioinfromatics and machine learning methods to develop prediction models for binding domains of protein-RNA interactions,based on the protein-RNA complexes from PDB database as the training dataset, and the properties such as protein domain and RNA secondary structure and physico-chemical parameters as the features. Then, we will also develop a web server for genome-wide prediction of protein-RNA ineractions based on domains. Finally, the project will provide bioinformatics support for studying protein-RNA interactions.
蛋白质-RNA相互作用广泛存在于转录后基因表达调控等多种生物过程之中,因此,开展蛋白质-RNA相互作用研究具有重要意义。为此,本项目拟以PDB数据库提供的蛋白质-RNA相互作用数据为基础,以蛋白质结构域、RNA二级结构、结合能以及其它各项理化性质等特征为变量,综合运用生物信息学与机器学习等方法,构建基于结构域的蛋白质-RNA相互作用预测模型,并开发相应的在线预测平台,最终为蛋白质-RNA相互作用研究提供生物信息学支持。
在该项目资助下,我们首先从PDB数据库中构建了数据集RPI3761,该数据集含有3761个蛋白质-RNA相互作用对和通过随机抽样方法生成的阴性样本数据集。然后运用rnafold等生物信息学软件提取特征,并运用深度学习方法构建了蛋白质-RNA相互作用预测模型DPRPI。另外,我们采用十倍交叉验证策略,在3个公开数据集RPI2241、RPI369和RPI12737上进行模型性能评价,结果表明,我们的模型具有较好的预测性能,最终为蛋白质-RNA相互作用的实验研究提供了生物信息学支持。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种基于多层设计空间缩减策略的近似高维优化方法
长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移
RNA-Seq-based transcriptomic analysis of Saccharomyces cerevisiae during solid-state fermentation of crushed sweet sorghum stalks
二维FM系统的同时故障检测与控制
扶贫资源输入对贫困地区分配公平的影响
基于结构域组成变换的蛋白质相互作用预测方法研究
基于多源信息融合的蛋白质结构域折叠模式预测模型研究
基于深度学习理论的蛋白质-RNA相互作用特征分析及预测研究
非编码RNA与蛋白质相互作用预测算法的研究