Protein-RNA interactions widely exist in a variety of biological processes such as posttranscriptional regulation of gene expression. Therefore, investigating protein-RNA interactions is of pivotal importance. The project presented here tries to comprehensively apply bioinfromatics and machine learning methods to develop prediction models for binding domains of protein-RNA interactions,based on the protein-RNA complexes from PDB database as the training dataset, and the properties such as protein domain and RNA secondary structure and physico-chemical parameters as the features. Then, we will also develop a web server for genome-wide prediction of protein-RNA ineractions based on domains. Finally, the project will provide bioinformatics support for studying protein-RNA interactions.
蛋白质-RNA相互作用广泛存在于转录后基因表达调控等多种生物过程之中,因此,开展蛋白质-RNA相互作用研究具有重要意义。为此,本项目拟以PDB数据库提供的蛋白质-RNA相互作用数据为基础,以蛋白质结构域、RNA二级结构、结合能以及其它各项理化性质等特征为变量,综合运用生物信息学与机器学习等方法,构建基于结构域的蛋白质-RNA相互作用预测模型,并开发相应的在线预测平台,最终为蛋白质-RNA相互作用研究提供生物信息学支持。
在该项目资助下,我们首先从PDB数据库中构建了数据集RPI3761,该数据集含有3761个蛋白质-RNA相互作用对和通过随机抽样方法生成的阴性样本数据集。然后运用rnafold等生物信息学软件提取特征,并运用深度学习方法构建了蛋白质-RNA相互作用预测模型DPRPI。另外,我们采用十倍交叉验证策略,在3个公开数据集RPI2241、RPI369和RPI12737上进行模型性能评价,结果表明,我们的模型具有较好的预测性能,最终为蛋白质-RNA相互作用的实验研究提供了生物信息学支持。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
货币政策与汇率制度对国际收支的影响研究
基于结构域组成变换的蛋白质相互作用预测方法研究
基于多源信息融合的蛋白质结构域折叠模式预测模型研究
基于深度学习理论的蛋白质-RNA相互作用特征分析及预测研究
非编码RNA与蛋白质相互作用预测算法的研究