基于深度学习理论的蛋白质-RNA相互作用特征分析及预测研究

基本信息
批准号:61873212
项目类别:面上项目
资助金额:63.00
负责人:李丽萍
学科分类:
依托单位:西京学院
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:黄裕安,马亚红,贺田田,袁宝玺,于长青,陈沾衡,王政,李扬
关键词:
网络模块分析分子相互作用预测遗传相互作用网络蛋白质网络
结项摘要

Identification of protein-RNA interactions is very significant for various field, such as exploring the truth of life, understanding the mechanism of disease, developing innovative drugs to improve health conditions of human being, and so on. At present, the means of biological experiment to analyze protein-RNA interactions is relatively inefficient and difficult. Therefore, the employment of intelligent computing to predict protein-RNA interactions has become a fast and accurate method. In this project, we combine the multi-source feature information representation and deep learning of protein and RNA biomolecules based on CUDA heterogeneous platform. At first, we develop a new numerical coding method which obtains multi source information, such as protein and RNA biomolecules sequence information, evolutionary information, physical and chemical properties, and so on. Then, the feature extraction algorithm based on deep learning is used to automatically extract the advanced abstract features that can quantitative descriptive the essential attributes of the data. Finally, the CUDA-based machine learning framework is applied to predict the protein-RNA interactions quickly and accurately. The research achievements of this project will deepen the understanding of life and provide high reliable data and theoretical basis for the revelation of disease mechanism and development of new drug.

蛋白质与RNA之间相互作用的识别对于探索生命的真谛、理解疾病相关机理,以及研发创新药物提升人们的健康水平等都具有十分重要的作用和意义。在目前生物实验手段解析蛋白质-RNA相互作用相对低效而困难的情况下,采用智能计算方法预测蛋白质-RNA相互作用成为一种快速而准确的研究手段。本项目拟研究基于CUDA异构平台,结合蛋白质及RNA生物分子的多源特征信息表征及深度学习理论,对潜在蛋白质-RNA相互作用进行预测研究。首先,研究基于蛋白质及RNA生物分子的序列信息、进化信息及其物理化学属性等多源特征的数值化编码新方法;然后,基于深度学习的特征抽取算法被用来自动客观地抽取出能定量刻画数据本质属性的高级抽象特征;最后,使用基于CUDA的机器学习框架快速、准确地预测蛋白质-RNA间的相互作用。本项目的研究成果将加深对生命的认识,为疾病机理的揭示及新药研发提供高可靠的数据支持和理论依据。

项目摘要

蛋白质与RNA之间相互作用的识别对于探索生命的真谛、理解疾病相关机理,以及研发创新药物提升人们的健康水平等都具有十分重要的作用和意义。在目前生物实验手段解析蛋白质-RNA相互作用相对低效而困难的情况下,采用智能计算方法预测蛋白质-RNA相互作用成为一种快速而准确的研究手段。本项目研究了基于CUDA异构平台,结合蛋白质及RNA生物分子的多源特征信息表征及深度学习理论,对潜在蛋白质-RNA相互作用进行预测研究,以探索蛋白质与RNA之间相互作用及其功能行使的规律与本质。本项目从信息科学的角度为从大规模准确构建蛋白质-RNA 相互作用网络图谱及特征分析研究提供新的认知,构架信息学家与生物科学家之间的桥梁,主要研究包括:(1)提出一种融合蛋白质及 RNA 序列信息、进化信息及其物理化学属性等多种特征信息的数值化表征方法,为深度学习(Deep Learning)模型提取有效特征信息提供保证。(2)设计了一种模拟人脑分层结构的深度学习算法,以自动、高效地抽取特性信息,得到了最优的特征表示,为准确预测蛋白质-RNA 相互作用提供保障。(3)针对蛋白质-RNA 相互作用预测研究中不平衡数据集自身的特点和传统分类算法的局限性,提出了一种处理不平衡样本的混合重采样集成学习方法。(4)利用项目研究中所提出和实现的新算法及软件,整合、挖掘存放在公开数据库中的蛋白质序列数据、RNA 序列数据、物理化学属性数据以及蛋白质-RNA 相互作用数据,建立了一个具有较强交互性的数据平台,实现数据的查询与分析。本项目的研究成果将加深对生命的认识,为疾病机理的揭示及新药研发提供高可靠的数据支持和理论依据。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019

李丽萍的其他基金

批准号:30771846
批准年份:2007
资助金额:35.00
项目类别:面上项目
批准号:40805005
批准年份:2008
资助金额:20.00
项目类别:青年科学基金项目
批准号:81503147
批准年份:2015
资助金额:17.90
项目类别:青年科学基金项目
批准号:81602554
批准年份:2016
资助金额:18.00
项目类别:青年科学基金项目
批准号:81760579
批准年份:2017
资助金额:30.00
项目类别:地区科学基金项目
批准号:31570572
批准年份:2015
资助金额:55.00
项目类别:面上项目
批准号:30571613
批准年份:2005
资助金额:30.00
项目类别:面上项目
批准号:81872929
批准年份:2018
资助金额:57.00
项目类别:面上项目

相似国自然基金

1

基于多模态深度学习的lncRNA-RNA相互作用模式分析及预测研究

批准号:61762026
批准年份:2017
负责人:樊永显
学科分类:F0213
资助金额:38.00
项目类别:地区科学基金项目
2

基于结构域的蛋白质-RNA相互作用预测模型构建

批准号:31471244
批准年份:2014
负责人:李伍举
学科分类:C0608
资助金额:70.00
项目类别:面上项目
3

非编码RNA与蛋白质相互作用预测算法的研究

批准号:31000586
批准年份:2010
负责人:刘长宁
学科分类:C0608
资助金额:18.00
项目类别:青年科学基金项目
4

与RNA、DNA及蛋白质绑定的固有无序片段的分析及预测

批准号:11501407
批准年份:2015
负责人:彭珍玲
学科分类:A0604
资助金额:18.00
项目类别:青年科学基金项目