Intrinsically disordered proteins lack stable 3D structure, but still perform biological functions in vivo. They are very common in nature and play a variety of functions including cell signaling and regulation. Previous studies suggested that they participate in these functions via the interaction between their intrinsically disordered segments and other molecules, including RNA, DNA, and proteins. However, it is very difficult to detect intrinsically disordered segments, let alone their functions, by experiments. On the other hand, lots of efforts were put into the prediction of binding sites between proteins and RNA, DNA and other proteins. But these studies are limited to the proteins with stable 3D structure, instead of the intrinsically disordered proteins. Therefore, we are motivated to find a way to detect the potential disordered segments that bind to RNA, DNA and proteins. Specifically, we systematically analyze the disordered segments with the three binding events, and extract the sequence features which can distinguish them from other segments. Based on the speed to obtain these features, we divide them into the easy one and the complicated one. Using these two types of features, we develop the machine learning-based computational methods, which focus on the prediction speed (i.e., fast prediction) and prediction quality (i.e., accurate prediction), respectively. These methods provide a vital and highthroughput way to predict the intrinsically disordered segments that interact with RNA, DNA and proteins. Finally, we apply these methods at the proteomic level to build a database for these three binding events mediated by intrinsic disorder.
固有无序蛋白质在自然状态下缺乏稳定的空间结构,却仍在细胞中执行生物学功能。它们在物种中普遍存在,并在细胞中参与信号传导及调控等重要功能。研究发现它们的这些功能常通过其中的固有无序片段与RNA、DNA及蛋白质的互作用来实现。然而现代实验技术难以探测固有无序片段及其功能。另一方面,目前关于蛋白质与RNA、DNA及其他蛋白质的结合位点的预测工作仅关注了具有稳定结构的蛋白质,却忽视了固有无序蛋白质。鉴于上述事实,本项目致力于解决与RNA、DNA及蛋白质绑定的固有无序片段的预测问题。首先,通过系统分析这三类固有无序片段的序列信息,探究其不同于一般氨基酸片段的序列特征;并根据获取这些特征的速度,将其分为简单和复杂两类。其次,利用这两类特征,分别开发快速的及精确的基于机器学习的计算方法,用于这三类固有无序片段的预测。最后,在蛋白质组上应用这些计算方法,并建立针对固有无序片段的这三种功能的数据库。
固有无序蛋白质在自然状态下缺乏稳定的空间结构,却仍在细胞中执行生物学功能。它们在物种中普遍存在,并在细胞中参与信号传导及调控等重要功能。研究发现它们的这些功能常通过其中的固有无序片段与RNA、DNA及蛋白质的互作用来实现。然而目前关于蛋白质与RNA、DNA及其他蛋白质互作用的预测工作仅关注了具有稳定结构的蛋白质,却忽视了固有无序蛋白质。因此本项目致力于解决与RNA、DNA及蛋白质绑定的固有无序片段的预测问题。首先,本项目开发了首个能同时预测固有无序片段与RNA、DNA及蛋白质绑定这三种功能的计算方法,并为该方法搭建了友好的用户界面,这使得该方法能够被相应生物学领域的专家学者快速接受并使用。同时,本项目将固有无序片段的信息首次应用于短肽和辅酶A这两类特殊的结合位点的预测问题的研究中,并通过这两个研究工作验证了“须区别对待固有无序片段和具有稳定结构的氨基酸片段的功能”的结论。最后,我们应用开发的计算方法,在蛋白质组上分析了与RNA、DNA及蛋白质绑定的固有无序蛋白质的表面区域及互作用区域的特性,以及固有无序态与GC content之间的内在联系。.总之,通过本项目的研究工作,共发表11篇科研论文,其中包括10篇高水平SCI期刊论文,并撰写学术专著1章。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于LASSO-SVMR模型城市生活需水量的预测
基于SSVEP 直接脑控机器人方向和速度研究
基于多模态信息特征融合的犯罪预测算法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究
固有无序片段功能的系统分析及其预测算法研究
固有无序蛋白质(IDPs)特征信息挖掘及其预测方法发展
DNA\RNA相互结合的蛋白质预测与统计分析
蛋白质-配体绑定区域预测的特征抽取及学习算法研究