DNA\RNA-binding proteins plays critical roles in cellular functions. On the international level, the general methods of DNA\RNA-binding protein prediction using machine learning algorithms usually extracted protein sequence features or structural features to identify the binding protein. However the existence of DNA\RNA-binding residues is almost no consideration. Base on the well-built of DNA-binding residues prediction model DNABR and RNA-binding residues prediction model PRBR, we will present the method to identify whether a query protein is DNA-binding protein(RNA-binding protein) or not by using the information of DNA-binding residues(RNA-binding residues) in the sequence. Research contents are as follows: (1) statistical analysis of binding residues in DNA-binding proteins(RNA-binding proteins) and non-binding proteins. (2)using the statistical results to built significant differences between binding proteins and non-binding proteins. And the prediction models of DNA-binding proteins and RNA-binding proteins will be built from amino acid sequence by using machine learning methods. (3) Two web-server systems which constructed based on DNA-binding protein model and RNA-binding protein model are used to facilitate researchers for efficiently predicting DNA-binding proteins and RNA-binding proteins repectively.
DNA\RNA-结合蛋白在生物体细胞活动中起到至关重要的作用。国际上利用机器学习算法对DNA\RNA结合蛋白预测的研究,都是单纯的提取蛋白质序列特征或结构特征来识别结合蛋白,而判定DNA\RNA结合蛋白的最有效证据-DNA\RNA-结合残基的存在却无人考虑。本项目拟在前期DNA\RNA-结合残基预测模型完善构建的基础上,利用预测出的结合残基的信息判定某一特定蛋白质是否为DNA\RNA结合蛋白。研究内容包括:(1)分别对DNA-结合蛋白与非结合蛋白、RNA-结合蛋白与非结合蛋白中预测出的结合残基进行多方面的统计分析(2)利用分析结果对结合蛋白和非结合的蛋白构建出具有显著差异的特征,并通过机器学习方法利用序列信息获得DNA-结合蛋白预测模型和RNA-结合蛋白预测模型。(3)分别构建DNA-结合蛋白预测平台和RNA-结合蛋白预测平台,为蛋白质功能和药物设计提供技术和数据支持。
DNA\RNA-结合蛋白在生物体细胞活动中起到至关重要的作用。国际上利用机器学习算法对DNA\RNA结合蛋白预测的研究,都是单纯的提取蛋白质序列特征或结构特征来识别结合蛋白,而判定DNA\RNA结合蛋白的最有效证据-DNA\RNA-结合残基的存在却无人考虑。本项目在前期DNA\RNA-结合残基预测模型完善构建的基础上,利用预测出的结合残基的信息判定某一特定蛋白质是否为DNA\RNA结合蛋白,并利用较好的特征提取方法来提高预测效果。研究内容包括:(1)分别对DNA-结合蛋白与非结合蛋白、RNA-结合蛋白与非结合蛋白中预测出的结合残基进行多方面的统计分析,利用分析结果对结合蛋白和非结合的蛋白构建出具有显著差异的特征。(2)提出对结合蛋白有效的分类特征,并利用特征提取的方法筛选出更有效的特征。(3)通过机器学习方法利用筛选后的特征,获得DNA-结合蛋白预测模型和RNA-结合蛋白预测模型。(4)分别构建DNA-结合蛋白预测平台和RNA-结合蛋白预测平台,为蛋白质功能和药物设计提供技术和数据支持。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于SSVEP 直接脑控机器人方向和速度研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
丙二醛氧化修饰对白鲢肌原纤维蛋白结构性质的影响
Loss of a Centrosomal Protein,Centlein, Promotes Cell Cycle Progression
RNA-蛋白质结合机制与复合物结构预测研究
非编码RNA与蛋白质相互作用预测算法的研究
基于自然语言处理技术的DNA结合蛋白质预测
与RNA、DNA及蛋白质绑定的固有无序片段的分析及预测