DNA\RNA相互结合的蛋白质预测与统计分析

基本信息
批准号:61305072
项目类别:青年科学基金项目
资助金额:23.00
负责人:马昕
学科分类:
依托单位:南京审计大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:冯郁,丁国勇,胡乐夫,王雪
关键词:
RNA结合蛋白DNA结合蛋白机器学习
结项摘要

DNA\RNA-binding proteins plays critical roles in cellular functions. On the international level, the general methods of DNA\RNA-binding protein prediction using machine learning algorithms usually extracted protein sequence features or structural features to identify the binding protein. However the existence of DNA\RNA-binding residues is almost no consideration. Base on the well-built of DNA-binding residues prediction model DNABR and RNA-binding residues prediction model PRBR, we will present the method to identify whether a query protein is DNA-binding protein(RNA-binding protein) or not by using the information of DNA-binding residues(RNA-binding residues) in the sequence. Research contents are as follows: (1) statistical analysis of binding residues in DNA-binding proteins(RNA-binding proteins) and non-binding proteins. (2)using the statistical results to built significant differences between binding proteins and non-binding proteins. And the prediction models of DNA-binding proteins and RNA-binding proteins will be built from amino acid sequence by using machine learning methods. (3) Two web-server systems which constructed based on DNA-binding protein model and RNA-binding protein model are used to facilitate researchers for efficiently predicting DNA-binding proteins and RNA-binding proteins repectively.

DNA\RNA-结合蛋白在生物体细胞活动中起到至关重要的作用。国际上利用机器学习算法对DNA\RNA结合蛋白预测的研究,都是单纯的提取蛋白质序列特征或结构特征来识别结合蛋白,而判定DNA\RNA结合蛋白的最有效证据-DNA\RNA-结合残基的存在却无人考虑。本项目拟在前期DNA\RNA-结合残基预测模型完善构建的基础上,利用预测出的结合残基的信息判定某一特定蛋白质是否为DNA\RNA结合蛋白。研究内容包括:(1)分别对DNA-结合蛋白与非结合蛋白、RNA-结合蛋白与非结合蛋白中预测出的结合残基进行多方面的统计分析(2)利用分析结果对结合蛋白和非结合的蛋白构建出具有显著差异的特征,并通过机器学习方法利用序列信息获得DNA-结合蛋白预测模型和RNA-结合蛋白预测模型。(3)分别构建DNA-结合蛋白预测平台和RNA-结合蛋白预测平台,为蛋白质功能和药物设计提供技术和数据支持。

项目摘要

DNA\RNA-结合蛋白在生物体细胞活动中起到至关重要的作用。国际上利用机器学习算法对DNA\RNA结合蛋白预测的研究,都是单纯的提取蛋白质序列特征或结构特征来识别结合蛋白,而判定DNA\RNA结合蛋白的最有效证据-DNA\RNA-结合残基的存在却无人考虑。本项目在前期DNA\RNA-结合残基预测模型完善构建的基础上,利用预测出的结合残基的信息判定某一特定蛋白质是否为DNA\RNA结合蛋白,并利用较好的特征提取方法来提高预测效果。研究内容包括:(1)分别对DNA-结合蛋白与非结合蛋白、RNA-结合蛋白与非结合蛋白中预测出的结合残基进行多方面的统计分析,利用分析结果对结合蛋白和非结合的蛋白构建出具有显著差异的特征。(2)提出对结合蛋白有效的分类特征,并利用特征提取的方法筛选出更有效的特征。(3)通过机器学习方法利用筛选后的特征,获得DNA-结合蛋白预测模型和RNA-结合蛋白预测模型。(4)分别构建DNA-结合蛋白预测平台和RNA-结合蛋白预测平台,为蛋白质功能和药物设计提供技术和数据支持。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
4

丙二醛氧化修饰对白鲢肌原纤维蛋白结构性质的影响

丙二醛氧化修饰对白鲢肌原纤维蛋白结构性质的影响

DOI:10.7506/spkx1002-6630-20190411-143
发表时间:2020
5

Loss of a Centrosomal Protein,Centlein, Promotes Cell Cycle Progression

Loss of a Centrosomal Protein,Centlein, Promotes Cell Cycle Progression

DOI:10.16476/j.pibb.2019.0092
发表时间:2019

马昕的其他基金

批准号:41801261
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:81772295
批准年份:2017
资助金额:55.00
项目类别:面上项目
批准号:61271453
批准年份:2012
资助金额:60.00
项目类别:面上项目
批准号:61240052
批准年份:2012
资助金额:18.00
项目类别:专项基金项目
批准号:81472037
批准年份:2014
资助金额:72.00
项目类别:面上项目
批准号:U1706228
批准年份:2017
资助金额:280.00
项目类别:联合基金项目
批准号:81171670
批准年份:2011
资助金额:58.00
项目类别:面上项目

相似国自然基金

1

RNA-蛋白质结合机制与复合物结构预测研究

批准号:31100522
批准年份:2011
负责人:刘士勇
学科分类:C0504
资助金额:25.00
项目类别:青年科学基金项目
2

非编码RNA与蛋白质相互作用预测算法的研究

批准号:31000586
批准年份:2010
负责人:刘长宁
学科分类:C0608
资助金额:18.00
项目类别:青年科学基金项目
3

基于自然语言处理技术的DNA结合蛋白质预测

批准号:61573118
批准年份:2015
负责人:王晓龙
学科分类:F03
资助金额:64.00
项目类别:面上项目
4

与RNA、DNA及蛋白质绑定的固有无序片段的分析及预测

批准号:11501407
批准年份:2015
负责人:彭珍玲
学科分类:A0604
资助金额:18.00
项目类别:青年科学基金项目