基于新型机器学习方法的核酸-结合氨基酸位点的分析与预测

基本信息
批准号:61203289
项目类别:青年科学基金项目
资助金额:25.00
负责人:吴建盛
学科分类:
依托单位:南京邮电大学
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:徐欣,晏善成,刘天亮,汤丽华,姚文坡,王沛存
关键词:
半监督学习特征选取方法RNA结合位点small作用机制核酸结合位点
结项摘要

The interaction between proteins and nucleic acids is one of the central issues in molecular biology researches and an important part of many life activities. Especially, the specific recognition of small RNAs by proteins in the process of RNA interference is in charge of many important life activities and disease processes, and is the focus of today's life science researches. The identification of nucleic acid - binding sites in proteins is an important way of understanding the mechanism of protein - nucleic acid interaction, and has important significance for understanding the related biological processes, the related diseases and their treatment, and protein functions and drug researches. In this project, the mechanism of specific recognition of small RNAs by proteins will be analyzed from structural data by combining mathematical and statistical methods with feature selection methods, and new methods will be developed for predicting DNA/RNA-binding sites from the protein sequences, and novel classifiers will be designed to recognize small RNA-binding sites based on semi-supervised machine learning methods. Moreover, the ideal methods for predicting binding sites in proteins will be reached by introducing the propensity information about physico-chemical properties and structures in the binding domains, and by picking up excellent feature subsets using feature selection methods, and by solving class-imbalance and cost-sensitive issues, and by constructing web servers. The expected contributions of this project are to provide new ways to study protein - nucleic acid interactions comprehensively, and new impulses to develop protein functional site prediction researches and machine learning techniques.

蛋白质-核酸相互作用是分子生物学研究的中心问题之一,是许多生命活动的重要组成部分。尤其是,small RNA在RNA干扰过程中通过与蛋白质特异性结合调控着细胞内许多重要的生命活动和疾病发生过程,更是当今生命科学的研究热点。而识别核酸-结合氨基酸位点是认识蛋白质-核酸相互作用机制的重要途径。本项目拟将数学统计方法和特征选取方法结合起来,从结构上分析蛋白质与small RNA特异性相互作用机制;发展基于序列的DNA/RNA-结合位点预测新方法,和引入半监督学习思想发展特异性的small RNA-结合位点预测方法。在发展结合位点预测方法时,引入结合区域的物化特性及结构偏好性信息,利用特征选取方法筛选特征,解决样本类不平衡和代价敏感问题,建立在线预测平台。项目完成后,将为系统研究蛋白质-核酸相互作用提供新方法,并将推进蛋白质其它功能位点的预测研究和机器学习技术的发展。

项目摘要

本研究设计了多种新型的机器学习方法对蛋白质的功能和核酸作用的功能位点的预测进行了研究。主要结果包括:(1)使用代价敏感的支持向量机的方法,预测基于序列的small RNA与蛋白质结合位点, 解决样本类不平衡和代价敏感问题,建立small RNA-结合位点在线预测平台SARS;(2)使用半监督支持向量机加上混合特征的方法,识别蛋白质上的microRNA-结合位点,建立专门的microRNA-结合位点在线预测平台MBindR;(3)使用支持向量机的方法,基于序列信息,预测DNA蛋白质结合位点;(4)项目申请人发现,蛋白质功能预测问题本质上是一个多示例多标记学习问题,并设计新的多示例多标记学习算法预测蛋白质的功能。(5)在蛋白质功能的预测中,很多蛋白质的功能注释是不完全的。项目申请人发现, 这个可以抽象为弱标记多示例多标记学习问题,并设计了模型进行预测。(6)设计了新型机器学习方法En-MLKNN设计并把它应用于文本分类。(7)提出了第一种可以有效应用于海量宏基因组功能预测的学习框架HashMLL。(8)设计了基于海明距离的局部敏感哈希算法的新型机器学习算法。项目的完成,为系统研究蛋白质蛋白质功能及功能位点预测提供新方法,并推进了机器学习技术的发展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

农超对接模式中利益分配问题研究

农超对接模式中利益分配问题研究

DOI:10.16517/j.cnki.cn12-1034/f.2015.03.030
发表时间:2015
2

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

DOI:10.13465/j.cnki.jvs.2020.09.026
发表时间:2020
3

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

DOI:10.3969/j.issn.1002-0268.2020.03.007
发表时间:2020

吴建盛的其他基金

相似国自然基金

1

基于几何算法与机器学习的反向配体结合位点预测

批准号:11301286
批准年份:2013
负责人:王奎
学科分类:A0604
资助金额:22.00
项目类别:青年科学基金项目
2

高通量核酸、配体、蛋白质结合位点的差异性分析与特异化预测

批准号:61802329
批准年份:2018
负责人:张健
学科分类:F0213
资助金额:26.00
项目类别:青年科学基金项目
3

基于氨基酸接触能网络的蛋白质结合位点分析

批准号:31600671
批准年份:2016
负责人:严文颖
学科分类:C0504
资助金额:19.00
项目类别:青年科学基金项目
4

基于深度学习方法预测蛋白质翻译后修饰位点

批准号:61762034
批准年份:2017
负责人:龙海侠
学科分类:F0213
资助金额:34.00
项目类别:地区科学基金项目