In the protein-protein interaction, Hub proteins are the key factor to maintain stability and coordination of protein-protein interactions, and exert proteins biological function. Hub proteins help to explain the molecular mechanism of exerting biological function, to understand the micro process of life activity and provide theoretical guidance of the drug design based on protein structure. Based on the protein three dimensional structure, this research establishes the complex network of PPI, combines with biological feature, character evolution, protein interaction network topology, uses the machine learning methods to conduct depth study of the status and function of Hub protein in the interaction. The main research contents include the relationship between topological structure and functional lethality in protein-protein interaction, the prediction of Hub protein interaction hot regions, the relevance analysis between Hub protein and structure domain, the tendency research of Hub protein interaction. Finally, a prototype system of analyzing Hub protein interactions is designed. The solution of these research problems provides the theoretical support for understanding protein-protein interaction mechanism and revealing the rule of the activity.
蛋白质-蛋白质相互作用中的Hub蛋白质是稳定并协调蛋白质-蛋白质相互作用并发挥生物学功能的关键因素,它有助于解释蛋白质发挥其生物学功能的分子机制,进一步理解生命活动的微观过程,并对基于蛋白质结构的药物设计提供理论指导。本研究基于三维空间结构,构建蛋白质相互作用复杂网络,结合蛋白质的生物特征、进化特征、相互作用网络拓扑特性等,采用机器学习方法对Hub蛋白质在相互作用中的地位和功能进行深入研究,包括Hub 蛋白质的网络结构中心性与功能致命性研究、Hub 蛋白质相互作用下的热区发现、Hub蛋白质与结构域的关联性分析和Hub 蛋白质之间相互作用的倾向性研究。最后,设计并实现一个适用于分析Hub蛋白质相互作用的原型系统。该课题问题的解决,对理解蛋白质相互作用机理和揭示生命活动规律提供理论支持。
本项目采用了机器学习聚类算法和分类算法,结合Hub蛋白质相互作用的复杂网络特性,以及蛋白质的生物特征和结构特征,开展了一系列的研究。.针对Hub蛋白质的物理化学特性和结构特征,实现了两种特征选择方法:1)基于改进的mRMR的特征选择方法;2) 基于相关系数和SVM-RFE特征选择方法。通过提出的两种方法,无关的特征可以去除,且不会造成大量的信息丢失。.设计了基于mRNA表达的Hub蛋白质的中心性及结构域分析方法。根据节点的连接度和中介度,通过调整不同的阈值,检测不同蛋白质所占的比例,确定DateHub和PartyHub蛋白质节点集合。此外,提出了有效的Hub蛋白质热区预测方法:1) 基于局部社区结构探测的Hub蛋白质热区预测方法。2) 基于残基配位数优化和K-means的Hub蛋白质结合面热区预测方法。提出的两种方法对预测Hub蛋白质相互作用结合面上的热区是有效的,具有较高的精度和稳定性,能够较真实地反映Hub蛋白质残基节点所在的热区结构。最后,对获得的热区结果进行可视化处理,提供蛋白质相互作用的三维空间结构图。.提出了基于相互作用倾向性的Hub蛋白质结合面预测方法。在分类过程中加入Hub蛋白质之间的相互作用情况,计算它们之间发生相互作用的倾向性,采用集成学习方法对相互作用倾向性较高的DD结合面(DateHub-DateHub)和PP结合面(PartyHub-PartyHub)进行分类。此外,还利用平均精确率下降曲线和平均基尼系数下降曲线分析特征变量在热点预测过程的重要性,而且采用了新的评估分类模型的方式,通过绘制边缘盒须图直观地评价分类模型的确定性。.通过本项目的实施,揭示了Hub蛋白质在PPIN中所表现出的独特结构属性和重要作用,使得可以通过对Hub蛋白质的研究来探寻蛋白质相互作用网络中拓扑结构、生物功能和进化性之间的关系。其研究成果将进一步促进药物设计的发展,指导基于蛋白质结构的药物研究,可以作为生物制药的理论基础,具有广泛的生物应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
氟化铵对CoMoS /ZrO_2催化4-甲基酚加氢脱氧性能的影响
跨社交网络用户对齐技术综述
城市轨道交通车站火灾情况下客流疏散能力评价
基于FTA-BN模型的页岩气井口装置失效概率分析
基于子图结构和功能的复杂网络链路预测研究
基于多模态磁共振影像的人脑复杂结构和功能网络研究
基于复杂网络方法研究蛋白质分子体系功能运动的别构机制
基于复杂网络理论的脑功能结构分析和多尺度建模