Apolipoprotein is in charge of maintaining the basic life process by regulating the metabolism of lipoprotein and immuno-inflammatory responses. The change in expression and function of apolipoprotein plays an important role in various diseases such as atherosclerosis, diabetes, myocardial infarction and tumor. In the presence of mass data and springing up of new apolipoproteins, it is difficult to study apolipoproteins by use of tranditional biochemistry method. It is imperative to systematically research apolipoproteins by computational approaches. Our previous studies showed that the apolipoproteins are different from non-apolipoproteins on sequence composition. The transcription factor, NF-κB can influence the expression of apolipoprotein M. Thus, the project is to construct a set of theoretical models for the identification of apolipoproteins. By searching and building high-quality apolipoprotein database, the multi-scale feature will be used to figure out the specific sequence and correlation information of the apolipoproteins. Based on feature selection algorithms and deep learning technique, we will construct a reliable and accurate predictive model for apolipoprotein prediction.The lipid-protein cosedimentation technique will be performed to verify the candidate apolipoproteins predicted by the model. Moreover, we will use kinetic methods to investigate the regulatory mechanism of apolipoprotein M by NF-κB. These systematic researches in the project are of great significance for understanding and clarifying the physiological function of apolipoprotein and rationally selecting drug targets.
载脂蛋白调节脂蛋白代谢及免疫炎症反应,参与人类多种疾病如动脉粥样硬化、糖尿病、心肌梗死和肿瘤等的发生发展。但面对海量数据和新型载脂蛋白的不断涌现,传统的生化实验研究已显得力不从心。借助计算的方法系统研究载脂蛋白势在必行。我们前期研究发现,载脂蛋白与非载脂蛋白序列之间存在特征性差异,转录因子NF-κB的活性改变可调节载脂蛋白M的表达。本项目拟在此基础上,建立一套载脂蛋白的理论识别和调控模型。通过搜集和构建全面的载脂蛋白数据库,采用多尺度的特征描述方法寻找载脂蛋白家族特有的序列、关联特征和规律性信息,进而利用特征筛选和整合机器学习方法,构建合理、高准确率的载脂蛋白预测模型;对预测得到的可能载脂蛋白,采用脂质-蛋白质共沉降技术进行实验验证;并利用动力学方法研究NF-κB对新型载脂蛋白M的调控机制。此项系统性的研究对深入理解和阐明载脂蛋白的生理学功能、合理选择药物靶点有着重要的指导意义和现实价值。
载脂蛋白通过调节脂蛋白代谢及免疫炎症反应等途径,参与维持基本生命过程,其表达或功能改变对人类多种疾病如动脉粥样硬化、糖尿病、心肌梗死、肿瘤等的发生发展至关重要。本项目以载脂蛋白为研究对象,搜集、整理载脂蛋白数据,挖掘载脂蛋白的序列、结构、关联信息,发展出有效的载脂蛋白序列特征提取算法,建立高灵敏性、高精度、高特异性的载脂蛋白及其功能识别模型和识别工具。经过三年的努力,项目组取得的主要成果有:(1)构建了载脂蛋白序列,及其亚家族蛋白序列数据库。通过一系列的数据清理、冗余序列剔除等操作,获得了当前包含载脂蛋白和其亚家族信息最全的数据集,为构建可靠的预测模型提供有用信息;(2)采用四种蛋白质序列描述符对载脂蛋白和其亚家族蛋白的序列进行表征,并利用方差分析进行特征筛选,从而降低了特征向量的噪声,提高了模型的容错能力;(3)利用多种机器学习模型来对载脂蛋白和其亚家族进行识别,构建了高精度的预测模型;(4)构建了在线预测服务ApoPred,为快速识别载脂蛋白和其亚家族提供服务。.由于科学前沿问题的不断涌现,我们在相关领域还进行了研究,取得的成果包括:(1)在蛋白质功能类型识别方面,开发了多种特征融合方法,并用于噬菌体酶类型的识别、荷尔蒙蛋白的预测、以及细胞周期蛋白的辨认;(2)在核苷酸序列分析上,整合了多种特征提取算法,改进了细菌终止子的预测性能、提高了2OM修饰位点的识别精度;(3)在医疗健康领域,利用泸州市地区人群体检数据,开发了基于决策树的糖尿病人群预测模型。.基于这些工作,我们在Frontiers in Cell and Developmental Biology (IF: 5.186),Bioinformatics (IF: 5.610)和International Journal of Biological Sciences (IF: 4.858)等国际期刊发表SCI收录论文11篇,参加国际会议2 次,国内会议4次,培养在读硕士研究生3人。
{{i.achievement_title}}
数据更新时间:2023-05-31
农超对接模式中利益分配问题研究
基于SSVEP 直接脑控机器人方向和速度研究
基于多模态信息特征融合的犯罪预测算法研究
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于细粒度词表示的命名实体识别研究
整合机器学习方法和多源异构特征筛选分析单氨基酸多态性对蛋白质的功能影响
基于结构信息和多平台数据的机器学习方法研究
图像识别的多特征判别流形学习方法研究
基于集成学习和分歧学习方法的生物特征识别若干问题的研究