Bioimage informatics is a new bioinformatics research direction, which is rapidly developed in recent several years. Protein is the very basic and important molecules in the cell. They must function at the right place at the right time to guarantee the normal status of the life system. Due to the subcellular location knowledge can provide important information to understand the protein’s functions, the accurate prediction of the subcellular location is an important bioinformatics topic. This project proposes to study the bioimage-based protein subcellular location prediction, and we will propose new algorithms for detecting the local regions of interest in the bioimages and new bioimage feature description approaches. Further, we will develop new algorithms to quantitatively measure the different distribution ratios of multi-label proteins among different subcellular locations, and novel classification algorithms guided by the cellular biological knowledge. Due to there are a lot of amino acid sequence-based research results in the area, we will study how to transfer the knowledge between the sequence-based and image-based predictors, which will enable us construct new models that can combine the merits from both sequences and images. We then will further investigate how to detect the translocated or mislocated proteins in the disease status, which will provide a new methodology solution for the long-term interest of finding disease biomarkers. Through studying the bioimages and its relationship with the literature, results of this project will be important to help construct the new bioinformatics research framework of bioimaging-based protein subcellular location prediction and protein functions studies.
生物图像信息学是近年快速发展起来的生物信息学研究新方向,正为传统生命分子科学研究带来重要变革。蛋白质是生命体的重要功能分子,它们必须在正确的时间出现在正确的亚细胞位置才能完成特定的功能,蛋白质的亚细胞精确定位是生物信息学研究的重要课题。本项目提出开展基于分子显微图像复杂模式理解的蛋白质亚细胞位置预测,深入分析分子图像的复杂模式特点,建立有效检测大视野局部感兴趣区域和特征描述的新方法,定量分析多标记蛋白在不同亚细胞位置的分布比例,构建生物知识引导下的分类新算法,探讨蛋白图像与序列的知识迁移,形成图像和序列相互融合计算的新途径。在此基础上,进一步研究疾病状态下蛋白质亚细胞位置动态转移检测的新方法,为疾病分子靶标筛选这一长期瓶颈提供新的解决方案。本项目通过研究分子图像独特性内容,同时兼顾领域多源异质生物分子数据的关联,将促进形成围绕图像理解的蛋白质亚细胞位置及功能生物信息学研究的综合交叉新方向。
生物信息学及其生物图像信息学分支是近年来快速发展的信息科学与生命科学交叉研究方向,为实验生命科学研究带来新的支撑。本项目结合生物分子图像和蛋白序列等多模态信息,对蛋白亚细胞位置预测和复杂结构功能计算分析模拟开展了一系列的研究,并取得以下结果:基于蛋白质分子图像的蛋白质亚细胞定位及位置动态转移产生的潜在疾病靶标计算分析,开发了基于深度模型和传统机器学习模型的亚细胞位置预测方法;基于蛋白质序列的结构分析优化及功能计算分析,提出了挖掘蛋白序列与结构、功能关系的生物信息学新模型;针对复杂生物分子数据,研究提出了相应地模式分析与识别新方法。理论研究成果已建成在线平台软件供领域研究人员使用。项目执行期间,共发表学术期刊论文37篇,申请专利8项。培养博士生4名、硕士生6名。所研发的理论算法方法有望促进面向蛋白质亚细胞位置及蛋白质复杂结构功能的生物信息研究发展,以进一步促进实现理论模型应用于相关生物实验设计。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
硬件木马:关键问题研究进展及新动向
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
内点最大化与冗余点控制的小型无人机遥感图像配准
疏勒河源高寒草甸土壤微生物生物量碳氮变化特征
蛋白质图像亚细胞位置模式分析、识别及其应用
基于多标记学习的蛋白质亚细胞多位置预测方法研究
基于多尺度空间建模的蛋白质亚细胞定位预测及应用研究
细胞凋亡蛋白质亚细胞定位数据集的构建及定位信息的分析与预测