针对当前生物科学技术发展对智能学习理论的需要,研究蛋白质组学数据之应用背景下的复杂生物特征建模和机器学习新理论,重点解决现有研究中所凸显的简单移植成熟算法解决生物问题所面临的挑战与所遇到的瓶颈问题。根据蛋白质数据的特点,在评估现有机器学习模型的基础上,提出适合海量复杂蛋白质数据的特征提取和维数约简新技术,机器学习新方法,并与现有理论予以有效集成,使之能够更好地处理多模态、动态、分层、关联、海量、时变、高维、高冗余和高噪声的蛋白质数据。新的理论和方法将着眼于精确性、效率性、理解性、动态性、非线性性和易用性等关键问题,更高效地提取、表达、融合和预测生物领域知识,加速蛋白质序列-结构-功能映射关系的解密。本项目还将利用3T3-L1脂肪干细胞分化模型,以细胞培养收集的有限分泌蛋白质为基础,通过高效预测分析算法进行脂肪细胞分泌全蛋白质组学研究,揭示他们和肥胖代谢疾病的相关关系,提高健康水平。
本项目旨在开展面向海量蛋白质分子数据的生物信息学研究,围绕蛋白质分子数据的复杂特征,建立数据驱动的有效计算模型,实现在海量、复杂背景下的可计算方法,以指导相关生物实验的开展。项目主要研究内容是蛋白质结构和功能的计算预测,在蛋白质相似性度量、高鉴别特征的提取和融合、样本不均衡和小样本学习问题、新多目标优化方法、蛋白质生物图像理解和与生物实验结合等方面做了深入的研究工作,获得了系统性的理论研究成果,形成了蛋白质序列与图像分析的先进算法,揭示了多视角信息融合对解决生物系统复杂性的重要性,指明了生物图像理解在蛋白质生物信息学中的新趋势和重要应用。项目成果一方面通过建立精度高、速度快、易使用的理论算法和在线平台,在加速生命科学和临床生物医学研究进程方面具有重要推动作用;另一方面,在深化信息科学在解决生物复杂问题的可计算建模方面也有重要价值。.通过本项目的研究,项目组发表了SCI期刊论文28篇,包括Bioinformatics 5篇,IEEE 期刊长文3篇,SCI影响因子之和87以上,单篇大于3.0的论文17篇。发表论文中被遴选为国际期刊封面故事论文1篇,2篇论文曾被遴选为ESI高引用论文。所提出的算法在国际蛋白质结构预测竞赛CASP11中被评测为 Top 3 的RR相互作用预测算法,证明了成果的国际竞争力。在项目所构建的先进理论模型基础上,建立了11个在线计算生物信息学平台,实现了构架理论模型和生物实验的桥梁。项目培养了13名研究生,其中2人已获得上海市优秀研究生学位论文。.
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
2016年夏秋季南极布兰斯菲尔德海峡威氏棘冰鱼脂肪酸组成及其食性指示研究
转录组与代谢联合解析红花槭叶片中青素苷变化机制
基于粒计算的海量数据挖掘理论与高效算法研究
针对海量复杂类型数据的统计学习模型与理论
多因素及其相互关系复杂的海量信息可计算建模及算法研究
面向云计算的海量时空数据建模及土地资源时空数据高效管理示范应用研究