基于单细胞数据的肿瘤异质性矩阵优化建模

基本信息
批准号:11901575
项目类别:青年科学基金项目
资助金额:25.00
负责人:姜昊
学科分类:
依托单位:中国人民大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
生物信息学单细胞组学机器学习
结项摘要

The rapid development of high-throughput single cell sequencing technology has produced a wealth of multi-omics data, enabling people to understand more comprehensively on tumor heterogeneity. Undoubtedly, the emergence of large-scale omics data poses many challenging computational problems. This project will investigate how to effectively integrate and analyze these complicated, highly heterogeneous, noisy, nonlinear and sparse single cell data. First of all, from the perspective of noise reduction, the single cell multi-omics data fusion model will be studied based on heterogeneous multiple kernel learning (MKL) framework by using the concept of structural risk minimization, to accurately realize tumor subtyping and guide the development of the treatment plan. Secondly, the heterogeneous omics data are fused in the correlation network level, and the perturbation analysis of the kernel matrix is performed by using the eigen-matrix translation technique. By eliminating the redundant features and constructing a delicate kernel to characterize the potential nonlinear structures embedded in the single cell data, we develop stable biomarker identification model with support vector machine kernel methods. Finally, we will provide efficient computational methods and tools for the integration of single cell multi-omics data, and provide theoretical support for the individualization and precise treatment of cancer.

高通量单细胞测序技术迅速发展,产生了丰富的多组学数据,促使人们能更全面地认识肿瘤的异质性。毫无疑问,大规模组学数据的产生,提出了很多具有挑战性的计算问题。本项目将研究如何有效的整合分析和利用这些复杂的、高度异质性的、高噪音的、高度非线性且高度稀疏的单细胞数据。具体包括几方面。首先,从降噪角度出发,利用结构化风险最小化思想研究基于异质多核学习框架的单细胞多组学数据融合模型进行准确的肿瘤分型,指导治疗方案制定。其次,将异源组学数据从相关网络层面进行融合,利用特征矩阵平移技术进行核矩阵的扰动分析,通过剔除冗余的特征,构建准确、精细的核矩阵来刻画单细胞数据的潜在非线性结构化特征,发展基于支持向量机核方法的稳定标志物识别模型。最终为多源单细胞组学数据整合提供高效的计算方法和工具,同时为癌症个体化、精准治疗提供理论支撑。

项目摘要

本项目开展基于单细胞数据的肿瘤异质性矩阵优化建模,旨在综合利用最优化、统计学、机器学习等理论工具,为多源单细胞组学数据整合提供高效的计算方法和工具,建立有针对性地标志物识别模型,为癌症个体化、精准治疗提供理论支撑。这一课题是生物信息学领域的研究前沿。主要研究内容包括:构建基于单细胞多组学数据的降噪表示方法、癌症分型统计优化模型与高效算法以及多组学数据整合的识别稳定标志物的优化模型与算法。.在单细胞数据降噪表示方法的设计方面,课题组从低维嵌入角度,结合线性、非线性两种不同思路探索单细胞数据的降噪表示方法:结合方差分析思想发展最优的低秩非负矩阵分解模型,将高维高噪音高度稀疏的单细胞数据进行低维表示;针对单细胞数据间非线性的相互关系,发展基于核非负矩阵分解的单细胞数据低维嵌入模型,并创新地提出一种基于最优局部线性嵌入的思想捕获单细胞RNA测序数据的流形结构。在癌症分型统计优化模型与算法方面,从无监督、半监督、有监督三个不同角度探索癌症分型统计的优化模型与算法设计,系统性建立了不同情形下的统计优化模型,从理论上丰富了机器学习算法体系包括多核学习的理论体系,从实际上解决复杂数据异质性分析的问题,尤其是生物信息学领域基于高维、高噪音、高度非线性的单细胞组学数据的异质性分析。在生物标志物研究方面,课题组从标志物识别的鲁棒性、合理性和高效性等多个方向发展标志物识别模型,创新地融合信息论、优化理论和智能算法设计高效、稳健的方法。上述研究成果丰富了单细胞数据分析领域的方法体系,给出了一系列原创性的算法设计与分析方法。.项目研究成果共发表学术论文12篇,其中SCI期刊论文8篇。本项目的研究有助于推动单细胞数据分析领域的进步,具有重要的理论价值和应用意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

转录组与代谢联合解析红花槭叶片中青素苷变化机制

转录组与代谢联合解析红花槭叶片中青素苷变化机制

DOI:
发表时间:
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

DOI:10.3799/dqkx.2020.083
发表时间:2020

姜昊的其他基金

相似国自然基金

1

基于数据局部结构保持的肿瘤异质性建模研究

批准号:61802141
批准年份:2018
负责人:史倩倩
学科分类:F0213
资助金额:26.00
项目类别:青年科学基金项目
2

基于单细胞多层次组学数据的肿瘤异质性及其调控机制研究

批准号:61772128
批准年份:2017
负责人:甘杨兰
学科分类:F0213
资助金额:59.00
项目类别:面上项目
3

基于单细胞变异数据的肿瘤进化研究

批准号:61863010
批准年份:2018
负责人:朱雯
学科分类:F0305
资助金额:41.00
项目类别:地区科学基金项目
4

基于单细胞测序的肿瘤内异质性指数研究及生存预测

批准号:31801120
批准年份:2018
负责人:刘怿宁
学科分类:C0608
资助金额:25.00
项目类别:青年科学基金项目