单细胞数据的多尺度统计建模与分析

基本信息
批准号:12126367
项目类别:数学天元基金项目
资助金额:10.00
负责人:朱媛
学科分类:
依托单位:中国地质大学(武汉)
批准年份:2021
结题年份:2022
起止时间:2022-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:邓明华
关键词:
细胞命运抉择多源数据网络推断数据挖掘单细胞数据
结项摘要

Disordered cell fate will disrupt gene regulation and even induce major diseases. Exploring the mechanism of cell fate decision is crucial for mapping the human cell, which is a challenging scientific problem to be solved urgently in the field of life science. The advances in sequencing technology make it possible to obtain single-cell sequencing data, which provides unprecedented data support for quantitative analysis of cell fate. This project intends to model multi-resolution dynamic gene regulation networks with the combination of macroscopic and microscopic aspects. We will focus on how to fuse spatial transcriptome data, how to develop efficient multi-network joint modeling algorithm, and how to quantitatively analyze the cell fate decision mechanism. Based on the combination of data-driven and driven model, we will propose a new approach for the dynamic evolution of multi-network, difference analysis and dynamic discovery of cell fate decision analysis. Therefore, the present project not only provides an efficient and available quantitative tool for the deep analysis of the cell development essence, but also has great significance for the further analysis of the pathogenesis of complex diseases.

细胞命运紊乱抉择将扰乱基因调控关系甚至诱发重大疾病。为此,探究细胞命运抉择机制对绘制人类细胞图谱至关重要,也是生命科学领域亟待解决的前沿科学问题。测序技术的进步使得可以方便地获取单细胞转录组数据,这为定量解析细胞命运提供了史无前例的数据支撑。针对传统研究没有充分考虑细胞发育多尺度特性等问题,本项目拟探索融合细胞通讯网络和融合宏、微观尺度的动态基因调控网络的建模方案,重点研究如何重构动态细胞谱系树、如何开发高效的多网络联合建模的有效算法及如何定量解析细胞命运机制等问题。基于数据驱动与模型驱动相结合的模式,本项目将提出多网络的动态演化、差异性统计分析和解析细胞命运抉择的新思路。因此,本项目的研究将为深层解析细胞发育本质提供高效可行的量化工具,对进一步解析复杂疾病发病机理具有重要意义。

项目摘要

本项目拟围绕细胞命运抉择机制的定量解析开展研究工作。主要包括:(1)细胞网络建模;(2)基因网络建模;(3)基因共表达模式挖掘这三个主要研究内容。.在项目的大力支持下,借助北京大学数学学院优质的科研资源,已经初步探讨了如下几个工作:第一,充分总结和讨论了单细胞数据的深度聚类方法(已接收发表Current Bioinformatics);第二,设计了同时考虑基因和细胞相似性关联的单细胞数据的填补方案,其中通过关联关系预测,刻画基因表达零值(以区分真正基因未表达的零值和没有测到的技术零值),并通过模型驱动的思路估计了基因沉默的比例,最终填充技术零值而保持基因未表达零值(相关结果在进一步整理中);第三,考虑到单细胞数据的高维度,高稀疏,非线性的特点,通过核子空间聚类的方法得到数据的有效聚类,为进行下游分析提供了有效的类别信息(相关结果在进一步整理中);第四,考虑到在对细胞类型进行鉴定时除了考虑聚类结果之外,还需要综合考虑细胞和基因等多元因素才能较为精准地确定细胞类型。针对以上问题,提出一种整合细胞和基因综合信息的细胞类型鉴定方法。即将基因表达作为细胞特征表征,构建细胞相似性度量,通过选择阈值得到细胞相互作用网络。其次,构建契合细胞相互作用网络特点的概率图模型,通过交替乘子法估计模型参数,利用细胞与隶属类别潜变量矩阵获得数据聚类结果。最后,在上述基础上,寻找细胞类型特异的差异性表达显著的基因并将这些基因与已知细胞类型的标志基因进行对比分析,以确定细胞类型(相关结果在进一步整理中)。此外,我们利用差异网络分析方法,整合组织特异的癌症之间的差异信息及患病和正常样本之间的差异信息,以获得泛癌症差异基因表达网络;在不需要特征工程和先验知识前提下,通过网络嵌入方法,提取网络的结构化信息。通过集成投票的分类方式,对于泛癌症整合网络进行分析,获得鲁棒的预测结果。为泛癌症驱动基因的识别,提供潜在指导信息(已经接收发表,Briefings in Functional Genomics)。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
4

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015
5

基于FTA-BN模型的页岩气井口装置失效概率分析

基于FTA-BN模型的页岩气井口装置失效概率分析

DOI:10.16265/j.cnki.issn1003-3033.2019.04.015
发表时间:2019

朱媛的其他基金

相似国自然基金

1

单细胞数据的多尺度统计建模与分析

批准号:12126305
批准年份:2021
负责人:邓明华
学科分类:A0604
资助金额:20.00
项目类别:数学天元基金项目
2

高维数据统计建模与分析

批准号:11131002
批准年份:2011
负责人:陈松蹊
学科分类:A0402
资助金额:220.00
项目类别:重点项目
3

复杂疾病高通量数据的多尺度建模与网络分析

批准号:61802125
批准年份:2018
负责人:张伟
学科分类:F0213
资助金额:25.00
项目类别:青年科学基金项目
4

复杂数据的统计分析与建模

批准号:11171012
批准年份:2011
负责人:薛留根
学科分类:A0403
资助金额:40.00
项目类别:面上项目