多个体单细胞转录组数据差异表达分析方法研究

基本信息

批准号：61902319

项目类别：青年科学基金项目

资助金额：25.00

负责人：孙世权

学科分类：

依托单位：西北工业大学

批准年份：2019

结题年份：2022

起止时间：2020-01-01 - 2022-12-31

项目状态：已结题

项目参与者：

关键词：

基因表达数据整合分析泊松混合模型差异表达分析

结项摘要

Massively parallel RNA sequencing provides unprecedented resolution, allowing us to accurately monitor complex biological processes. Investigations of the difference between group levels and the heterogeneity of individual cells are necessary in diagnosing various complex diseases and realizing personalized medicine. Statistically, considering the gene expression pattern of cells within group-based models, and integrating the difference of groups within cell-based models are very important for designing such models. However, the existing models do not satisfy current applications. We will propose zero-inflated Poisson mixed effects models and its inference approaches within Bayesian statistical framework to accurately identify differentially expressed genes, and three important topics will be investigated in this project: firstly, we will introduce a random effect variable to model the individuals; secondly, we will consider the cell-cell correlation in the model, and provide spike-slab prior information for gene effect size; and lastly, we will add the gene-related annotation information to the differential expression model to make the model more interpretable. The effectiveness and efficiency of the proposed methods will be evaluated by simulation studies and real data applications. We hope to build a new framework of identifying differentially expressed genes from multi-individual based single-cell RNA sequencing data, and providing new tools and technical support for the diagnosis and treatment of complex diseases.

转录组测序的蓬勃发展为探索复杂疾病提供了前所未有的机遇，复杂疾病诊断或个性化医疗的实现需要同时兼顾宏观群组水平差异性和微观细胞水平异质性。在群组水平差异分析中透视细胞水平变化，在细胞水平差异分析中整合群组差异是其设计核心。然而，现有差异表达分析模型均不能满足该设计需求。本项目着眼于多个个体的单细胞转录组测序数据差异表达分析问题，拟在贝叶斯框架下，构建零膨胀泊松混合效应模型及其推断方法：1)将个体选取的随机性引入差异分析模型，构建零膨胀泊松混合效应模型；2)将细胞之间的相互作用引入差异表达分析模型，并引入稀疏先验信息表征基因效应；3)将与基因表达间接或直接相关的基因注释信息嵌入模型，以提高差异表达基因识别的准确性和模型参数的生物解释性。设计仿真模拟数据评估其科学性和优劣性，实例分析验证其实用性，以期构建切实、有效的差异表达基因识别模型与算法，为复杂疾病诊治提供新方法和技术支持。

项目摘要

单细胞转录组测序技术的蓬勃发展为探索复杂疾病提供了前所未有的机遇，复杂疾病诊断或个性化医疗的实现需要同时兼顾宏观群组水平差异性和微观细胞水平异质性。在群组水平差异分析中透视细胞水平变化，在细胞水平差异分析中整合群组差异是其设计核心。然而，现有差异表达分析模型均不能满足该设计需求。基于此，本项目完成工作内容如下： 1）针对多个个体的单细胞转录组数据差异表达分析问题，提出了细胞转录组差异基因分析与富集分析整合方法iDEA，其富集分析通路识别功效比现有基因集富集分析方法提升5倍，比现有差异表达分析方法提升了64%；2）针对空间转录组数据的差异表达分析问题，提出了空间转录组空间表达模式识别方法SPARK，其效能比现有方法高约10倍；3）针对单细胞转录组数据降维方法问题，收集了32个单细胞转录数据集，对 18种不同的数据降维方法进行了比较分析，为单细胞转录组测序数据分析中数据降维方法的选择提供了重要指导获参考；4）针对单细胞转录组数据与全基因组关联性整合分析研究问题，总结了单细胞测序研究与全基因组关联性研究的最新进展，阐述了在细胞分辨率对全基因组关联性分析结果的解释的重要性；5）针对临床试验治疗效果评价亚群分析问题，提出了用于分析个体治疗水平的亚群分析模型HOSA，为临床试验评估提供了新方法和新思路；6）针对临床实际应用中大骨节病发病机制未明的问题，对大骨节病表观遗传与转录组学整合分析进行了研究，发现多个大骨节病差异甲基化区域及其调控的关键基因。..在研究成果方面，在Nature Methods, Nature Communications, Genome Biology等国际顶级和重要期刊发表论文10篇，申请相关专利1项，全部完成了预期目标。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

DOI：

发表时间：2021

孙世权的其他基金

相似国自然基金

基于单细胞转录组数据的细胞分类方法研究

批准号：61762087

批准年份：2017

负责人：朱晓姝

学科分类：F0213

资助金额：40.00

项目类别：地区科学基金项目

鳙大、小个体比较转录组及差异表达基因与体重的关联性研究

批准号：31472268

批准年份：2014

负责人：童金苟

学科分类：C1901

资助金额：93.00

项目类别：面上项目

集成单细胞转录组数据的选择性多聚腺苷化网络建模研究

批准号：61871463

批准年份：2018

负责人：吴小惠

学科分类：F0124

资助金额：63.00

项目类别：面上项目

基于单细胞转录组数据揭示细胞命运决定的综合机制

批准号：11775314

批准年份：2017

负责人：周天寿

学科分类：A2503

资助金额：68.00

项目类别：面上项目

多个体单细胞转录组数据差异表达分析方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

智能煤矿建设路线与工程实践

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

孙世权的其他基金

相似国自然基金