Based on high-throughput sequencing technology, metagomics directly sequences the microbiome in human gut, skin and environment like earth and atmosphere, hope to find their effecst to human health and crop's production. This proposal will focus on the compositionality of microbial data, develop new statistical model and algorithm for compositional data, aim to develop new tools for metagonomic data analysis. The proposal will estimate the relative abundance of each microbial species, infer the interaction network among microbial species, and build the association of phenotypical traits such as desease status with microbial communities, which will help the research of further functional analysis.
借助于高通量测序技术,宏基因组学直接对人体肠道、皮肤和环境中的微生物进行测序,希望通过数据分析来研究其对人类健康和作物产量的影响。本项目将围绕宏基因组数据的成分性特点,建立针对成分数据的统计模型和算法,开发新的宏基因组数据分析工具。项目将对微生物成分的丰度进行估计,开发新的网络推断算法,并建立微生物群落和疾病状态等性状的关联模型,为相关功能分析奠定基础。
成分数据最大的特点是各分量总和为定值,宏基因组测序数据就是一个典型的成分数据。高通量转录组测序RNA-seq 数据本质上说也是成分数据。本项目将建立针对成分数据的统计模型和算法,开发新的成分数据分析工具。..项目执行过程中,我们开展了如下研究工作:第一,开发了三个成分数据网络推断方法,包括CDTrace, CDTr和Codaloss,基于对成分数据的对数正态分布建模,这些推断算法针对对数正态模型的精度矩阵进行估计;第二,系统综述了成分数据网络推断方法,从相关网络、条件相关网络和差异网络推断三个角度进行综述;第三,提出了基于成分数据建模的单细胞聚类算法scDMFK,在成分数据建模基础上,对数据采用自编码器进行的非线性降维,在低维空间上进行聚类;第四,将深度学习与单细胞数据统计建模相结合,开发了一系列单细胞数据分析方法,包括数据填补scSDAE、单细胞聚类scziDesk,scCTClust和单细胞标注算法scAnCluster, scSemiCluster, scNAME, scMRA。此外,受单细胞数据分析的启发,我们还对相关的机器学习方法进行了研究,比如迁移学习方法、图神经网络和卷积神经网络的统计理解等等。..在本项目的支持下,整体研究按照原计划执行,主要围绕成分数据网络推断方法开展研究,发表22篇项目标注论文,其中SCI杂志论文16篇、EI会议论文6篇,培养博士研究生6名,参与课题研究生12名. 达到了项目预期目标。.
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
跨社交网络用户对齐技术综述
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
成分数据多元分析中的理论方法研究
贝叶斯数据分析方法在聚变诊断中的应用和集成数据分析
多元空间数据的模式分析方法研究及其在测量中的应用
纵向数据分析中的有效统计推断方法及其应用