成分数据分析方法及其在宏基因组数据中的应用

基本信息
批准号:31871342
项目类别:面上项目
资助金额:59.00
负责人:邓明华
学科分类:
依托单位:北京大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:吴昌晶,高玉娟,王伟楠,何顺,迟未来,罗霄
关键词:
成分数据微生物网络构建宏基因组分析
结项摘要

Based on high-throughput sequencing technology, metagomics directly sequences the microbiome in human gut, skin and environment like earth and atmosphere, hope to find their effecst to human health and crop's production. This proposal will focus on the compositionality of microbial data, develop new statistical model and algorithm for compositional data, aim to develop new tools for metagonomic data analysis. The proposal will estimate the relative abundance of each microbial species, infer the interaction network among microbial species, and build the association of phenotypical traits such as desease status with microbial communities, which will help the research of further functional analysis.

借助于高通量测序技术,宏基因组学直接对人体肠道、皮肤和环境中的微生物进行测序,希望通过数据分析来研究其对人类健康和作物产量的影响。本项目将围绕宏基因组数据的成分性特点,建立针对成分数据的统计模型和算法,开发新的宏基因组数据分析工具。项目将对微生物成分的丰度进行估计,开发新的网络推断算法,并建立微生物群落和疾病状态等性状的关联模型,为相关功能分析奠定基础。

项目摘要

成分数据最大的特点是各分量总和为定值,宏基因组测序数据就是一个典型的成分数据。高通量转录组测序RNA-seq 数据本质上说也是成分数据。本项目将建立针对成分数据的统计模型和算法,开发新的成分数据分析工具。..项目执行过程中,我们开展了如下研究工作:第一,开发了三个成分数据网络推断方法,包括CDTrace, CDTr和Codaloss,基于对成分数据的对数正态分布建模,这些推断算法针对对数正态模型的精度矩阵进行估计;第二,系统综述了成分数据网络推断方法,从相关网络、条件相关网络和差异网络推断三个角度进行综述;第三,提出了基于成分数据建模的单细胞聚类算法scDMFK,在成分数据建模基础上,对数据采用自编码器进行的非线性降维,在低维空间上进行聚类;第四,将深度学习与单细胞数据统计建模相结合,开发了一系列单细胞数据分析方法,包括数据填补scSDAE、单细胞聚类scziDesk,scCTClust和单细胞标注算法scAnCluster, scSemiCluster, scNAME, scMRA。此外,受单细胞数据分析的启发,我们还对相关的机器学习方法进行了研究,比如迁移学习方法、图神经网络和卷积神经网络的统计理解等等。..在本项目的支持下,整体研究按照原计划执行,主要围绕成分数据网络推断方法开展研究,发表22篇项目标注论文,其中SCI杂志论文16篇、EI会议论文6篇,培养博士研究生6名,参与课题研究生12名. 达到了项目预期目标。.

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018

邓明华的其他基金

批准号:10871009
批准年份:2008
资助金额:24.00
项目类别:面上项目
批准号:31560556
批准年份:2015
资助金额:42.00
项目类别:地区科学基金项目
批准号:31160394
批准年份:2011
资助金额:47.00
项目类别:地区科学基金项目
批准号:31760575
批准年份:2017
资助金额:38.00
项目类别:地区科学基金项目
批准号:31471246
批准年份:2014
资助金额:70.00
项目类别:面上项目
批准号:12126305
批准年份:2021
资助金额:20.00
项目类别:数学天元基金项目
批准号:31171262
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:30570425
批准年份:2005
资助金额:28.00
项目类别:面上项目

相似国自然基金

1

成分数据多元分析中的理论方法研究

批准号:70371007
批准年份:2003
负责人:王惠文
学科分类:G0104
资助金额:14.00
项目类别:面上项目
2

贝叶斯数据分析方法在聚变诊断中的应用和集成数据分析

批准号:11605047
批准年份:2016
负责人:李栋
学科分类:A2903
资助金额:28.00
项目类别:青年科学基金项目
3

多元空间数据的模式分析方法研究及其在测量中的应用

批准号:41074003
批准年份:2010
负责人:靳奉祥
学科分类:D0401
资助金额:45.00
项目类别:面上项目
4

纵向数据分析中的有效统计推断方法及其应用

批准号:11271347
批准年份:2012
负责人:张伟平
学科分类:A0403
资助金额:50.00
项目类别:面上项目