跨组学交互网络回归模型的构建及其统计推断方法研究

基本信息
批准号:81673272
项目类别:面上项目
资助金额:50.00
负责人:袁中尚
学科分类:
依托单位:山东大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:李辰生,刘言训,季加东,王宇芃,李雨霏,王停停,于媛媛
关键词:
复杂疾病统计推断跨组学交互网络网络回归模型
结项摘要

With the advanced high-throughput -omic platforms, the globolomics that affecting the disease occurrence, development and prognosis has been mapped onto biomolecule network locating on the continuum DNA→RNA→Protein→Metabolite→Complex phenotype. It has become one hot topic to integrate multi-omics biomarkers to infer the effect of cross-omics interaction network. This project firstly proposed the theory framework for constructing cross-omics network regression model, developed the fixed effect model for undirected network by representing the edge utilizing the product moment of its connected nodes, and constructed the corresponding mixed effect model using the covariance information. Then, based on the moral graph theory, we have transformed the directed network into undirected ones holding the direction information simultaneously, and constructed the fixed and mixed effect model for directed network respectively. Various simulations are conducted to assess the unbiasedness and efficiency of the parameter estimator, the stability and power for the developed statistics, and the theoretical distribution has also been derived. Furthermore, one cross-omics real data set for colorectal cancer has been analyzed. It is expected that this project can provide the methods for regression model of cross-omics interaction network, riched the cross-omics network biology theory and to provide the efficient tools for cross-omics biomedicine research.

高通量组学技术的发展与成熟,实现了将影响疾病发生、发展与转归的全组学标记映射到沿DNA→RNA→蛋白质→代谢物→复杂表型这一连续统上的分子网络中,对多层面组学标记交叉整合,在人群中推断跨组学交互致病网络及其效应,已成为研究热点。本项目提出了跨组学交互网络回归模型的理论框架,以网络节点间的积矩项表征边向量,构建无向网络/通路固定效应模型;基于节点效应和边效应的协方差信息,构建无向网络/通路混合效应模型;进而,依据道义图(moral graph)原理,将有向网络转化成无向网络,并保留原有向网络蕴含的方向信息,构建有向网络/通路固定和混合效应模型。统计模拟评价效应估计的无偏性和有效性、统计量的稳定性、检验效能和优劣性,理论证明其渐进分布,实例分析结直肠癌跨组学数据验证其实用性,以期构建跨组学交互网络回归模型及其统计推断方法,丰富和发展跨组学网络生物学理论,为跨组学生物医学研究提供高效的分析方法。

项目摘要

高通量组学技术的发展与成熟,实现了将影响疾病发生、发展与转归的全组学标记映射到沿DNA→RNA→蛋白质→代谢物→复杂表型这一连续统上的分子网络中,对多层面组学标记交叉整合,在人群中推断跨组学交互致病网络及其效应,已成为研究热点。本项目提出了跨组学交互网络回归模型的理论框架,针对生物网络间的差异囊括 “节点”、“边”和“方向”的共变特征,构建“跨组学交互网络回归模型及其统计推断方法体系”,主要完成以下5项工作:1) 构建了跨组学无向网络(及特定通路)差异比较的统计检验与回归预测模型, 首先引入点互信息测量两个网络节点之间的连接强度,进而构建了基于互信息的组学交互无向网络回归模型. 此外,提出了一种基于联合密度估计的高维网络差异分析方法并将其应用于构建疾病的回归预测模型。2)构建了特定链式通路差异比较及其效应识别的统计模型,构建了新型卡方统计量来检测链式通路的组间差异,该统计量融入网络结构信息,同时抓住了点与边的变化。进一步将最大相关系数与图论中的K最短路径算法整合,提出了“MCC-SP”模型,实现了从遗传变异到疾病的潜在路径效应排序和识别,同时,提出了路径重要性评分这一新度量来表征通路重要性。3)构建了有向网络差异比较的检验统计量,实现了同时检验网络中节点效应、边效应及其方向效应的差异。4)在因果孟德尔随机化网络框架下,基于联合似然理论,构建跨组学数据整合的全转录组关联分析(TWAS)新型PMR-Egger模型,不仅能控制SNP间LD关系而且能矫正水平多效性。PMR-Egger考虑多个相关工具变量,实现了在水平多效性存在时,检验基因表达对性状的因果效应。进一步,考虑到很多复杂性状往往具有共同的遗传基础,且对多性状联合分析可以充分利用性状之间的相关性,势必可以提高TWAS的检验效能,将PMR-Egger方法推广到多性状情形,提出了多性状TWAS新型moPMR-Egger模型。5)成果推广与应用:应用所构建的模型用于国际公开数据库以及山东省大型健康管理纵向监测队列的生物医学实际数据分析,以验证模型的实用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
4

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

相似国自然基金

1

随机系数自回归模型的统计推断

批准号:11571138
批准年份:2015
负责人:赵志文
学科分类:A0402
资助金额:55.00
项目类别:面上项目
2

基于复杂数据的回归模型统计推断及其应用

批准号:11501005
批准年份:2015
负责人:杨文志
学科分类:A0402
资助金额:18.00
项目类别:青年科学基金项目
3

相依数据下自回归模型的稳健统计推断及其应用

批准号:11701005
批准年份:2017
负责人:王星惠
学科分类:A0402
资助金额:25.00
项目类别:青年科学基金项目
4

全基因组关联分析中基因-基因交互网络比较的统计推断方法研究

批准号:31200994
批准年份:2012
负责人:袁中尚
学科分类:C0609
资助金额:20.00
项目类别:青年科学基金项目