The number of Chinese patients with chronic disease is continually growing in recent years. One of the effective way to reduce the risk of the disease is to identify the causal disease phenotypes. To this end, current studies used Mendelian randomisation (MR) method to estimate the causal influence a phenotype on the risk of disease by integrating Genome-wide association study (GWAS) data of phenotype and disease. However, statistical analysis with nonstandard pattern and the inability to identify the risk of disease under multiple phenotypes limits the researchers to mine more useful causal effect. Therefore, we will design a strategy based on MR method for analyzing the causal influence a phenotype on the risk of disease, and design a novel statistical model to analysis the risk of disease under multiple phenotypes by extending the hypothesis of MR. To improve the efficiency and reduce the costs, we will design a method using random walk for predicting novel causal effect to direct the researchers to conduct experiments for analysis the casual disease phenotypes. Facing the fact that China is a high-risk country with high Diabetes occurrence rate, we will experimentally validate the predicted the casual phenotypes of Diabetes. The completion of this project will guide the selection candidate phenotypes for further experimental validation, and laid the foundation for uncovering the mechanism and helping for the prevention of chronic disease.
近年来,我国慢性疾病患者持续增多,识别其致病表型有利于延缓甚至降低疾病的发生。当前,基于孟德尔随机化(Mendelian randomisation, MR)方法整合表型及疾病的GWAS数据,是统计单个表型致病风险的主要途径。然而,现有的研究存在统计分析方式不规范、无法统计多表型共同作用下的致病风险等问题。因此,拟规划单表型致病性统计分析策略,规范基于MR的统计分析思路;扩展MR假设,探索多表型致病性分析理论,并设计适用于多表型致病风险评估的统计模型。统计分析需要的GWAS数据离不开实验,为了指导研究人员进行有针对性的实验,以提高效率、缩减成本,拟设计基于随机游走的致病表型预测方法,挖掘潜在的致病表型。针对我国是糖尿病高发大国这一国情,拟对预测的糖尿病致病表型进行临床观测及生物实验验证。本项目的完成可为识别及准确地选择慢性疾病的致病表型提供依据,为探索慢性疾病的发病机制及预防措施奠定基础。
近年来,我国慢性疾病患者持续增多,识别其致病表型有利于延缓甚至降低疾病的发生。当前,基于孟德尔随机化(Mendelian randomisation, MR)方法整合表型及疾病的全基因组关联研究(Genome-wide association study, GWAS)数据,是统计单个表型致病风险的主要途径。然而,现有的研究存在统计分析方式不规范、无法统计多表型共同作用下的致病风险等问题。因此,拟规划单表型致病性统计分析策略,规范基于MR的统计分析思路;扩展MR假设,探索多表型致病性分析理论,并设计适用于多表型致病风险评估的统计模型。统计分析需要的GWAS数据离不开实验,为了指导研究人员进行有针对性的实验,以提高效率、缩减成本,拟设计基于随机游走的致病表型预测方法,挖掘潜在的致病表型。本项目可为识别及准确地选择慢性疾病的致病表型提供依据,为探索慢性疾病的发病机制及预防措施奠定基础。经过四年的研究,我们明确了C反应蛋白、肥胖、白介素18是二型糖尿病(Type 2 Diabetes Mellitus, T2DM)的致病因子,婴儿出生身高对T2DM没有致病影响,发现了COVID-19调控的多种细胞因子,预测了T2DM的特征。将疾病系统生物学方法应用在新冠领域,分析了SARS-CoV-2序列的突变规律,构建了COVID-19组织特异性基因特征图谱,分析了阿尔兹海默症(Alzheimer's Disease, AD)与COVID-19之间的潜在遗传关联。将深度学习方法应用于微生物领域,开发了多个微生物表型数据资源——gutMDisorder、gutMGene和microbioTA,在预测微生物与疾病关联方面进行了探索。探索机器学习方法在疾病分子特征方面的应用,开发了lncRNA靶基因关联预测算法、生物医学本体术语之间关联算法和lncRNA标记物识别算法。相关文章以第一通讯作者身份发表在Proceedings of the National Academy of Sciences、Nucleic Acids Research、Bioinformatics等期刊。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于细粒度词表示的命名实体识别研究
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理
利用网络分析方法挖掘基于AD多模态影像表型的GWAS数据
表型与基因型功能关联的数据整合和网络分析方法研究
整合基因组和表型组数据挖掘遗传病潜在致病变异的方法研究
基于生物数据融合的致病microRNA识别方法研究