整合常见和罕见变异进行肺癌风险预测的统计方法研究

基本信息
批准号:81373102
项目类别:面上项目
资助金额:70.00
负责人:赵杨
学科分类:
依托单位:南京医科大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:翟日洪,胡铃敏,魏永越,吴倩,郁芸,邱永永,张慧,杨晟
关键词:
罕见变异预测常见变异肺癌
结项摘要

The aim of the present study is to develop the research design and statistical methods for the integration of common and rare variants so as to build predictive models for the prediction of lung cancer risk. This study begins with the extreme-phenotype sampling to select samples on the basis of residual. Weighted principal component analysis and retrospective Poisson regression are proposed to screen for rare variants. On the basis of the kernel machine method or principal component analysis, the information of a marker set will be extracted and included in the predictive model so as to absorb the information from both common and rare variants. Interaction terms will also be considered to be included in the model. We will further study on how to include the functional information from the ENCODE project to improve the performance of the model. We will also consider how to include the environmental factors in the model appropriately. The predictive models will be built in a Han Chinese sample and a Caucasian sample so that the effect of ethnicity on the predictive performance can be investigated. The study will propose a research strategy on how to predict the lung cancer risk on the basis of genome-wide association study and next generation sequence data to facilitate the development of corresponding genetic diagnosis products. A software for genomic prediction will also be developed.

本研究将整合常见变异和罕见变异等基因组数据,针对肺癌的发病风险,系统地研究构建预测模型时所需的研究设计和统计分析方法。研究将从极端表型抽样法入手,基于残差选择极端样本;考察加权主成分分析和逆Poisson回归用于罕见变异筛选的效率;基于核机器法或主成分分析,采用合适的汇总统计量,在预测模型中引入位点集,以纳入常见位点和罕见变异的作用,并考虑交互作用,以提高模型的预测精度;整合ENCODE计划数据,探讨如何引入这些功能学信息以提高预测精度;研究还将探讨如何在预测模型中合理地纳入环境暴露变量,并在汉族和高加索人群中进行建模,考察人群结构、种族差异与预测模型的关系。取得的结论将用模拟数据和真实资料进行验证。本研究将对基于全基因组关联性研究及下一代测序资料等高维基因组数据进行疾病预测的研究提出分析策略,便于相关基因诊断产品的开发,并开发进行基因组数据预测的软件包。

项目摘要

本研究针对肺癌、食管癌等肿瘤的发病风险和预后预测,从实验设计、混杂因素控制、变量筛选、多层面数据整合、预测模型建立等多个角度进行研究。研究从极端表型抽样法入手,考察了基于残差的极端表型抽样法;考察了复杂混杂下利用随机森林等机器学习方法的变量筛选问题,提出了一种基于残差的随机森林法,可用于观察性研究获得的高维数据的分析,效果优于现有所有方法,并回答了生物医学大数据分析中是否可以忽视因果只谈关联的问题,同时该方法用于PM2.5暴露受试者的DNA损伤与遗传易感性的关系,发现了一批位于生长发育相关通路上的位点,尤其与耳、心脏等重要器官的发育相关;同时考察了倾向性评分匹配应用中的优缺点;提出了基于限制性似然比的罕见变异及多位点集合检验的方法,可用于定量和二分类的结果变量,与现有其他方法相比,在维持一类错误率基础上,提高了检验效能;提出了基于Bayes框架下的自适应Lasso的快速算法,用于高维数据下的多位点检验,运算速率大大快于现有的MCMC法;针对于非小细胞肺癌的发病风险预测、晚期非小细胞肺癌的预后预测数据,首先说明了整合临床和遗传信息的预测模型优于单纯包含临床信息的模型,再探讨了如何在预测模型中纳入基因组、环境暴露变量、交互作用等信息,以提高预测的精度,同时发现了肺癌遗传易感性中两个与吸烟具有交互作用的位点及一对基因-基因交互作用的位点;考察了如何整合ENCODE 计划数据,以提高变量筛选和预测的效率;同时也考察了如何在关联性分析中整合甲基化、miRNA等多层面信息。本研究开始于全基因组关联性研究数据,结合了罕见变异数据,整合了现代多组学数据,整合参数和非参数方法,进行复杂疾病的发病风险和预后预测研究,也开发了相应的软件便于使用。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
2

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
3

桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究

桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究

DOI:10.5846/stxb202009292521
发表时间:2021
4

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
5

Wnt 信号通路在非小细胞肺癌中的研究进展

Wnt 信号通路在非小细胞肺癌中的研究进展

DOI:
发表时间:2016

赵杨的其他基金

批准号:71403099
批准年份:2014
资助金额:20.00
项目类别:青年科学基金项目
批准号:30901232
批准年份:2009
资助金额:19.00
项目类别:青年科学基金项目
批准号:81202049
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:31460201
批准年份:2014
资助金额:50.00
项目类别:地区科学基金项目
批准号:71901188
批准年份:2019
资助金额:18.00
项目类别:青年科学基金项目
批准号:81772776
批准年份:2017
资助金额:58.00
项目类别:面上项目
批准号:81872709
批准年份:2018
资助金额:25.00
项目类别:面上项目
批准号:81500022
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:81472440
批准年份:2014
资助金额:78.00
项目类别:面上项目

相似国自然基金

1

罕见遗传变异关联性分析的统计方法研究

批准号:81402765
批准年份:2014
负责人:曾平
学科分类:H3011
资助金额:23.00
项目类别:青年科学基金项目
2

MKK7基因编码区罕见遗传变异对人群肺癌发病和预后的影响

批准号:81273149
批准年份:2012
负责人:吕嘉春
学科分类:H3010
资助金额:80.00
项目类别:面上项目
3

常见恶性肿瘤致病位点鉴定与风险预测的队列研究

批准号:81230067
批准年份:2012
负责人:沈洪兵
学科分类:H3010
资助金额:280.00
项目类别:重点项目
4

西太平洋副热带高压活动与变异的动力-统计预测方法研究

批准号:41005025
批准年份:2010
负责人:洪梅
学科分类:D0501
资助金额:18.00
项目类别:青年科学基金项目