整合基因组和表型组数据挖掘遗传病潜在致病变异的方法研究

基本信息
批准号:31701152
项目类别:青年科学基金项目
资助金额:22.00
负责人:卢宇蓝
学科分类:
依托单位:复旦大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:董欣然,杨琳,张萍,刘博,黎籽秀,陈乡
关键词:
表型整合数据整合高通量测序数据遗传病
结项摘要

The detection and annotation of variants are key to the diagnosis and research of genetic disorders, while CNV and SNV analysis are combined with phenotype. However, the combinational analysis of CNV and SNV may not be easy, because the detection of CNV are isolated from SNV since the beginning of experiment procedure as well as data analysis process. We propose a research to study the practical pipeline which could detect both CNV and SNV from the same NGS data and annotate variants of both types integrated with clinical phenotype. The new method would provide a combinational detection and analysis of both CNV and SNV for genetic disease research and study. When established, the pipeline will be tested with a clinical cohort to see whether it would help label potential causal variants and make clinical diagnosis.

对于遗传疾病而言,如何检测变异并评估其致病性是研究和诊断的重点。在针对潜在致病变异研究的过程中,拷贝数变异和单碱基变异的结合分析是遗传分析的关键。但是,由于两种变异的实验检测方法相互隔离,数据的获取和整合分析存在困难。本项目提出,研究从常规的二代测序数据中同时检测拷贝数变异和单碱基变异,并结合样本表型组数据筛选潜在致病变异的新方法。本项目为常规的遗传病研究提供整合性的拷贝数变异和单碱基变异的检测分析,为优化实验和分析流程带来新的方法。新方法建立后,拟在已诊断临床案例中试用,以验证其对遗传疾病诊断率的提升效果。

项目摘要

遗传罕见病的研究和治疗受限于明确的分子诊断,即如何准确检测出致病变异并将变异的基因型关联到具体临床表型。检测的难点在于变异尺度上的复杂性,而针对不同的类型需要用到不同的检测方法以逐步排查。具体到现阶段的遗传罕见病研究上,目前常用方法包括以杂交芯片检测(aCGH,Array Comparative Genomic Hybridization)为代表的拷贝数变异(CNV,Copy Number Variant)检测方法和以高通量短序列测序技术(NGS, Next Generation Sequencing)为代表的单碱基变异(SNV,Single Nucleotide Variant)检测方法。由于两方面的数据结论分别来自不同的检测方法和数据分析流程,因此在数据整合分析上多有不便。考虑到NGS技术已经显现出检测CNV的潜力,建立将CNV和SNV的数据分析统一在同一套高通量测序实验、变异检测分析和表型关联分析之中,实现用一套检测技术和分析流程同时分析CNV和SNV变异,以改善遗传罕见病的研究方法和诊断效率。.本研究目标是建立基于NGS数据结合表型综合分析CNV、SNV的数据处理方法和分析平台。包括:1、完善NGS检测CNV的分析流程;2、结合CNV和SNV进行综合致病性分析应用;3、搭建实用性分析平台和综合数据库。.在项目执行期间,1、项目组以CANOES算法为基础,聚焦了高质量检测区间,改进了X染色体检测方案。在113例aCGH验证数据中,对于大片段致病性CNV的检测阳性预测值为82.6%(95%CI:73%~89%),阴性预测值为56.8%(95%CI:40%~72%)。2、通过将新的CNV检测算法与项目组前期建立的分析流程进行整合,形成了一套完整的从单一实验数据来源,结合患者表型的对CNV和SNV进行整合致病性分析的流程。该流程应用于1090例发育障碍患儿的遗传诊断,获得了41.38%的整体诊断率。3、对于常规CNV分析的难点脊肌萎缩症,开发了使用一般NGS数据检测SMN1、SMN2拷贝数的算法。在104例验证样本中对于SMN1纯合缺失的检测,ROC曲线面积达99.2%,并通过3734例回顾性数据分析,检测到8例SMN1纯合缺失病例、66例杂合缺失携带病例。.本项目新建立的整合性致病变异分析方法,对于遗传罕见病研究中的变异挖掘、提升临床诊断效率展现出重要应用潜力。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021
4

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
5

混采地震数据高效高精度分离处理方法研究进展

混采地震数据高效高精度分离处理方法研究进展

DOI:10.3969/j.issn.1000-1441.2020.05.004
发表时间:2020

卢宇蓝的其他基金

相似国自然基金

1

基于全基因组数据的致病SNP位点挖掘

批准号:61662028
批准年份:2016
负责人:丁小军
学科分类:F0213
资助金额:40.00
项目类别:地区科学基金项目
2

基于GWAS数据整合的致病表型识别与分析方法研究

批准号:61871160
批准年份:2018
负责人:程亮
学科分类:F0124
资助金额:63.00
项目类别:面上项目
3

微生物组大数据整合与数据挖掘方法研究

批准号:31671374
批准年份:2016
负责人:宁康
学科分类:C0608
资助金额:60.00
项目类别:面上项目
4

基于表观基因组与转录组数据的整合挖掘以及基因调控网络的动态解析构建棉花基因组结构与功能注释体系

批准号:31571360
批准年份:2015
负责人:苏震
学科分类:C0608
资助金额:60.00
项目类别:面上项目