影像遗传学中海量数据挖掘算法研究及其在老年痴呆症中的应用

基本信息
批准号:61602384
项目类别:青年科学基金项目
资助金额:20.00
负责人:杜磊
学科分类:
依托单位:西北工业大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:黄恒,刘欢,李晓,彭博,王丽婷
关键词:
生物信息学计算生物学疾病研究基因组学
结项摘要

Brain Imaging Genetics is an emerging area of bioinformatics study which intends to uncover the correlation between the brain imaging and the genetic markers. It aims to find out the cause of diseases that is related to the brain. The existing methods have so many parameters that they are very computation intensive and cannot handle data with very high dimensional. Their time consumption increases significantly when the dimension goes very high. Therefore, an important challenge in brain imaging genetics is to discover genes that are related to the targeted brain imaging with efficiency and effectiveness. The Alzheimer's disease is a chronic neurodegenerative disease where the brain is severely impaired, which accounts for about 60%~70% of the dementia. The previous works show that brain imaging genetics certainly can discover genes that are related to the Alzheimer's disease. This project will employ two strategies to address how to mining massive datasets in brain imaging genetics. The first one is based the MapReduce framework and the second one uses the online learning data stream mining techniques. The proposed methods will overcome the drawbacks, especially the time consumption, of the existing methods, which could be the most efficient methods in brain imaging genetics. Simultaneously, we will apply the proposed massive data mining methods to the Alzheimer's disease database, and intend to find out those genes that are correlated to the targeted brain imaging of Alzheimer's disease.

影像遗传学是近年新兴的一个热门研究领域,它旨在发现基因与大脑影像之间的关系,期望从遗传学的角度解释大脑有关疾病的成因。现有的研究方法参数过多,时间效率低下,能够处理的数据维度非常有限。当数据的维度上升到成千上万量级时,这些方法的时间复杂度显著上升。如何高效地在海量基因数据中发现与病变影像有关的基因,是影像遗传学当前面临的一个难点。老年痴呆症是大脑严重受损的一种病症,它占据了与大脑痴呆有关疾病的60%~70%。前期的研究工作验证了影像遗传学方法在发现老年痴呆症的致病机理中的作用。本课题将利用海量数据挖掘中的MapReduce框架和在线数据流属性选择技术,从两方面开发影像遗传学中的海量数据挖掘算法,克服现有影像遗传学方法时间效率低下的缺点,为高效的分析生物信息学数据提供技术保障。与此同时,将影像遗传学海量数据挖掘算法应用于老年痴呆症的研究,为高效分析老年痴呆症遗传学因素提供技术支撑。

项目摘要

脑影像遗传学是脑科学一个热门研究领域。它通过发现基因与大脑影像之间的关系来解释脑疾病的遗传学成因。现有的研究方法参数多、时间效率低,因此能够处理的数据维度非常有限。当数据的维度达到成千上万量级时,它们的时间复杂度显著上升。本项目研究如何挖掘海量基因数据与脑成像数据之间的关联,并将其应用于老年痴呆症的研究。为了实现这一目标,项目组通过对基因数据内在结构的分析,利用其内在结构和功能上的分组信息,提出了不同的面向海量基因数据的影像遗传学计算方法。首先,项目组提出了一种基于分治法的影像遗传学分析方法,将传统方法的时间效率由指数增长下降到近似线性增长。其次,项目组提出了一种面向多模态脑影像数据的高效影像遗传学计算方法。同样,其时间复杂度从指数增长下降到近似线性增长。再次,针对多时间点的纵向影像遗传学问题,项目组提出了一种时间相关的高效影像遗传学算法。该算法能够识别与时间相关的脑成像和遗传标记物,同时其时间复杂度下降为近似线性增长。另外,我们还将提出的算法应用到了老年痴呆症数据集,结果表明提出的算法在提升了时间效率的同时,保持着优秀的准确率。这证明了提出的面向海量基因数据的影像遗传学计算方法的有效性,可为全基因组水平分析老年痴呆症的成因提供技术支撑。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018
2

湖北某地新生儿神经管畸形的病例对照研究

湖北某地新生儿神经管畸形的病例对照研究

DOI:
发表时间:2019
3

瞬态波位移场计算方法在相控阵声场模拟中的实验验证

瞬态波位移场计算方法在相控阵声场模拟中的实验验证

DOI:
发表时间:2020
4

线粒体自噬的调控分子在不同病生理 过程中的作用机制研究进展

线粒体自噬的调控分子在不同病生理 过程中的作用机制研究进展

DOI:10.3969/j.issn.1007-6948.2019.05.044
发表时间:2019
5

学术型创业企业发展路径探讨

学术型创业企业发展路径探讨

DOI:10.3969/j.issn.1002-5863.2016.15.045
发表时间:2016

杜磊的其他基金

批准号:11501079
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:30872455
批准年份:2008
资助金额:32.00
项目类别:面上项目
批准号:31801489
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:60376023
批准年份:2003
资助金额:20.00
项目类别:面上项目
批准号:81570374
批准年份:2015
资助金额:57.00
项目类别:面上项目
批准号:81270324
批准年份:2012
资助金额:70.00
项目类别:面上项目
批准号:21805064
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:31800041
批准年份:2018
资助金额:28.00
项目类别:青年科学基金项目
批准号:30400439
批准年份:2004
资助金额:21.00
项目类别:青年科学基金项目

相似国自然基金

1

数据驱动的海量遥感影像高效信息挖掘

批准号:91338113
批准年份:2013
负责人:夏桂松
学科分类:F0113
资助金额:80.00
项目类别:重大研究计划
2

图最大化问题的近似算法及其在金融数据挖掘中的应用

批准号:10971162
批准年份:2009
负责人:徐成贤
学科分类:A0406
资助金额:25.00
项目类别:面上项目
3

高复杂性数据挖掘的理论、算法及其在管理学中的应用

批准号:70531030
批准年份:2005
负责人:徐宗本
学科分类:G0112
资助金额:90.00
项目类别:重点项目
4

面向海量移动数据挖掘的过程神经网络算法与应用研究

批准号:60473051
批准年份:2004
负责人:杨冬青
学科分类:F0202
资助金额:23.00
项目类别:面上项目