Brain Imaging Genetics is an emerging area of bioinformatics study which intends to uncover the correlation between the brain imaging and the genetic markers. It aims to find out the cause of diseases that is related to the brain. The existing methods have so many parameters that they are very computation intensive and cannot handle data with very high dimensional. Their time consumption increases significantly when the dimension goes very high. Therefore, an important challenge in brain imaging genetics is to discover genes that are related to the targeted brain imaging with efficiency and effectiveness. The Alzheimer's disease is a chronic neurodegenerative disease where the brain is severely impaired, which accounts for about 60%~70% of the dementia. The previous works show that brain imaging genetics certainly can discover genes that are related to the Alzheimer's disease. This project will employ two strategies to address how to mining massive datasets in brain imaging genetics. The first one is based the MapReduce framework and the second one uses the online learning data stream mining techniques. The proposed methods will overcome the drawbacks, especially the time consumption, of the existing methods, which could be the most efficient methods in brain imaging genetics. Simultaneously, we will apply the proposed massive data mining methods to the Alzheimer's disease database, and intend to find out those genes that are correlated to the targeted brain imaging of Alzheimer's disease.
影像遗传学是近年新兴的一个热门研究领域,它旨在发现基因与大脑影像之间的关系,期望从遗传学的角度解释大脑有关疾病的成因。现有的研究方法参数过多,时间效率低下,能够处理的数据维度非常有限。当数据的维度上升到成千上万量级时,这些方法的时间复杂度显著上升。如何高效地在海量基因数据中发现与病变影像有关的基因,是影像遗传学当前面临的一个难点。老年痴呆症是大脑严重受损的一种病症,它占据了与大脑痴呆有关疾病的60%~70%。前期的研究工作验证了影像遗传学方法在发现老年痴呆症的致病机理中的作用。本课题将利用海量数据挖掘中的MapReduce框架和在线数据流属性选择技术,从两方面开发影像遗传学中的海量数据挖掘算法,克服现有影像遗传学方法时间效率低下的缺点,为高效的分析生物信息学数据提供技术保障。与此同时,将影像遗传学海量数据挖掘算法应用于老年痴呆症的研究,为高效分析老年痴呆症遗传学因素提供技术支撑。
脑影像遗传学是脑科学一个热门研究领域。它通过发现基因与大脑影像之间的关系来解释脑疾病的遗传学成因。现有的研究方法参数多、时间效率低,因此能够处理的数据维度非常有限。当数据的维度达到成千上万量级时,它们的时间复杂度显著上升。本项目研究如何挖掘海量基因数据与脑成像数据之间的关联,并将其应用于老年痴呆症的研究。为了实现这一目标,项目组通过对基因数据内在结构的分析,利用其内在结构和功能上的分组信息,提出了不同的面向海量基因数据的影像遗传学计算方法。首先,项目组提出了一种基于分治法的影像遗传学分析方法,将传统方法的时间效率由指数增长下降到近似线性增长。其次,项目组提出了一种面向多模态脑影像数据的高效影像遗传学计算方法。同样,其时间复杂度从指数增长下降到近似线性增长。再次,针对多时间点的纵向影像遗传学问题,项目组提出了一种时间相关的高效影像遗传学算法。该算法能够识别与时间相关的脑成像和遗传标记物,同时其时间复杂度下降为近似线性增长。另外,我们还将提出的算法应用到了老年痴呆症数据集,结果表明提出的算法在提升了时间效率的同时,保持着优秀的准确率。这证明了提出的面向海量基因数据的影像遗传学计算方法的有效性,可为全基因组水平分析老年痴呆症的成因提供技术支撑。
{{i.achievement_title}}
数据更新时间:2023-05-31
卫生系统韧性研究概况及其展望
湖北某地新生儿神经管畸形的病例对照研究
瞬态波位移场计算方法在相控阵声场模拟中的实验验证
线粒体自噬的调控分子在不同病生理 过程中的作用机制研究进展
学术型创业企业发展路径探讨
数据驱动的海量遥感影像高效信息挖掘
图最大化问题的近似算法及其在金融数据挖掘中的应用
高复杂性数据挖掘的理论、算法及其在管理学中的应用
面向海量移动数据挖掘的过程神经网络算法与应用研究