面向医疗健康大数据分析的高效隐层空间学习方法研究

基本信息
批准号:61673241
项目类别:面上项目
资助金额:63.00
负责人:陈宁
学科分类:
依托单位:清华大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:刘思源,苏航,闵旭,杨煜清,朱丛敏,陈蓓,王子承,刘泽华,顾江邵
关键词:
多样性正则化隐层空间学习医疗健康数据分析贝叶斯学习
结项摘要

In order to effectively analyze and discover useful knowledge from the widely available large-scale healthcare data using latent subspace models designed for pattern discovery, this project aims to address some key basic issues of latent subspace models in the aspects of diversity regularization, learning and inference and scalable algorithms by making use of advanced machine learning and optimization techniques. First, we investigate how to apply diversity regularization on a high dimensional kernel latent subspace models and structured latent subspace models with multi-view and grouping structures, to accomplish long-tail coverage, low complexity and interpretability. Second, in order to quantify uncertainties which are not available in frequentist-style regulariztion latent subspace models, we propose the diversity inducing Bayesian priors in Bayesian latent subspace models and propose to use the truncated variational inference and MCMC sampling techniques for approximate inference in both parametric and nonparametric diversity regularized Bayesian latent subspace models. Third, we propose to develop scalable, parallel optimization algorithms as well as methods of moments that can scale diversity regularized latent subspace models to tens of millions of data samples and large scale models with tens of millions of parameters, to significantly improve the computational efficiency and statistical consistency. Finally, to manipulate the massive complex unstructured healthcare big data, we apply scalable diversity regularized latent subspace models to compuational phenotyping, patient similarity computation, health status forecasting and other applications, with an ultimate goal of effectively promoting the development of new technologies in the field of machine learning and all levels of applications in healthcare analytics.

本项目以医疗大数据的分析与知识挖掘为研究背景,充分利用统计机器学习、优化方法等领域最新研究成果,解决隐层空间模型多样性正则化及高效快速算法。创新点为:(1)提出基于核变换和多视图分组结构隐层空间模型的多样性正则化方法。发现长尾语义及多样化的隐含成份,显著提高模型可解释性并降低模型复杂度;(2)针对频率派正则化隐层空间模型难以量化不确定性等问题,提出贝叶斯隐层空间模型的互夹角偏置先验的多样性正则化、截断变分推理和MCMC采样等近似推理方法,有效解决参数化和非参数化贝叶斯模型的多样性正则化与后验推理等问题;(3)提出多样性隐层空间模型的可扩展并行优化算法及用于参数估计的矩方法,显著提高模型的运行效率且满足统计上的一致性;(4)面向海量复杂非结构化医疗健康大数据,将多样性隐层空间模型用于计算表型、个体相似度、健康状态预测等应用,有效推动机器学习领域内新技术的发展和在医疗健康领域各层次的应用。

项目摘要

针对复杂医疗及生物数据的隐含结构挖掘及聚类预测问题,系统而深入地研究了隐层空间模型的模型表示等问题。包括:(1)针对大规模基因序列数据的聚类问题,提出基于局部敏感哈希(LSH)和非参数化贝叶斯方法(DP-means)的高效聚类方法,是目前生物信息领域处理大规模聚类问题最高效和高准确性的方法之一。(2)提出一种基于分层贝叶斯隐层空间模型的微生物关联网络预测方法,可以有效地处理因为组成成分偏差和测序数据自身的方差所带来的关联推断的准确性问题,同时考虑微生物和环境因素的影响,显著提高在微生物关联和微生物与环境因素关联的预测任务中的准确性和实用性。(3)为了解决深度神经网络处理视频数据时存在的传递性差效率低等问题,本项目利用一种生成机制来获取对抗性图像和视频,将高层次的类丢失和低层次的特征丢失结合起来,共同训练对抗性实例生成器。(4)本项目提出基于注意力机制的深度学习框架,解决数据驱动和循证的急危重病人分类等。在全国心脏大会2017上做特邀报告。获中国计算机学会(CCF)自然科学一等奖(排名第三)2017。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
3

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

特斯拉涡轮机运行性能研究综述

特斯拉涡轮机运行性能研究综述

DOI:10.16507/j.issn.1006-6055.2021.09.006
发表时间:2021

陈宁的其他基金

批准号:61272253
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:61273240
批准年份:2012
资助金额:81.00
项目类别:面上项目
批准号:51608193
批准年份:2016
资助金额:22.00
项目类别:青年科学基金项目
批准号:31571228
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:31101793
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目
批准号:51203095
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:81000162
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:11575176
批准年份:2015
资助金额:56.00
项目类别:面上项目
批准号:61305066
批准年份:2013
资助金额:26.00
项目类别:青年科学基金项目
批准号:81302247
批准年份:2013
资助金额:22.00
项目类别:青年科学基金项目
批准号:81500959
批准年份:2015
资助金额:17.50
项目类别:青年科学基金项目
批准号:61271349
批准年份:2012
资助金额:75.00
项目类别:面上项目
批准号:61074001
批准年份:2010
资助金额:30.00
项目类别:面上项目
批准号:69973033
批准年份:1999
资助金额:12.00
项目类别:面上项目
批准号:81271109
批准年份:2012
资助金额:70.00
项目类别:面上项目
批准号:61673399
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:11272159
批准年份:2012
资助金额:78.00
项目类别:面上项目
批准号:31700373
批准年份:2017
资助金额:26.00
项目类别:青年科学基金项目
批准号:31770053
批准年份:2017
资助金额:62.00
项目类别:面上项目
批准号:81670966
批准年份:2016
资助金额:58.00
项目类别:面上项目
批准号:21702014
批准年份:2017
资助金额:24.00
项目类别:青年科学基金项目
批准号:21905039
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:81870387
批准年份:2018
资助金额:57.00
项目类别:面上项目
批准号:61771196
批准年份:2017
资助金额:62.00
项目类别:面上项目
批准号:51905162
批准年份:2019
资助金额:23.00
项目类别:青年科学基金项目
批准号:69101006
批准年份:1991
资助金额:3.00
项目类别:青年科学基金项目
批准号:41603125
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:31771318
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:60903186
批准年份:2009
资助金额:17.00
项目类别:青年科学基金项目
批准号:81701251
批准年份:2017
资助金额:20.00
项目类别:青年科学基金项目

相似国自然基金

1

医疗与健康的数据分析与决策

批准号:71432004
批准年份:2014
负责人:肖勇波
学科分类:G0110
资助金额:270.50
项目类别:重点项目
2

医疗与健康的数据分析与决策

批准号:71432002
批准年份:2014
负责人:李金林
学科分类:G0110
资助金额:259.00
项目类别:重点项目
3

大数据驱动的智慧医疗健康管理创新

批准号:71532002
批准年份:2015
负责人:张润彤
学科分类:G0203
资助金额:256.00
项目类别:重点项目
4

面向医疗健康大数据的半结构化数据管理关键技术研究

批准号:61702086
批准年份:2017
负责人:毕鑫
学科分类:F0202
资助金额:24.00
项目类别:青年科学基金项目