面向医疗健康大数据分析的高效隐层空间学习方法研究

基本信息

批准号：61673241

项目类别：面上项目

资助金额：63.00

负责人：陈宁

学科分类：

依托单位：清华大学

批准年份：2016

结题年份：2020

起止时间：2017-01-01 - 2020-12-31

项目状态：已结题

项目参与者：刘思源,苏航,闵旭,杨煜清,朱丛敏,陈蓓,王子承,刘泽华,顾江邵

关键词：

多样性正则化隐层空间学习医疗健康数据分析贝叶斯学习

结项摘要

In order to effectively analyze and discover useful knowledge from the widely available large-scale healthcare data using latent subspace models designed for pattern discovery, this project aims to address some key basic issues of latent subspace models in the aspects of diversity regularization, learning and inference and scalable algorithms by making use of advanced machine learning and optimization techniques. First, we investigate how to apply diversity regularization on a high dimensional kernel latent subspace models and structured latent subspace models with multi-view and grouping structures, to accomplish long-tail coverage, low complexity and interpretability. Second, in order to quantify uncertainties which are not available in frequentist-style regulariztion latent subspace models, we propose the diversity inducing Bayesian priors in Bayesian latent subspace models and propose to use the truncated variational inference and MCMC sampling techniques for approximate inference in both parametric and nonparametric diversity regularized Bayesian latent subspace models. Third, we propose to develop scalable, parallel optimization algorithms as well as methods of moments that can scale diversity regularized latent subspace models to tens of millions of data samples and large scale models with tens of millions of parameters, to significantly improve the computational efficiency and statistical consistency. Finally, to manipulate the massive complex unstructured healthcare big data, we apply scalable diversity regularized latent subspace models to compuational phenotyping, patient similarity computation, health status forecasting and other applications, with an ultimate goal of effectively promoting the development of new technologies in the field of machine learning and all levels of applications in healthcare analytics.

本项目以医疗大数据的分析与知识挖掘为研究背景，充分利用统计机器学习、优化方法等领域最新研究成果，解决隐层空间模型多样性正则化及高效快速算法。创新点为:（1）提出基于核变换和多视图分组结构隐层空间模型的多样性正则化方法。发现长尾语义及多样化的隐含成份，显著提高模型可解释性并降低模型复杂度;（2）针对频率派正则化隐层空间模型难以量化不确定性等问题，提出贝叶斯隐层空间模型的互夹角偏置先验的多样性正则化、截断变分推理和MCMC采样等近似推理方法，有效解决参数化和非参数化贝叶斯模型的多样性正则化与后验推理等问题;（3）提出多样性隐层空间模型的可扩展并行优化算法及用于参数估计的矩方法，显著提高模型的运行效率且满足统计上的一致性;（4）面向海量复杂非结构化医疗健康大数据，将多样性隐层空间模型用于计算表型、个体相似度、健康状态预测等应用，有效推动机器学习领域内新技术的发展和在医疗健康领域各层次的应用。

项目摘要

针对复杂医疗及生物数据的隐含结构挖掘及聚类预测问题，系统而深入地研究了隐层空间模型的模型表示等问题。包括：（1）针对大规模基因序列数据的聚类问题，提出基于局部敏感哈希（LSH）和非参数化贝叶斯方法（DP-means）的高效聚类方法，是目前生物信息领域处理大规模聚类问题最高效和高准确性的方法之一。（2）提出一种基于分层贝叶斯隐层空间模型的微生物关联网络预测方法，可以有效地处理因为组成成分偏差和测序数据自身的方差所带来的关联推断的准确性问题，同时考虑微生物和环境因素的影响，显著提高在微生物关联和微生物与环境因素关联的预测任务中的准确性和实用性。（3）为了解决深度神经网络处理视频数据时存在的传递性差效率低等问题，本项目利用一种生成机制来获取对抗性图像和视频，将高层次的类丢失和低层次的特征丢失结合起来，共同训练对抗性实例生成器。（4）本项目提出基于注意力机制的深度学习框架，解决数据驱动和循证的急危重病人分类等。在全国心脏大会2017上做特邀报告。获中国计算机学会（CCF）自然科学一等奖（排名第三）2017。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：10.17521/cjpe.2019.0351

发表时间：2020

DOI：

发表时间：2017

DOI：10.19713/j.cnki.43-1423/u.t20201185

发表时间：2021

DOI：10.16507/j.issn.1006-6055.2021.09.006

发表时间：2021

陈宁的其他基金

批准号：61272253

批准年份：2012

资助金额：80.00

项目类别：面上项目

批准号：61273240

批准年份：2012

资助金额：81.00

项目类别：面上项目

批准号：51608193

批准年份：2016

资助金额：22.00

项目类别：青年科学基金项目

批准号：31571228

批准年份：2015

资助金额：63.00

项目类别：面上项目

批准号：31101793

批准年份：2011

资助金额：22.00

项目类别：青年科学基金项目

批准号：51203095

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：81000162

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

批准号：11575176

批准年份：2015

资助金额：56.00

项目类别：面上项目

批准号：61305066

批准年份：2013

资助金额：26.00

项目类别：青年科学基金项目

批准号：81302247

批准年份：2013

资助金额：22.00

项目类别：青年科学基金项目

批准号：81500959

批准年份：2015

资助金额：17.50

项目类别：青年科学基金项目

批准号：61271349

批准年份：2012

资助金额：75.00

项目类别：面上项目

批准号：61074001

批准年份：2010

资助金额：30.00

项目类别：面上项目

批准号：69973033

批准年份：1999

资助金额：12.00

项目类别：面上项目

批准号：81271109

批准年份：2012

资助金额：70.00

项目类别：面上项目

批准号：61673399

批准年份：2016

资助金额：62.00

项目类别：面上项目

批准号：11272159

批准年份：2012

资助金额：78.00

项目类别：面上项目

批准号：31700373

批准年份：2017

资助金额：26.00

项目类别：青年科学基金项目

批准号：31770053

批准年份：2017

资助金额：62.00

项目类别：面上项目

批准号：81670966

批准年份：2016

资助金额：58.00

项目类别：面上项目

批准号：21702014

批准年份：2017

资助金额：24.00

项目类别：青年科学基金项目

批准号：21905039

批准年份：2019

资助金额：25.00

项目类别：青年科学基金项目

批准号：81870387

批准年份：2018

资助金额：57.00

项目类别：面上项目

批准号：61771196

批准年份：2017

资助金额：62.00

项目类别：面上项目

批准号：51905162

批准年份：2019

资助金额：23.00

项目类别：青年科学基金项目

批准号：69101006

批准年份：1991

资助金额：3.00

项目类别：青年科学基金项目

批准号：41603125

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：31771318

批准年份：2017

资助金额：60.00

项目类别：面上项目

批准号：60903186

批准年份：2009

资助金额：17.00

项目类别：青年科学基金项目

批准号：81701251

批准年份：2017

资助金额：20.00

项目类别：青年科学基金项目

相似国自然基金

医疗与健康的数据分析与决策

批准号：71432004

批准年份：2014

负责人：肖勇波

学科分类：G0110

资助金额：270.50

项目类别：重点项目

医疗与健康的数据分析与决策

批准号：71432002

批准年份：2014

负责人：李金林

学科分类：G0110

资助金额：259.00

项目类别：重点项目

大数据驱动的智慧医疗健康管理创新

批准号：71532002

批准年份：2015

负责人：张润彤

学科分类：G0203

资助金额：256.00

项目类别：重点项目

面向医疗健康大数据的半结构化数据管理关键技术研究

批准号：61702086

批准年份：2017

负责人：毕鑫

学科分类：F0202

资助金额：24.00

项目类别：青年科学基金项目

面向医疗健康大数据分析的高效隐层空间学习方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

玉米叶向值的全基因组关联分析

涡度相关技术及其在陆地生态系统通量研究中的应用

论大数据环境对情报学发展的影响

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

特斯拉涡轮机运行性能研究综述

陈宁的其他基金

二维平面与三维球面对称动力系统模型的构造及其图形化方法研究

基于交通信息时空分析的城市地面公交专用道路资源动态配置方法

桥上公路车辆非定常风荷载及对行车安全性的影响研究

运动干预对衰老性肌萎缩的预防与康复: 细胞自噬功能状态的关键作用与调节机制研究

猪瘟病毒糖蛋白E2高变区对疫苗C株获得性免疫应答影响的研究

可融熔加工聚乙烯醇的合成及结构与性能研究

脂肪及脂肪细胞因子在克罗恩病肠道纤维化中的作用

Higgs物理及相关新物理在LHC及未来对撞机项目上的唯象学研究

基于概率图的判别式关系隐层空间模型研究

盆腔浆液性癌中核因子Nrf2的作用及机制研究

基于恒河猴微栓塞模型研究偏头痛皮层扩散抑制与脑缺血性疾病相关性的机制

基于声信号动力学特性的相似性模型研究及在翻唱歌曲检索中的应用

关联量化系统的参数稳定性分析与优化方法

系统构造混沌动力系统M-J分形图机制研究

羊膜间充质干细胞在骨缺损种植中促进骨再生的作用和机制研究

基于最优梯度曲线的针铁矿沉铁级联过程优化协同控制

分数阶微分代数系统动力学基础研究及应用

半干旱区森林生态系统的双稳态现象及调控机制研究

限铵条件下谷氨酸棒杆菌生产α-酮戊二酸机制的研究

LncRNA H19在羊膜间充质干细胞促进种植体周围骨再生中的作用机制研究

CO2活化的哌啶氨基邻位C-H键官能团化反应机制研究

贻贝启发电响应智能粘附材料的结构设计及性能研究

口腔来源的变异链球菌在炎症性肠病发病中的作用及机制研究

基于多模态信息深度语义融合的个性化音乐推荐模型研究

概率盒不确定复合材料结构-声场耦合系统的微结构拓扑优化方法研究

毫米波回音壁模介质谐振器理论及应用研究

我国降水中129I形态的时空分布及其示踪研究

运动干预对II型糖尿病的预防与治疗：运动诱导的Irisin 对miR-143介导的细胞自噬功能状态在II型糖尿病中的调控作用与机制

基于感知Hash和脆弱水印的数字音频保护模型

丘脑底核电刺激对帕金森大鼠黑质神经元线粒体的保护作用及机制研究

相似国自然基金