It would have more accurate predictive performance for early diagnosis and prognosis prediction for various disease with multi-modality data collected from multiple time points. The current dels just utilize the cross-sectional information, which lose the relevant information between multiple time points and further result in the unsatisfactory predictive performance. Therefore, in this project, we aim to analyze the multi-modality data from multiple time points by novel deep neural network, which mainly establishes the predictive model with multi-modality data from multiple time points and illustrates the potential mechanism. In our project, the following several critical questions would be addressed: to establish adaptive deep neural network in order to automatically identify the number of hidden layers and nodes for each layer, to develop unsupervised deep neural network and parameter optimization n algorithms from each layer, especially for time series data, biomarker selection and validation, parallel computation for deep neural network. In order to illustrate its advantage in clinical practice, we would apply this algorithm to monitor the recurrence for ovarian cancer patients based on multi-source data at different time points. We would obtain cfDNA, proteomics and metabolomics to establish the predictive models for monitoring the ovarian cancer.
通过分析医学多时间点多来源的高维组学数据,可以确定各种标志物及其变化过程,更准确地对疾病进行早期诊断和预后预测。目前的预测模型,主要使用横断面数据直接拟合模型,通常难以达到预期的效果。为此,本项目针对DNA和RNA等不同来源多个时间点的数据,提出新型的深度神经网络模型和算法,主要解决多时间点不同数据的分级特征提取问题,通过数据特征进行描述和预测。研究的主要问题:实现自适应深度神经网络结构(确定隐藏层数和节点的策略)、非监督深度学习算法、各隐藏层特征的提取方法、时间序列特征提取问题、各隐藏层网络参数的优化算法、标志物筛选方法、深度神经网络并行计算。实际应用问题以目前国际上研究热点的卵巢癌术后病人为观测对象,获取其术前术后7个时间点血浆中游离的ctDNA测序(核苷酸突变和甲基化变化)、蛋白、代谢和临床信息等监测数据,运用上述模型和数据分析方法建立复发进展预测模型,并通过前瞻性研究进行验证。
本研究的主要内容:构建医学多模态数据的自适应深度神经网络模型、探索深度学习求出全局最优解相关方法、研究不同情况下的多种非监督学习算法、处理动态数据将多个时间点数据整合分析、对模型中筛选出的特征进行逆运算筛选生物标志物、优化深度学习并行计算算法参数、建立复发性卵巢癌预测模型等。本研究给出自适应的深度神经网络模型算法,解决了深度神经网络中的网络层数、模型类型和数量等有效参数的自动选择问题;并提出了适合于肿瘤预测的深度神经网络结构,可以针对DNA、miRNA、甲基化、蛋白质、代谢组、病例文本、影像学、病理学等数据,结合生物学和深度模型的理论给出几种自动提取数据特征的方法,识别出有差异的特征和生物标志物。在复发性卵巢癌的研究和数据分析上,使用DNA、miRNA和甲基化等基线数据,结合不同时间点的血浆蛋白质组和代谢组学等数据,探索深度模型的并行算法(能够人工设置各种参数,同时能够自适应地选择隐藏层的模型和算法),给出预测模型,通过前瞻性研究证实本研究给出的深度神经网络模型能够获得更好的预测结果。最后,建立适合中国北方人群的卵巢癌复发生物标志物监测体系,识别潜在的机制并建立预测模型,并开发软件供临床决策参考。在研究成果方面完成了预期计划,研究期间共发表了8篇相关论文,其中在国际上发表SCI论文4篇,中国核心期刊发表4篇,参加国内学术会议30人次。目前,相关的研究工作继续深入开展,课题组相继在2022年获得国家自然科学基金项目1项、国家重点研发计划1项。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
内点最大化与冗余点控制的小型无人机遥感图像配准
基于多模态信息特征融合的犯罪预测算法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于语义的农业多模态数据深度解析机制研究
基于多模态深度神经网络的人体行为识别技术研究
基于深度学习的文本和语音多模态数据挖掘研究
基于深度学习的多源多模态城市大数据融合建模