Although accurate glomerular filtration rate (GFR) is crucial for clinical diagnosis and treatment of chronic kidney disease, the evaluation efficiency (such as deviation, accuracy and accuracy) of GFR model established 5 years ago remained unimproved since the new CKD-EPI equation on NEJM in 2012, Recently, by assembling learning technology in the pre-test stage, we established a new prediction model with improved accuracy and decreased bias than those of traditional regression model. It is suggested that the machine learning method can handle multiple collinearity and interaction between data well, and has advantages in the field of GFR prediction. In this proposal, we are interested to explore if prediction accuracy could further reach to around 93%, which then could substitute the golden standard method as plasma iohexol clearance assay with equal specificity and sensitivity. Non selective computer derived multimodal medical data group on the basis of progressive sampling and effective filter criteria, the development of automatic search algorithm and modeling algorithm to enhance and strengthen the model based on the model of hyper parameters, the use of cluster computing to establish and optimize the prediction model of glomerular the filtration rate, then the validation group data into a new GFR prediction model to forecast performance to judge. This project is expected to successfully develop a new GFR prediction model which is better than the CKD-EPI equation modeling method in 2012. The prediction accuracy reachies 93% level and can guide patients more rational use of drugs as well as reducing the burden of patients.
精确的肾小球滤过率(GFR)对慢性肾脏病病人的临床分级诊治非常重要。2012年Levey教授在NEJM上发表新CKD-EPI方程后,近5年GFR模型的评估效能(偏差、精确度和准确性)并没有再提高。申报人在GFR新模型预试验中利用集成学习技术建立模型,结果显示集成学习的模型在偏差和准确性方面一致性优于传统回归模型。提示机器学习方法能很好处理数据间多重共线性及交互作用,在GFR预测领域有优势。在本课题,我们拟用碘海醇血浆清除率作为GFR检测的金标准,利用计算机非选择性导出多模态医疗数据,研发机器学习算法集成框架,自动搜索建模算法和算法超参数,能自动建立和优化肾小球滤过率预测模型,再将验证组数据导入新GFR预测模型,以判断预测效能。本项目有望成功开发出评估效能全面优于2012年CKD-EPI方程建模方法开发出的新GFR预测模型,预测30%准确性达到93%水平,可指导病人更合理用药,减轻病人负担。
研究工作尚顺利,主要在机器学习建立肾小球滤过率模型方面。2012年1月至2016年6月,参与者来自中山大学第三附属医院。排除年龄 < 18岁,肾功能不稳定,.服用甲氧苄啶或西咪替丁,或接受透析治疗的患者。在最终登记的1952名参与者中,2012年1月至2014年12月的1075名参与者(55.07%)被指定为发展数据,而2015年1月至2016年6月的877名参与者(44.93%)被指定为内部验证数据。我们总共建立了3个广义受体估计模型: 一个4变量修正的 CKD-EPI (慢性肾脏病流行病学协作)方程(标准化的血清肌酐和胱抑素 c,年龄和性别) ,一个9变量修正的CKD-EPI方程(附加的辅助变量: 身体质量指数,尿素氮,白蛋白,尿酸和血红蛋白) ,和一个9变量的 ANN(人工神经网络)模型。结果: 与四变量方程相比,九变量方程在内部验证数据处理中不能取得较好的效果差值: 5.00[3.82,6.54] vs 4.67[3.55,5.90] ,p = 0.5; 四分位偏差:18.91[17.43,20.48] vs 20.11[1 < a[18.46,21.80] ,p = 0.05; p30:76.6% [73.7% ,79.5% ] vs 75.8% [72.9% ,78.6% ] ,p = 0.4] ,但9变量ANN模型显著提高偏倚和 p30准确率差值: 2.77[1.82,4.10] ,p = 0.007; iqr: 1933[17.77,21.17] ,p = 0.3;P30:80.0% [77.4% ,82.7% ] ,p < 0.001). 结论: 利用ANN等复杂的非线性模型可以充分利用自变量的预测能力,最终得到一个较优的GFR估计模型。代表性论文发表在J Transl Med。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于LASSO-SVMR模型城市生活需水量的预测
基于SSVEP 直接脑控机器人方向和速度研究
基于多模态信息特征融合的犯罪预测算法研究
坚果破壳取仁与包装生产线控制系统设计
基于人工神经网络的肾小球滤过率预测模型研究
基于多模态医疗数据的病人相似度的建模与学习
基于深度学习的多源多模态城市大数据融合建模
基于多模态长周期数据的学习障碍模型研究