中医临床队列研究中缺失数据的拟合优化路径研究

基本信息
批准号:81703950
项目类别:青年科学基金项目
资助金额:20.00
负责人:吕晓颖
学科分类:
依托单位:中国中医科学院中医临床基础医学研究所
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:苏同生,万兆新,刘岩,刘佳,赵学尧,贾文
关键词:
数据拟合数据缺失中医临床研究疗效评价队列研究
结项摘要

The application of cohort design is more and more popular in the clinical research of TCM, which is based on the individual differentiation of symptoms and signs. This kind of design has a large sample size, a long research period, a high degree of openness, and the presence of confounding factors, which lead to direct or indirect destruction of data integrity. According to the previous study, we found that the problem of missing data can not be solved completely by the strict experimental design and quality control. Traditional data preprocessing methods based on censored data and mean substitution are not suitable for open data. How to fill, fit and predict missing data, so as to truly reflect the clinical efficacy of traditional Chinese medicine has become an urgent problem to be solved. This paper intends to research on TCM treatment of stroke sequela cohort 1661 patients for the construction of the instance database based judgment, through the mechanism of missing data missing data methods, verify the effect of the three step to form the missing data processing path, and compare the MAR mechanism, EM, PMM, PS , and then obtain the processing path for slow TCM clinical cohort study data missing. In order to improve the integrity of the data and statistical test performance, the fitting data approximation in patients with the real world, more accurate and reflect the effect of traditional Chinese medicine, Chinese medicine clinical research support the real world for the future provide a method on.

在以个体化辨证论治为诊疗特点的中医临床科研中,队列设计的应用越来越为广泛。队列设计以样本量大、研究周期长、开放度高,允许偏倚及混杂因素的存在为特点,直接或间接破坏了数据完整性。据本课题组前期研究发现仅依靠严谨的试验设计、质量控制不能完全避免数据缺失。传统以删失、均值替代为主流的数据预处理方法,不适用于开放数据。如何填补、拟合、预测缺失数据,使其真正反映中医的临床疗效成为亟需解决问题。本课题拟以中医药治疗中风病后遗症队列研究1661例患者为基础构建实例数据库,通过数据缺失机制判定、数据缺失方法的选择比较、效果验证三步形成数据缺失处理路径,并比较随机缺失机制下,期望最大化算法、预测均数匹配、倾向评分在不同缺失比例下的适用性。旨在提高数据完整性和统计检验效能,使拟合后数据逼近患者治疗的真实世界,更确切和真实的反映中医药疗效。

项目摘要

背景:在以个体化辨证论治为诊疗特点的中医临床科研中,队列设计的应用越来越广泛。队列设计以样本量大、研究周期长、开放度高,允许偏倚及混杂因素的存在为特点,直接或间接破坏了数据完整性。传统以删失、均值替代为主流的数据预处理方法,不适用于开放数据。如何填补、拟合、预测缺失数据,使其真正反映中医的临床疗效成为亟需解决问题。研究内容和方法:本课题以中医药治疗中风病后遗症队列研究约1700例患者为基础构建实例数据库,通过数据缺失机制判定、数据缺失方法的选择、效果验证三步形成数据缺失处理路径。在模拟集中,以数据类型(连续变量、分类变量)、数据缺失模式进行了分类,比较了MAR、MCAR、MNAR三种数据缺失机制下,均值填补、PMM、EM,三种方法在缺失比例分别为10%、20%、30%时的数据拟合路径的效果,并在实际数据集中进行了验证。结果:①对于任意缺失的连续变量,PMM方法填补的效果为最优;在缺失比例为10%,三种方法填补结果相差不大,且效果均很好。②对于任意缺失的分类变量,EM法在三种机制下表现最优;随着缺失比例增加,三种方法的填补效果随之下降;三种方法在同一比例下,MCAR机制填补效果最好,MAR次之,MNAR较差。③对于单调模式的变量,PMM方法表现最优;其中PMM法在MNAR机制中表现最好,MAR次之,MCAR机制中表现最差。意义:①针对不同的数据情况,制定了相应的数据拟合路径,为后续临床队列研究提供了方法学的支撑,提高了数据完整性和统计检验效能,使拟合后数据逼近患者治疗的真实世界,更确切和真实的反映中医药疗效。②以往队列研究中,为分析数据结果,使用了删失或单一插补的方式来解决数据缺失的问题,浪费了不少样本,本研究通过现代的数据插补方法,提高了样本数据的使用率,在数据缺失率达到20%时,也可以拟合出解近真实情况的数据结果。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

湖北某地新生儿神经管畸形的病例对照研究

湖北某地新生儿神经管畸形的病例对照研究

DOI:
发表时间:2019
5

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021

吕晓颖的其他基金

相似国自然基金

1

基于时空关联规则的中医临床路径诊疗方案优化研究

批准号:81102666
批准年份:2011
负责人:王连心
学科分类:H3121
资助金额:24.00
项目类别:青年科学基金项目
2

采用倾向性评分法研究适合中医临床大样本观察性数据混杂因素分析的路径

批准号:81202776
批准年份:2012
负责人:廖星
学科分类:H3121
资助金额:23.00
项目类别:青年科学基金项目
3

基于临床实际数据确定中医临床评价靶人群和疗效指标的富集方法研究

批准号:81303149
批准年份:2013
负责人:闫世艳
学科分类:H3303
资助金额:23.00
项目类别:青年科学基金项目
4

基于优化PS和工具变量法控制临床数据混杂因素的AIDS中医疗效再评价方法研究

批准号:81803953
批准年份:2018
负责人:金艳涛
学科分类:H3303
资助金额:21.00
项目类别:青年科学基金项目