Estimation and testing of treatment effects is one of the fundamental problems in statistical research, and it has wide applications in medical research. In recent years, as the volume of medical data increases rapidly, current statistical methods encounter considerable challenges, whereas there are various emerging problems and opportunities in this area. This program aims to conduct innovative research on efficient estimation and testing of average treatment effects and survival treatment effects, and exploring heterogeneity of survival treatment effects using medical big data. To accomplish this, this program will combine the methods and theories of semiparametric statistics, machine learning, causal inference, and high-dimensional statistics, to build new methodological framework and solid theoretical foundations for this area.
处理效应的估计和检验是统计研究的一个根本问题,并在医学等领域有着广泛应用。近年来,随着医疗数据的规模迅速增大,现有的统计方法受到很大挑战,同时该领域有着很多亟待解决的难题与新机遇。本项目结合半参数统计、机器学习、因果推断、高维统计等方法与理论,对“平均处理效应的有效估计与高功效检验”、“平均生存处理效应的高精度推断”以及“利用医疗大数据对异质性生存处理效应进行精确推断”等问题进行深入的创新性研究,拟为处理效应统计推断与医疗大数据的有机结合提供新的方法框架和坚实的理论依据。
本项目研究处理效应的统计推断问题。处理效应是统计研究的一个基本问题,是医学、社会科学、计算机等诸多领域评价方案有效性的基本度量。随着时代发展,数据类型和结构变得越来越丰富和复杂,存在着数据部分缺失、数据带有噪声、数据具有高维度等挑战,从而需要发展新方法解决复杂数据下的处理效应统计推断问题。本项目主要研究为(1)研究了在随机对照试验下基于经验似然加权的平均处理效应估计与推断问题,提出了具有多重稳健性和半参数有效性的新方法,并解决了部分数据缺失的问题;(2)将该方法推广到高维度协变量的情形,运用惩罚回归以及非参数机器学习方法取代参数回归模型,通过数据分割手段克服了机器学习难以进行统计推断的难点,证明了新方法的渐进正态性以及半参数有效性;(3)在加法风险模型下提出了数据带有测量误差的平均生存处理效应估计方法,发展了因果中介效应识别结果,将平均生存处理效应分解为对应多条通路的直接效应和间接效应;(4)在逆概率加权框架下提出对具有测量误差的纵向数据的平均处理效应估计方法,论证了该方法相比以往方法具有相合性以及较弱模型假设等优点。本项目在Statistics in Medicine, Statistics and Its Interface, Communications in Statistics-Simulation and Computation等统计SCI期刊上共发表和接受受本项目支持的标注论文4篇。本项目以统计方法研究工作为主,并运用实际数据进行实证分析和应用,其中多数论文都公开了代码供用户使用。本项目所研究并提出的方法具有一定应用前景,为现代复杂数据的处理效应统计推断问题提供了一些有用的解决方案。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
特斯拉涡轮机运行性能研究综述
截面相依数据的处理效应估计与推断:理论与应用
多元分布的统计推断理论与应用
线性模型统计推断的理论与方法
因果推断的统计方法