This project is to develop analyzing methodes and theories for biological and medical data such as high dimensional data, functional data, longitudianl data, missing data and random censoring data, and carry out the interdisciplinary research between statistics and bioscience and medical science. Specifically, we shall investigate the topics on identifiability and transitivity of causal effects among variables on causal paths, and further we shall discuss these of causal effects based on principal stratification. The related statistical inference will be considered. We intend to investigate model selection and model averaging approaches for complex biological data, and establish the optimal model average estimation theory. We shall study optimal designs for complex biological experiments and the related techniques for monitoring data quality. Variable selection, model selection approaches and dimension reduction techniques will be developed to analyze high dimensional data and complex high dimensional data in biology and medical study. We shall investigate functional polynomial regression models by developing model detection techniques. Functional singular component analysis technology will be used to investigate analyzing methods for functional data. Statistical inference approaches and model selection methods will be developed for functional product models. Some statistical methods for longitudinal data under random censorship will be investigated for some semiparametric models.
本项目研究生物医学数据包含高维或超高维数据、函数型数据、纵向数据、缺失数据及随机删失数据统计分析的方法、理论与应用,开展统计学与生物医学交叉研究。具体地,我们探讨生物医学一些重要问题中因果路径上多变量之间的因果作用的可识别性与传递性以及主分层的因果作用的统计推断方法;研究复杂生物数据的模型选择和模型平均方法,建立最优模型平均估计的理论;研究复杂生物试验最优设计与数据质量监控技术;发展变量选择方法、模型选择方法及降维技术分析处理生物、医学研究中高维数据及复杂高维数据;发展模型探测技术,研究函数多项式模型,使用奇异分解方法研究函数型数据的分析方法,使用相对误差准则发展函数乘积模型的统计推断方法与模型选择方法;基于一些半参数模型研究随机删失下纵向数据统计分析的方法。
本项目研究生物数据包含高维或超高维数据、函数型数据、纵向数据、缺失数据及随机删失数据统计分析的方法、理论与应用,开展统计学与生物医学的交叉研究。具体地我们提出了生物医学问题研究中多个替代指标的判断准则,避免“替代悖论”,探索直接间接作用的识别性和直接间接作用的界,研究治疗对不同患者有不同的疗效的因果作用异质性的上下界, 论证了非随机缺失数据机制下正态分布和混合正态分布中参数的可识别性,提出了利用工具变量的方法进行主分层因果作用的评价,研究了各种关联度量的可传递性,提出了发现和确定目标变量的原因和结果的局部因果网络学习的方法;提出了响应变量缺失时不依赖模型的变量筛选方法,这一方法使得任何全数据下的变量筛选方法均可应用到响应变量缺失的情形;对异方差部分线性单指标模型,发展了估计方程方法使之能用于变量选择并同时定义半参数有效估计,所定义的估计被证明具有Oracle性质和有效性;在响应变量缺失时,发展了一种三步估计方法,定义了单指标参数及非参数函数的估计,所提出的估计均被证明是渐近正态的; 对函数多项式模型,我们发展模型探测方法识别出哪些阶重要,哪些阶不重要,从而识别出真模型并且使得模型有好的预报行为,提出了随机分割模型平均方法获得高维线性模型的平稳预报;对广义线性模型和广义线性混合效应模型,基于 Kullback-Leibler 损失提出了频率模型平均估计中权重的选择准则,并在理论上证明了其渐近最优性,从而将主要适用于连续观测数据的最优模型平均理论拓展到了离散分类数据情形;对纵向数据、时间序列数据的模型平均方法研究,提出了删组交叉验证准则选取模型平均估计量中的权重,并证明了其理论最优性,从而解决了组内相关和序列相关给实施模型平均方法带来的困扰;研究了几类复杂生物医学试验和计算机仿真试验的最优设计问题,针对存在紧邻效应和边际效应的一般干扰模型,给出了一致最优设计的等价性定理,系统解决了干扰模型下最优设计的刻画问题;提出了序贯计算机仿真试验中跟随试验的最优设计方法,从理论上证明了这些设计的抽样性质和中心极限定理,解决了个性化医疗试验中剂量响应模型的最优设计的特征刻画,给出了有效的搜索算法。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
拥堵路网交通流均衡分配模型
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
低轨卫星通信信道分配策略
生物医学中的纵向数据的统计分析
生物医学领域中可交换数据的统计分析
统计推断理论和方法及其在生物医学、数据分析与计算等方面的应用
基于机器学习的生物医学大数据挖掘理论与方法研究