Robust statistics is an important branch of mathematical statistics, which has stronger ability to resist the influence of outliers and is widely used in medicine, biology, social economy and so on. In recent years, robust statistical inference for semi-parametric models of complex data has become a hot topic for statisticians. This project mainly aims at the longitudinal data and measurement error data in the complex data. Firstly, Huber’s function is introduced into logarithmic likelihood function of semi-parametric mixed effect model of longitudinal data, and robust estimation of parameters is given by EM algorithm. Robust penalty likelihood function is constructed to obtain the robust joint variable selection of non-parametric, fixed effect and random effect. For the semi-parametric model of longitudinal data with measurement errors, a new robust variable selection method is proposed based on deviation correction and robust penalty least squares. Under certain regular conditions, the theoretical properties of the above robust methods are explored, and the effectiveness of the given methods is investigated by numerical simulation. This project extends the robust statistical inference of the linear mixed effect model to the semi-parametric models of longitudinal data and longitudinal data with measurement errors, and provides ideas for the further application of the semi-parametric model.
稳健统计是数理统计的一个重要分支,具有更强的抵抗异常值影响的能力,广泛应用于医学、生物学、社会经济等领域。近年来,对复杂数据半参数模型的稳健统计推断,成为统计学家研究的一大热点。本项目主要针对复杂数据中的纵向数据和测量误差数据,将Huber有界函数引入纵向数据半参数混合效应模型的对数似然函数中,利用EM算法给出参数的稳健估计;从响应变量和协变量两个方面构造稳健的惩罚对数似然函数,寻求非参数、固定效应和随机效应的稳健联合变量选择;对协变量含有测量误差的纵向数据半参数模型,基于偏差校正和稳健惩罚最小二乘,探索一种新的稳健变量选择方法。在一定正则条件下,证明以上稳健估计方法和变量选择方法的理论性质,并利用数值模拟,考察所提方法的有效性。本项目将线性混合效应模型的稳健统计推断推广到纵向数据和带测量误差的纵向数据半参数模型,为半参数模型的进一步应用提供思路。
数据集中常存在异常数据或厚尾误差分布的情况,这对基于最小二乘或似然函数的数据分析方法提出了挑战。半参数模型兼具参数模型的解释性和非参数模型的灵活性,在实际中有广泛应用。本项目的研究主要集中在稳健估计、半参数统计建模和变量选择等方面,具体包括:(1)结合Huber函数,提出了纵向数据非线性混合效应模型的稳健估计,并推导出了稳健情形下个体加权扰动、因变量扰动和随机误差协方差扰动的影响曲率表达式;(2)利用B样条和改进的Cholesky分解,并结合稳健估计思想,建立了半参数混合效应模型的稳健变量选择方法,该方法同时对固定效应和随机效应进行变量选择,且能够抵抗异常值影响;(3)基于改进的Huber损失函数,给出了部分线性模型的一种稳健有效的经验似然推断方法;(4)基于指数平方损失函数,结合矩阵的QR分解技术和二次推断函数,分别得到了纵向数据部分线性变系数模型参数部分和非参数部分稳健有效的极大经验似然估计;(5)基于修正的得分函数,提出了协变量具有正态测量误差的部分线性模型的稳健经验似然推断方法。同时,研究了相关渐近性质和数值计算问题。本项目的研究成果丰富了稳健估计和半参数模型统计推断的理论,也为生物医学、经济学、金融学等领域中实际问题的解决提供了方法上的参考。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
基于半参数模型的纵向数据的稳健统计推断方法
稀疏高维半参数模型的稳健统计推断
复杂多元数据的半参数统计推断
纵向缺失数据下半参数模型的稳健统计推断