本项目致力于给出高维数据下的半参数回归模型的稳健统计推断和变量选择方法,从而解决经济、医学和生物等领域的高维数据分析问题。高维半参数模型的统计分析通常要考虑参数个数发散的情形,有时甚至参数个数是样本个数的多项式级或指数级,此时我们考虑以分位数回归及其加权或组合形式为估计方法的统计推断问题,同时以收缩估计方法为变量选择方法来实现降维。我们拟研究两大类半参数模型,部分线性模型和单指标模型,它们以不同方式避免了维数祸根的影响,对于不同问题给出了更加灵活处理数据的解决途径。它们的衍生模型还包括如部分线性可加模型,部分线性多任务模型,部分线性单指标模型等。本项目的研究可以更准确的刻画高维数据之间的回归关系,提高数据分析结果的可靠性,丰富惩罚类变量选择方法体系,同时也为在生物统计等领域中的应用提供理论基础。
本项目主要考察了高维数据下的半参数回归模型的稳健统计推断和变量选择问题,提出了新方法,系统研究了渐近理论性质,并做了大量的模拟和实例分析来考察有限样本下方法的表现,完成了项目预期任务。首先,围绕各种复杂数据如多分枝数据和区间删失数据,利用收缩估计方法讨论了高维广义线性模型的变量选择问题,给出了参数估计的Oracle性质,这表明有效的解决了变量选择问题,同时也给出了具有模型选择相合性的调节参数选择方法,其中数据维数包括参数个数发散的情形和指数级情形。通过这些工作系统研究了收缩估计方法及其理论性质。其次,讨论了生存数据下部分线性单指标模型的稳健估计,给出了参数和非参数估计的渐近性质。进一步,利用收缩估计方法讨论了部分线性单指标等半参数模型的变量选择问题,给出了参数分量估计的Oracle性质。随着研究的深入,借助于分组收缩估计方法研究了变系数部分线性模型中,变系数函数是否为常数的判断问题,并证明了这种判断的渐近优良性。最后,对于参数个数发散情形下的部分线性模型,给出了参数是否满足某种线性约束的似然比检验。汇总以上工作,本项目系统研究了高维半参数模型的统计推断相关问题,丰富了高维数据分析理论体系,对实际应用具有一定指导意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
珠江口生物中多氯萘、六氯丁二烯和五氯苯酚的含量水平和分布特征
向日葵种质资源苗期抗旱性鉴定及抗旱指标筛选
一种基于多层设计空间缩减策略的近似高维优化方法
复杂系统科学研究进展
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
复杂数据半参数模型的稳健统计推断研究
基于半参数模型的纵向数据的稳健统计推断方法
高维统计模型中的稳健推断及其应用
超高维半参数回归模型的统计推断