带潜变量高维模型的统计推断

基本信息
批准号:11901406
项目类别:青年科学基金项目
资助金额:28.00
负责人:郭文雯
学科分类:
依托单位:首都师范大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
潜变量变量选择高维数据 假设检验
结项摘要

This project aims to carry out in-depth and systematic research on the joint model with latent variables. We focus on providing variable selection and hypothesis testing for high-dimensional regression models with latent variables simultaneously. Little literature are found on this subject, but it is valuable in application. There are three important and difficult problems involved in this project. First, how to estimate the latent variables better. Second, how to measure the distance between the latent variables and the covariates of interest. Here the latent variables may be multi-dimensional, while the covariates is high-dimensional or even ultrahigh-dimensional. Third, for the given measure, how to construct a statistic to make it applicable for high-dimensional problems. The methodology and theoretical results are discussed on these three issues. An efficient estimators of latent varibales are proposed, and using them as responses to select important covariates and hypothesis test. Under high-dimensional setting, we will explore the asymptotic properties of the statistics, and develop algorithms based on R language. Finally, the methods are applied to biological and image data to assess the efficiency. This project provides efficient methods and supports in real data analysis.

本项目拟对带有潜变量的联合模型进行深入、系统的创新性研究,提出对高维含潜变量模型的变量选择和假设检验方法.对这类问题的研究比较少见,但是具有很好的实际应用价值.此问题主要涉及三个重要的难点问题:(1)对含有潜变量的模型,如何将潜变量更好的估计出来; (2)如何衡量潜变量与自变量之间的距离,在这里潜变量的维度可能是多维的,而自变量的维度是高维甚至超高维;(3)对于选定的距离指标,如何构造统计量使其适用于高维问题.本项目将对这三个问题提出新的统计推断方法和理论.首先,针对潜变量的估计提出有效的估计方法,并将得到的潜变量与自变量之间进行变量筛选和假设检验.在高维模型下,探究所提方法的渐近性质,同时开发基于R语言的程序算法.最后,将提出的统计推断方法应用于生物数据、图像数据等实际问题中,为解决与其相关的实际问题提供有效的统计方法和可靠的理论支持.

项目摘要

本项目主要依赖(超)高维数据的统计推断展开。主要包括以下几部分内容:(1)基于RV系数提出含潜变量联合模型的变量选择办法。提出了潜变量估计的EM算法,并在估计的基础上利用RV系数提出了超高维数据分析的变量筛选方法。我们将提出的方法用于探究心理学中两种幸福指数与基因之间的关系。(2)提出了超高维数据部分回归系数的假设检验方法。首先,利用随机切分的思想将假设检验问题进行两步走,极大提高了检验的功效。其次,为了降低单次随机切分的影响,提出多次切分的方法。所提出的方法在零假设下降低了犯一类错误的概率,同时在备择假设下进一步降低了犯二类错误的概率。(3)将函数型判别分析方法应用于高维光谱成像数据分析,极大提高了在物证鉴定领域人血与动物学判别的准确率。(4)提出了多(高)维变量与类别变量之间的独立性指标,并基于此指标提出了高维数据变量筛选和假设检验的方法。(5)针对多样本分布及其特征的一致性问题提出类别加权的方法,该假设检验办法适用于高维数据。(6)提出了含潜变量可加模型的变量筛选及假设检验方法。其中前三部分内容已经以学术论文的形式发表;第四、五部分内容正在审稿;第六部分内容已有初稿,并拟于近期投稿。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
4

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015
5

基于分形维数和支持向量机的串联电弧故障诊断方法

基于分形维数和支持向量机的串联电弧故障诊断方法

DOI:
发表时间:2016

郭文雯的其他基金

相似国自然基金

1

基于潜变量模型对有序分类数据的统计推断

批准号:11601086
批准年份:2016
负责人:林月琼
学科分类:A0403
资助金额:19.00
项目类别:青年科学基金项目
2

高维数据下多因变量回归模型的统计推断

批准号:11401378
批准年份:2014
负责人:罗珊
学科分类:A0403
资助金额:22.00
项目类别:青年科学基金项目
3

高维遗传数据变量间交互作用的统计推断方法研究

批准号:11771072
批准年份:2017
负责人:朱文圣
学科分类:A0402
资助金额:48.00
项目类别:面上项目
4

高维数据的图模型学习与统计推断

批准号:11201479
批准年份:2012
负责人:尹建鑫
学科分类:A0403
资助金额:22.00
项目类别:青年科学基金项目