非参数模型中的低秩和稀疏结构

基本信息
批准号:11801560
项目类别:青年科学基金项目
资助金额:22.00
负责人:何珂俊
学科分类:
依托单位:中国人民大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:贺诗源,沈诗润,周亚,韩昱
关键词:
变量选择低秩逼近多项式样条函数型主成分高维数据
结项摘要

To overcome the curse of dimensionality, people use the additive structure for non-parametrically modeling the conditional mean and quantile functions. By using sparsity-inducing penalty for variable selection, several authors have developed methods for fitting the additive structure when the number of predictors is very large. However, the finite sample performance of existing methods deteriorates considerably when the number of relevant predictors becomes moderately large. We propose to reduce the number of additive component functions to be estimated using principal components, and generalize this method on generalized additive models and additive quantile regression. To fit the reduced model to the data, we develop a novel algorithm to solve the penalized least loss problem on a rank-constrained manifold with a sparsity-inducing penalty. Our asymptotic theory is trying to show that the resulting estimator has faster convergence rate than estimating without principal component reduction; and this is true even when the reduced model is only an approximation, provided that the approximation error is small. Moreover, we will also prove that the proposed method is able to consistently identify the relevant predictors in the next stage of this proposal. The advantage of the reduced additive models is also illustrated using a simulation study.

在非参数建模当中,研究者经常通过可加结构来避免"维数灾难"。在高维数据下,目前已经有不少工作来提高非参数可加模型的预测效果并识别相关变量。然而,当相关预测变量的数量变得适度大时,现有方法的有限样本性质会显著恶化。本项目提出使用主成分降维的思想来减少待估计的可加分量函数的数量,拟研究一类降维方法用于可加模型,并将其推广到广义可加模型和可加分位数回归模型。结合变量选择的技术,本项目发现这个方法等价于研究非参数模型中的低秩和稀疏并存的结构。为了优化低秩约束下带惩罚项的最小损失函数,本项目通过深入研究增广拉格朗日方法和固定秩流形上的黎曼信赖域方法,拟开发一种新颖的算法用于这类降维模型的未知函数估计和相关预测变量识别。本项目还通过对低秩和稀疏并存结构的研究,完善对所提出估计方法的渐进理论,并用计算机模拟验证这类降维模型的优点与可行性。

项目摘要

为了克服维数诅咒,可加模型作为一种灵活的非参数回归方法而被广泛使用。当预测变量维度非常大时(有时甚至大于样本量),已经有一些方法通过利用诱导稀疏惩罚,来拟合可加模型并实现变量选择。然而,尽管这些方法有良好的渐进特性,但它们假设相关预测变量的数量相对有限。然而,当相关预测变量的数量变得适度大时,这些方法的有限样本性能可能会大大恶化。本项目提出了一种新的方法,通过学习由可加分量函数共享的预测子空间,来减少需要非参数化估计的未知函数的数量。结合子空间学习与诱导稀疏的惩罚性最小二乘法,本项目又开发了一种高效的算法,实现矩阵流形优化和矩阵上的近似阈值运算的计算。本项目还研究了该算法的理论收敛特性。所提出的方法在模拟研究和实际数据例子中均显示出与现有方法相比的优势。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
4

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

何珂俊的其他基金

相似国自然基金

1

应用于语音增强的低秩和稀疏矩阵分解模型及算法设计

批准号:61362031
批准年份:2013
负责人:孙成立
学科分类:F0111
资助金额:43.00
项目类别:地区科学基金项目
2

内蕴特征空间基于低秩和稀疏分析的医学图像集处理方法

批准号:61300067
批准年份:2013
负责人:李帅
学科分类:F0209
资助金额:23.00
项目类别:青年科学基金项目
3

基于非参数层次贝叶斯模型的自适应字典稀疏表示方法及应用

批准号:61172179
批准年份:2011
负责人:丁兴号
学科分类:F0116
资助金额:60.00
项目类别:面上项目
4

非凸稀疏模型中的逼近理论与算法

批准号:11701189
批准年份:2017
负责人:张娜
学科分类:A0205
资助金额:23.00
项目类别:青年科学基金项目