This project develops variable selection methods for high order spatial autoregressive models, which allow for simultaneous variable selection and parameter estimation. We allow the number of spatial weight matrices and independent variables to grow as sample size increases. Models with such feature can accommodate situations where spatial correlations become more complicated as sample size increases. The first approach we propose is quasi-maximum likelihood estimation with adaptive Lasso penalty. We are going to establish asymptotic properties of the proposed estimator. To reduce computational burden, we propose a least squares approximation algorithm that can avoid computational complexities of maximum likelihood estimation without sacrificing efficiency. The second approach we propose is a spike and slab prior variable selection method. We will investigate proper spike and slab prior distributions and rules for variable selection to achieve model selection consistency. An efficient algorithm will be designed to perform the estimation method. Finite sample performance of the proposed approaches will be examined through Monte Carlo experiments. In addition, we will apply our methods to estimate the effect of social interactions on students’ academic performance. We want to identify the types of social interactions and personal features that are actively influencing students’ academic performance.
本课题提出运用高维变量选择方法对高阶空间自回归模型进行变量选择和参数估计。与传统的高阶空间自回归模型不同,我们允许空间自回归项和解释变量的个数随样本量增加而增加,用以描述随样本量增加空间个体互动关系更加复杂的情况。首先,本课题将提出高阶空间自回归模型的自适应Lasso拟极大似然估计方法。我们希望建立估计量的渐近性质。为了提高计算效率,本课题将提出二阶近似算法,以避免计算复杂的拟极大似然估计,同时保持近似估计量的渐近性质。另外,本课题将提出基于贝叶斯估计的针板先验变量选择方法,寻找合理的针板先验分布和变量选择准则,以实现模型选择的一致性,并设计高效的算法来实现这一估计方法。 本课题还计划运用上述方法估计社交互动对学生成绩的影响,识别出真正影响学生成绩的社交互动类型及其他个体特征。
本课题研究用高维变量选择方法对有空间自回归误差项的高阶空间自回归(SARAR)模型进行变量选择和参数估计,包括自适应Lasso拟极大似然估计方法和贝叶斯针板先验变量选择方法,并运用两种变量选择方法研究中国台湾省中学生成绩的同群效应。.我们提出的自适应Lasso拟极大似然估计方法能够同时实现对空间自回归项和解释变量的选择,并且允许参数个数随样本量增加而增加。我们采用二阶近似方法来求解估计量,并建立了该方法的模型选择一致性和估计量的一致性和渐近正态分布。同时,我们提出了改进的BIC准则,并证明了其模型选择一致性。另外,我们提出在高阶SARAR模型的贝叶斯估计算法(Han, Hsieh and Lee, 2017)中,采用混合高斯分布作为解释变量的先验分布,通过重新尺度化的针板先验变量选择方法来实现对高阶SARAR模型的估计和变量选择,并建立了估计量的神谕(oracle)性质。我们运用上述两种方法研究中学生成绩的同群效应,并非所有社交互动关系都存在同群效应。发现只有关系亲密且经常一起学习的四五名朋友间存在同群效应,并且有冲突关系的个体成绩之间存在显著的负向效应。.我们在完成了原定研究计划的基础上,拓展了相当多的研究内容。(1)我们研究了高阶SARAR模型的自适应弹性网拟极大似然估计方法,并证明了估计量的神谕性质。(2)我们建立了适用于空间计量模型的不依赖于参数空间紧性假设的估计量一致性证明定理。(3)我们提出了三种适用于空间自回归模型的Huber类稳健估计方法,并建立了三个估计量的大样本性质。(4)我们研究了基于分位数回归的稳健整合分析方法,用以提取整合多个数据集的同质参数结构。.本项目一共形成了六篇学术论文。其中一篇于2022 发表于“Economics Letters”上,一篇已投稿至“Journal of Econometrics”并受到了第一轮审稿意见,一篇投稿至“Econometric Theory”,一篇投稿至“Journal of Statistical Planning and Inference”。另有两篇已经成文,预计经过进一步修改润色后投稿至计量经济学权威期刊。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
监管的非对称性、盈余管理模式选择与证监会执法效率?
粗颗粒土的静止土压力系数非线性分析与计算方法
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
基于LASSO-SVMR模型城市生活需水量的预测
多变量空间自回归模型的参数识别和估计的理论与方法
半参数/非参数回归模型的变量选择
缺失数据下半参数回归模型的稳健估计及变量选择方法研究
具有共同因子的高阶面板空间自回归模型:贝叶斯估计,模型选择与应用