We study the structral learning for graphical models and do related statistical inference under high-dimensional data setting. In the high-dimensional setting, when the mean vector is affected by another set of high dimensional covariates, we use the penalized likelihood method to estimate the structure for undirected graphs. The penalized likelihood method will also be applied to array-type of data to learn the undirected graphs. Undirected graphs can serve as the basis for the directed graphs' learning. Toward the structural learning for directed graphs, we use the constraint-based method in which the key is to test the conditional independence among two variables given a conditional variable set or two sets of variables given a conditional set in the high dimensional case. We consider both situations of with and without distributional assumptions. Traditional test statistics fail to work under such settings and we need new test statistics and method(under reasonable assumption like sparcity or structral assumption). We will study the consistency, efficiency and optimality of the proposed test. The conclusion of such test has an independent interest of itself. Furthermore, these inference conclusions can be plugged into many DAG learning algrithms(global or local) like PC, IC, Recursive and POLSL etc. For the high dimensional graphs learned(undirected or directed), we assess the False Discovery Rate(FDR) or other confidence measures for the dependent multiple testing procedure of the structral learning process. And the asymptotic behavior will be carefully studied.
研究在高维数据情形下,图模型的结构学习及相关统计推断问题。在高维情形下,当均值受到另一组高维协变量影响时,我们用似然函数加惩罚的方法来估计无向图的结构。用惩罚似然方法研究array-型数据的无向图模型估计。对于高维有向图(DAG)采用基于约束的学习方法,其中关键的步骤是高维条件独立性检验。我们分别研究在有分布假定和无分布假定情况下的高维条件独立性检验。传统的检验统计量在高维情形下一般是无法工作的。需要提出在一定合理假定下(比如稀疏性或者结构上的假定)新的统计量和检验方法。研究所提出的检验的渐近相合性、功效以及最优性。条件独立性的推断结论本身也有意义。进一步该推断结果可以嵌入到有向无环图(DAG)整体或者部分的结构学习算法中去,比如PC,IC,递归, 或者局部学图算法。对于学得的高维图(无向或有向),我们评价在相依的多重检验下的整体错误发现率(FDR)等相关置信度度量,并研究它们的极限性质。
本项目研究在高维数据情形下,高斯图模型的结构学习、估计问题和高维统计推断问题。主要分为以下4个主要部分:.1.在高维情形下,当均值受到另一组高维协变量影响时,我们用似然函数加惩罚的方法来估计高维高斯无向图的结构。用两步估计方法,我们的得到了高维条件高斯图模型的均值系数矩阵和高维误差协方差逆阵的快速收敛算法。理论上,使用Primal-Dual-Witness技术,我们证明了维数远远大于样本量时,估计的误差的相合性和收敛速度,以及模型选择的符号相合性。文章发表在2013年的《Journal of Multivariate Analysis》上。.2.用惩罚似然方法研究高维张量型数据的无向图模型估计。使用张量-正态型分布描述多重条件下的多维数组型数据联合分布,我们得到在各个维数分别固定和都趋向于无穷时,估计的相合性、误差收敛速度,以及维数增长时的稀疏相合性。文章发表在2014年《Journal of Multivariate Analysis》上。.3.对于高维有向图(DAG)采用基于约束的学习方法,其中关键的步骤是高维条件独立性检验。而有效约减条件集是一个行之有效的途径。我们提出了基于似然函数加惩罚的方法对高维数据进行基于降维技术的马尔科夫毯子选择。得到了快速收敛的坐标下降算法。文章发表在2014年(Online Version)《Communications in Statistics: Simulation and Computation》上。.4.对于自适应临床试验设计中如果有缺失数据时如何进行在各个变量上进行平衡的问题,我们提出了一种将缺失水平视为一个“新取值”的方法,进而在证明该偏差度量还是满足一些相合性等性质。文章发表在2015年《Science China Mathematics》上。该工作与马氏链有很密切的联系。也是本项目的一种拓展。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
拥堵路网交通流均衡分配模型
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
高维回归模型的大规模统计学习和推断
高维数据下多因变量回归模型的统计推断
带潜变量高维模型的统计推断
基于门限自回归模型的高维相依计数数据的统计推断