Exchangeable assumptions of random variables in Bayesian statistics are equivalent as independent assumptions in frequentist statistics. This proposal studies how to construct Bayesian nonparametric priors under the assumptions of non-exchangeability, and it is a cutting-edge research in Bayesian statistics. Exchangeability means that the joint density functions are identical under any permutation of the random variables. However this assumption does not hold when there is dependence among the data, which limits the Bayesian nonparametric models in the applications of time series and spatial data. Non-exchangeability complicates the explicit expression of many theories, and makes the MCMC algorithm difficult. We will construct the non-exchangeable version of Pitman-Yor process. As for the MCMC algorithm, we propose a new way of labeling the variables, which facilitate the computation of the posteriors, and thus improving the efficiency. We apply the new method to a multiple hypothesis testing problems where there is dependence among the data. In the end, we extend the univariate process into a dependent process, and suggest a brain imaging application.
变量间的可交换性(exchangeable)假设在贝叶斯统计学中类比于频率学派的独立性假设。本文研究在可交换性假设不满足的条件下,如何构造非参数贝叶斯过程作为先验的问题,是贝叶斯统计学研究的国际前沿问题。可交换性指的是全部变量的任意排列组合之下,其联合分布的密度函数是一样的。这一假设在数据内部存在相关性时并不能得到满足,因此限制了很多非参数贝叶斯模型在时间序列和空间序列当中的应用。非可交换性使得模型理论性质的解析表达式与设计后验分布抽样的马氏链蒙特卡洛方法(MCMC)算法变得困难。我们将基于著名的Pitman-Yor过程,构建非可交换的Pitman-Yor过程。在设计MCMC算法时,我们提出利用新的类别标记方式,从而使计算条件后验概率变得容易,提高了算法的效率。我们将其应用到数据间存在相关性时的多重假设检验问题。最后我们将一元的先验过程拓展为多元的相依过程,并应用在脑成像疾病研究中。
本项目聚焦在相依非参数贝叶斯过程的问题研究,该研究在生物统计、机器学习等领域有着广泛的应用。本项目以非可交换的Beta-GOS过程为出发点,拓展其为协变量相关的DBG过程和层次HBG过程,使这一先验过程可以运用在具有协变量的场景和具有多个相关数据集的场景,拓宽了其应用范围。具体而言,我们进行了三个子项目:(1)我们构造了能包含协变量信息的DBG过程,另外提出了相依的层次HBG过程,研究其理论性质和后验分布的算法。(2)我们探索了如何提高MCMC算法的效率,提出用引入潜变量的方式来简化条件后验分布,从而简化抽样算法。(3)我们研究了非参贝叶斯过程在金融市场的运用,利用层次狄利克雷过程和隐马尔科夫模型预测股票收益,从而构建投资组合的优化模型。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
农超对接模式中利益分配问题研究
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
统计因果推断及贝叶斯网络
项目反应与认知诊断的贝叶斯统计推断方法
高维数据的非参数经验贝叶斯方法
基于非参数层次贝叶斯模型的自适应字典稀疏表示方法及应用