非参数与半参数混合模型的统计推断及应用

基本信息
批准号:11371235
项目类别:面上项目
资助金额:62.00
负责人:王绍立
学科分类:
依托单位:上海财经大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:徐珂,黄勉,邵建利,崔翔宇,吴星,禹悰廉,蔡玲艳,李雪君,邵晨
关键词:
非参数与半参数模型可识别性核估计混合模型回归模型
结项摘要

Characters):A lot of complex data come from nonhomogeneous populations in applications. Nonhomogeneous populations may arise as a result of mixture of subpopulations of distinct characteristics, data contamination, missing data, or measurement errors and so on. If a sample is generated from a nonhomogeneous population, then a single family of parametric distributions often fails to fit the data well. Therefore, we need to assume that the population comprises of a few subpopulations that are relatively homogeneous, and the sample comes from each sub-population with a certain probability: in another words, the sample follows a mixture distribution. In this research project we plan to study nonparametric and semi-parametric mixture models and mixture of regression models when covariates are present. We will combine kernel density estimation and local likelihood techniques, develop stochastic EM algorithms and Bayes methods, and study parameter estimation and statistical inference for nonparametric mixture models, semi-parametric mixture models and semi-parametric mixture of regression models. Meanwhile, we will also investigate the convergence property of algorithms and asymptotic property of parameter estimation. Furthermore, we will apply our novel methodology to different fields such as biology, medicine, environment and finance.

实际应用中很多复杂的数据往往来自于非均匀的总体。非均匀数据的产生可能是由于样本是多个属性不同的子样本的混合,也可能是数据污染、数据缺失、或测量误差等所造成。如果产生样本的总体是不均匀的,单一的参数分布族往往不能很好地拟合数据。此时,我们需要假设总体由几个相对均匀的子总体组成,样本以一定概率来自于某个特定的子总体,即假设数据服从混合分布。本项目将研究非参数与半参数的混合模型,以及数据具有协变量时的回归混合模型等。我们拟结合核密度估计方法和局部似然函数方法,发展随机EM算法与贝叶斯分析方法对非参数混合模型、半参数混合模型与半参数回归混合模型进行参数估计与统计推断。同时研究算法的收敛性质与参数估计的渐进性质。在此基础上,我们将发展出的新方法应用于生物、医学、环境与金融等领域。

项目摘要

实际应用中大量的数据来自于非均匀的总体,呈现出异质性的分布特征。对于具有异质性的数据,需要使用混合分布进行拟合和建模。传统的参数混合模型在模型选择正确时能够很好地拟合数据,但存在模型选择错误的问题。非参数和半参数混合模型能够减少建模时的模型选择错误,为模型选择提供了更大的灵活性。本项目针对异质性数据,发展了非参数和半参数混合模型以及非参数和半参数回归混合模型,对这些模型的理论性质和算法进行了深入的研究,并探讨了相关的应用,取得了重要的研究成果。给出了非参数与半参数广义线性混合模型的统一框架,进而在此框架基础上建立了可识别性的一般理论,从而为这类模型的应用打下了理论基础。系统性地研究了变系数混合模型的统计推断。变系数混合模型涵盖了一大类回归混合模型。我们建立了此类模型广义似然比检验,并证明了Wilks现象。针对函数型数据提出了线性混合模型,建立了该模型的可识别性和估计方法,并将此模型应用于世界人均二氧化碳排放和人均GDP的动态关系的研究。我们也研究了参数分布和对称非参数分布的混合模型,将此模型应用于分析A股上市公司的净资产收益率的分布特征。将混合模型应用于多样本基因测序数据分析,更好地估计了基因测序错误。本项目共发表SCI学术论文7篇,发表的期刊包括著名统计杂志Scandinavian Journal of Statistics,Statistics and Its Interface,Computational Statistics and Data Analysis,以及生物信息学顶尖刊物Bioinformatics。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

DOI:10.13465/j.cnki.jvs.2020.09.026
发表时间:2020
5

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019

王绍立的其他基金

相似国自然基金

1

参数与半参数模型下统计推断

批准号:18870488
批准年份:1988
负责人:吴传义
学科分类:A0403
资助金额:2.20
项目类别:面上项目
2

一类半参数混合效应模型的统计推断

批准号:10871013
批准年份:2008
负责人:薛留根
学科分类:A0403
资助金额:21.00
项目类别:面上项目
3

面板计数数据模型的非参数和半参数统计推断

批准号:11771366
批准年份:2017
负责人:赵兴球
学科分类:A0402
资助金额:48.00
项目类别:面上项目
4

借助辅助信息的半参数指标模型统计推断及应用

批准号:11501354
批准年份:2015
负责人:范燕
学科分类:A0402
资助金额:18.00
项目类别:青年科学基金项目