混合型偏态数据下均值、中位数和众数回归模型的统计推断与算法研究

基本信息
批准号:11861041
项目类别:地区科学基金项目
资助金额:39.00
负责人:吴刘仓
学科分类:
依托单位:昆明理工大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:付英姿,戴琳,孙红兵,杨兰军,何明星,杨松琴,李双双,聂兴锋,邢伊琦
关键词:
混合型偏态数据变量选择混合回归模型EM算法Bayesian估计
结项摘要

In classical statistical inference, on the one hand, the data is assumed to come from the same population, on the other hand, the data is required to follow symmetric distribution. In the real world, the data strictly comes from the same population and symmetric distribution is very rare. If we ignore the mixture and/or skewness characteristics of the data, we still use the homogeneous and/or symmetric distribution to infer the statistical data, which may lead to unreasonable or even misleading results when the practical data reveal skewness feature. In order to better fit the data and comprehensively, accurately extract the information of the data, the skewed regression model is a kind of very important model. Therefore, this project is for skewed data (SN, StN) from the different populations, according to the three important features of the skewed data: the mean, median and mode are respectively the sign values of "average level", "medium level" and "most level", establish the mixture of mean, median and mode regression models, respectively, and systematically and deeply research statistical inference and algorithm. Especially, in order to better fit the actual high dimensional, mixture complex (missing, measurement error, censored, longitudinal data) skewed data, establish the complex (parameter, nonparametric and semiparametric) mixture of mean, median and mode regression models. The key research is focused the estimation theory, Bayesian inference,statistical diagnostics, variable selection and algorithm research of the above complex mixture regression models based on the complex mixture skewed data.

在经典的统计推断中,一方面,数据假定来自同一个总体;另一方面,数据要求服从对称分布。在真实世界中,数据严格来自同一个总体且对称的情况非常少有。此时若忽略数据的混合、偏斜特征,仍用同质、对称分布进行统计推断可能导致不合理甚至是错误的统计推断结论。为了更好地拟合数据,充分提取数据的信息,偏态回归模型是一类非常重要的模型。因此,本项目针对来自不同总体的偏态(SN,StN)数据,根据偏态数据的三个重要特征:均值、中位数和众数分别是总体“平均水平”、“中等水平”和“多数水平”的标志值,分别建立混合均值、中位数和众数回归模型,并进行系统深入的统计推断与算法研究。具体来说,为了更好地拟合实际中遇到的高维、混合型复杂(缺失、测量误差、删失和纵向)偏态数据,建立复杂(参数、非参数和半参数)混合均值、中位数和众数回归模型,重点研究上述复杂模型的估计理论、Bayesian推断、统计诊断、变量选择和算法研究。

项目摘要

在经典的统计推断中,一方面,数据假定来自同一个总体;另一方面,数据要求服从对称分布。在真实世界中,数据严格来自同一个总体且对称的情况非常少有。此时若忽略数据的混合、偏斜特征,仍用同质、对称分布进行统计推断可能导致不合理甚至是错误的统计推断结论。为了更全面准确、更及时有效的分析混合型偏态数据,本项目从复杂数据和复杂模型的角度,针对来自不同总体的偏态(SN,StN)数据,根据偏态数据的三个重要特征:均值、中位数和众数分别是总体“平均水平”、“中等水平”和“多数水平”的标志值,分别建立混合均值、中位数和众数回归模型。重点研究了混合偏态均值、中位数和众数回归模型的估计理论、Bayesian推断、统计诊断、变量选择和算法研究,并且结合金融、经济、社会科学、气候科学、环境科学、工程技术和生物医学等学科中的一些实际复杂混合偏斜数据做相关统计分析,解释和分析这些学科中的复杂现象,为这些学科的研究和发展提供了新的统计分析方法。研究所得结果拓宽了混合偏态均值、中位数和众数回归模型的应用范围,丰富了混合偏态均值、中位数和众数回归模型的理论与方法。. 在本项目的支持下,本课题组成员已在国内外重要核心刊物发表期刊论文26篇,其中被SCI收录5篇,SCI源刊在线4篇。培养硕士生22人,毕业10人,考取博士5人。科学出版社出版学术专著1部并荣获云南省统计科学优秀研究成果二等奖。参加国内外学术会议6人次;荣获昆明理工大学教学成果一等奖1项。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
4

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
5

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016

吴刘仓的其他基金

批准号:11126309
批准年份:2011
资助金额:3.00
项目类别:数学天元基金项目
批准号:11261025
批准年份:2012
资助金额:50.00
项目类别:地区科学基金项目

相似国自然基金

1

复发事件的均值模型和纵向数据的分位数回归的统计与推断

批准号:11401603
批准年份:2014
负责人:刘玉涛
学科分类:A0403
资助金额:22.00
项目类别:青年科学基金项目
2

复杂数据下众数回归模型的变量选择及统计诊断研究

批准号:11561075
批准年份:2015
负责人:李会琼
学科分类:A0403
资助金额:34.00
项目类别:地区科学基金项目
3

删失数据中位数回归模型的统计分析

批准号:11201235
批准年份:2012
负责人:周秀轻
学科分类:A0402
资助金额:22.00
项目类别:青年科学基金项目
4

复杂数据下联合均值与方差模型的统计推断

批准号:11261025
批准年份:2012
负责人:吴刘仓
学科分类:A0403
资助金额:50.00
项目类别:地区科学基金项目