大数据下单指标模型的统计推断研究

基本信息
批准号:11801069
项目类别:青年科学基金项目
资助金额:20.00
负责人:姜荣
学科分类:
依托单位:东华大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:杨紫微,张金瑾
关键词:
半参数非线性回归模型参数检验大数据分位数回归
结项摘要

Big data is a symbol of the present age, and almost all of the fields are looking for inspiration from large data. How to select analysis methods according to the characteristics of the data is an urgent problem to be solved in the era of large data. This project will study two types of large data types: massive data and ultra-high dimensional data. For the above two data types, most of the existing research results are based on the linear model, which is limited in the practical application. This project intends to study the analysis of the above two kinds of data with single index models. Specifically, we will focus on the following three aspects: (1) Study the method of unknown parameter estimation in single index model and it's efficient computation in order to provide a method for the analysis of massive data and ultra-high dimensional data. (2) Divide-and-conquer method divides massive data into several subsets, so that massive data can be stored and analyzed on a single computer, how to combine the statistics on each subset to get the final result is what we intend to study. (3) We will study the variable selection method for ultra-high dimensional data and propose a statistical inference method after variable selection. We will systematically study the above research content in two aspects of numerical simulation and theoretical research.

大数据是现今这个时代的一个符号,几乎所有的领域都在寻找着来自大数据的灵感。如何根据数据特点,选择合适的数据分析方法是大数据时代迫切需要解决的问题。本项目将具体研究两种大数据类型:海量数据和超高维数据。对以上两种数据类型,现有的研究成果大都基于线性模型,这给实际应用带来局限性。本项目拟研究用单指标模型分析处理以上两种数据。具体地将致力于进行如下三方面的研究:(1)探索单指标模型中未知参数的估计方法与高效计算问题,为海量数据和超高维数据的分析提供一种方法。(2)Divide-and-conquer方法把海量数据分成若干子集,使得海量数据能在单一计算机上存储和分析,如何结合各子集上所得的统计量,得到最终所需结果,是我们拟研究的内容。(3)我们将研究超高维数据的变量选择方法,并提出变量选择之后的统计推断方法。我们将在数值模拟与理论研究两方面对上述研究内容进行系统的研究。

项目摘要

大数据现已成为热门词汇,其主要特点为数据量大、种类繁多、价值密度低和速度快。现今几乎所有的领域都在运用大数据。如何根据数据特点,选择合适的数据分析方法是大数据时代迫切需要解决的问题。本课题将具体研究两种大数据类型:海量数据和超高维数据。本项目研究用单指标模型分析处理以上两种数据,具体为如下三方面的研究:(1)研究单指标模型中未知参数的估计方法与高效计算问题;(2)Divide-and-conquer方法把海量数据分成若干子集,使得海量数据能在单一计算机上存储和分析。结合Divide-and-conquer方法和研究内容(1)的结果,研究海量数据下单指标模型中的估计问题;(3)在研究内容(2)的基础上研究了超高维数据的变量选择方法,并提出变量选择之后的统计推断方法。在计划的研究内容基础上,进一步研究了如下三个方面:(1)研究了海量数据下线性回归模型中未知参数的估计方法;(2)研究了单指标期望分位数回归模型中未知参数和未知函数,并应用此模型估计金融风险中的条件风险价值和损失期望值;(3)研究了海量数据下单指标模型中未知参数和联系函数的复合拟似然估计。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究

DOI:10.13465/j.cnki.jvs.2020.09.026
发表时间:2020

姜荣的其他基金

批准号:11626057
批准年份:2016
资助金额:3.00
项目类别:数学天元基金项目

相似国自然基金

1

纵向数据单指标混合效应模型的有效统计推断

批准号:11101014
批准年份:2011
负责人:李高荣
学科分类:A0402
资助金额:23.00
项目类别:青年科学基金项目
2

复杂数据下含指标项半参数模型结构的统计推断及应用

批准号:11471160
批准年份:2014
负责人:黄振生
学科分类:A0403
资助金额:68.00
项目类别:面上项目
3

纵向数据动态模型的稳健统计推断

批准号:11701361
批准年份:2017
负责人:柳树
学科分类:A0403
资助金额:20.00
项目类别:青年科学基金项目
4

纵向数据与生存数据联合模型的统计推断

批准号:11601060
批准年份:2016
负责人:宋慧
学科分类:A0403
资助金额:19.00
项目类别:青年科学基金项目