大数据与试验设计中的统计方法与计算

基本信息
批准号:11431006
项目类别:重点项目
资助金额:280.00
负责人:王兆军
学科分类:
依托单位:南开大学
批准年份:2014
结题年份:2019
起止时间:2015-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:刘卫东,杨征路,刘民千
关键词:
高维复杂数据复杂试验非参数统计大数据在线实时监控
结项摘要

The big data is revolutioning our life, work and thinking. An important and imperative research project is how to mine and use the information in big data, efficiently. Our research about big data and design of experiments will focus on the following four sub-projects: 1) the big data mining and algorithm; 2) the statistical inference of high dimensional convariance matrix; 3) the monitoring and dignost for the on-line big data; 4) the design theory and modelling for complex experiments. The detailed research contents will include: 1) in the view of computer science: data fusion algorithms, data mining and recommendation algorithms, privacy preserving data mining algorithms and parallel algorithms; 2) in the view of statistics: the robust estimation of high dimensional and sparse covariance matrix, the robust two-sample t test for high dimensional data, on-line monitoring and dignostic for high dimensional data stream, how to define and monitor the quality of big data, the on-line monitoring for multivariate functional data, the optimality theory and construction of supersaturated designs with high and mixed levels, the construction and modelling of various Latin hypercube designs, etc. Our research results will include patents or software copyrights, papers and the cultivation of PhD and Master students.

可以说,大数据正在变革我们的生活、工作和思维,如何有效地挖掘并利用大数据中的有用信息,则是我们当前需要深入研究的重要课题。本项目将从四个方面对大数据与试验设计进行研究:1) 大数据挖掘与计算;2)超高维数据阵的统计推断;3)大数据的实时监控与诊断;4)复杂试验的设计理论与建模方法。具体研究内容将包括:从计算机科学角度研究处理数据的融合算法、数据挖掘推荐算法、大数据隐私保护算法、并行算法等;从统计学角度研究高维稀疏协方差的稳健矩阵、超大规模两样本t检验的稳健性研究、高维数据流的实时监控与诊断、在线数据质量的定义与监控、多元函数型数据的实时监控、高水平及混水平超饱和设计(SSD)的最优理论及构造、多种拉丁超立方体设计(LHD)的构造及数据分析与建模。通过本项研究,争取有一定的理论突破,为今后的实际应用和推广奠定坚实的基础。.本项目的研究成果将包括专利(或软件著作权)、学术论文及学生培养。

项目摘要

背景及科学意义..大数据正在变革我们的生活、工作和思维,如何有效地挖掘并利用大数据中的有用信息,则是我们当前需要深入研究的重要课题。通过本项研究,争取有一定的理论突破,为今后的实际应用和推广奠定坚实的基础。本项目的研究成果包括一系列学术论文及学生培养。..主要研究内容..本项目将从四个方面对大数据与试验设计进行研究:.(1)大数据挖掘与计算;.(2)超高维数据阵的统计推断;.(3)大数据的实时监控与诊断;.(4)复杂试验的设计理论与建模方法。..重要结果..(1)从计算机科学角度我们研究了处理数据的融合算法、数据挖掘推荐算法、大数据隐私保护算法、并行算法等;.(2)从统计学角度我们研究了高维稀疏协方差的稳健矩阵、超大规模两样本t检验的稳健性研究等;.(3)从统计学角度我们研究了高维数据流的实时监控与诊断、在线数据质量的定义与监控、多元函数型数据的实时监控等;.(4)从统计学角度我们研究了高水平及混水平超饱和设计(SSD)的最优理论及构造、多种拉丁超立方体设计(LHD)的构造及数据分析与建模等。..关键数据.在本项目执行期间(2015-2019年),在本项目的资助下,本项目组成员共出版专著2本,发表或接收待发表SCI论文104篇,包括国际统计四大顶尖杂志11篇、国际工业统计顶级期刊Technometrics 5篇、泛华统计协会会刊Statistica Sinica 12篇、计算机科学顶级杂志或会议论文12篇。毕业博士生15名、硕士生38名、专业硕士41名;在读博士生35名、硕士生9名、专业硕士16名。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

路基土水分传感器室内标定方法与影响因素分析

路基土水分传感器室内标定方法与影响因素分析

DOI:10.14188/j.1671-8844.2019-03-007
发表时间:2019
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

王兆军的其他基金

批准号:11071128
批准年份:2010
资助金额:27.00
项目类别:面上项目
批准号:10771107
批准年份:2007
资助金额:22.00
项目类别:面上项目
批准号:81471971
批准年份:2014
资助金额:72.00
项目类别:面上项目
批准号:81172808
批准年份:2011
资助金额:55.00
项目类别:面上项目
批准号:11563008
批准年份:2015
资助金额:50.00
项目类别:地区科学基金项目
批准号:12026209
批准年份:2020
资助金额:20.00
项目类别:数学天元基金项目
批准号:30600517
批准年份:2006
资助金额:23.00
项目类别:青年科学基金项目
批准号:10963003
批准年份:2009
资助金额:21.00
项目类别:地区科学基金项目
批准号:11371202
批准年份:2013
资助金额:55.00
项目类别:面上项目

相似国自然基金

1

临床试验中的创新设计及统计方法

批准号:11371366
批准年份:2013
负责人:胡飞芳
学科分类:A0402
资助金额:55.00
项目类别:面上项目
2

拟合统计模型的试验设计方法研究

批准号:79070028
批准年份:1990
负责人:胡运权
学科分类:G0108
资助金额:1.80
项目类别:面上项目
3

生物医疗大数据集成分析的统计与计算方法研究

批准号:61501389
批准年份:2015
负责人:杨灿
学科分类:F0124
资助金额:21.00
项目类别:青年科学基金项目
4

添加次序试验的设计与统计分析

批准号:11871033
批准年份:2018
负责人:杨建峰
学科分类:A0401
资助金额:54.00
项目类别:面上项目