大规模网络数据统计建模及高效计算

基本信息

批准号：11901105

项目类别：青年科学基金项目

资助金额：25.00

负责人：朱雪宁

学科分类：

依托单位：复旦大学

批准年份：2019

结题年份：2022

起止时间：2020-01-01 - 2022-12-31

项目状态：已结题

项目参与者：

关键词：

空间自回归高效计算大数据网络数据分析

结项摘要

Network data analysis plays a more and more important role in abundant applications, such as user profiling, personalized marketing and financial risk management. This enables the network data be widely collected and analyzed. Although the network data analysis is useful in a wide range of applications, it posts new challenges to conventional statistical analysis. Classical statistical analysis usually relies on the independent assumption, however, this assumption does not hold for network data. Based on the characteristics of the network data, this project aims to contribute to the following three parts: (1) spatial regression for large scale network data and its efficient computation; (2) high dimensional time series modeling with network structure information; (3) variable selection and important nodes detection method for large scale network data. This project tries to establish the analysis framework for network data in the aspects of regression and time series analysis. Specifically, part (1) focuses on the spatial autoregression model for large scale network data and efficient computation especially when the network structure is sparse. Part (2) aims to build network vector autoregression models for high dimensional time series data. Lastly, part (3) investigates the variable selection and important nodes detection techniques for network data. The research results could be widely applied to real data analysis, thus have great practical values.

近年来，网络数据在用户画像、个性化营销、金融风险建模等多个领域起到重要作用，从而被大规模收集、存储以及分析。网络数据建模有广泛而巨大的应用场景，同时也对统计分析方法提出新的挑战。传统的统计学分析，往往依赖于样本独立性假设，这难以直接应用于网络数据。针对复杂网络数据，本项目将致力于如下三个问题的研究：（1）大规模网络数据空间自回归模型建模及高效计算；（2）大规模网络数据的高维时间序列建模方法；（3）大规模网络数据的变量选择方法。本项目试图通过以上三个方面研究，建立网络数据回归以及动态数据建模方面的分析框架和方法。其中，问题一将着重探讨给定网络稀疏性假设时，空间自回归模型的高效估计和渐近性质研究；问题二将探讨利用网络结构信息对高维时间序列数据建模；问题三将研究给定网络结构时重要变量及节点的选择方法。本项目研究成果可广泛应用实际数据分析，有非常实际的价值。

项目摘要

近年来，网络数据在用户画像、个性化营销、金融风险建模等多个领域起到重要作用，从而被大规模收集、存储以及分析。网络数据建模有广泛而巨大的应用场景，同时也对统计分析方法提出新的挑战。针对复杂网络数据，本项目致力于如下三个问题的研究：（1）大规模网络数据空间自回归模型建模及高效计算；（2）大规模网络数据的高维时间序列建模方法；（3）大规模网络数据的变量选择方法。本项目试图通过以上三个方面研究，建立网络数据回归以及动态数据建模方面的分析框架和方法。其中，问题一着重探讨给定网络稀疏性假设时，空间自回归模型的高效估计和渐近性质研究。具体而言，项目研究了针对双模网络、带网络结构的函数型数据、离散型动态数据的建模及计算问题。问题二探讨利用网络结构信息对高维时间序列数据建模。具体而言，项目探索了针对分位数自回归模型的网络数据建模方案。在考虑网络节点存在异质性的前提下，项目提出了多种基于社群或分组的结构的网络自回归模型。问题三主要研究给定网络结构时大规模数据的重要变量选择方法。本项目研究成果应用于污染物排放异常值检测、在线营销对话文本建模等。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.19328/j.cnki.2096-8655.2022.02.002

发表时间：2022

DOI：

发表时间：2019

朱雪宁的其他基金

相似国自然基金

大规模生物数据计算的优化建模与高效算法研究

批准号：61872281

批准年份：2018

负责人：王宇平

学科分类：F0213

资助金额：63.00

项目类别：面上项目

大规模社交网络中统计建模及假设检验

批准号：11801022

批准年份：2018

负责人：马莹莹

学科分类：A0403

资助金额：23.00

项目类别：青年科学基金项目

加权网络数据建模及其统计推断

批准号：11401239

批准年份：2014

负责人：晏挺

学科分类：A0403

资助金额：22.00

项目类别：青年科学基金项目

有向网络数据统计抽样及建模问题的研究

批准号：11801576

批准年份：2018

负责人：罗敬

学科分类：A0401

资助金额：21.00

项目类别：青年科学基金项目

大规模网络数据统计建模及高效计算

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

"多对多"模式下GEO卫星在轨加注任务规划

基于主体视角的历史街区地方感差异研究———以北京南锣鼓巷为例

朱雪宁的其他基金

相似国自然基金