Network data analysis plays a more and more important role in abundant applications, such as user profiling, personalized marketing and financial risk management. This enables the network data be widely collected and analyzed. Although the network data analysis is useful in a wide range of applications, it posts new challenges to conventional statistical analysis. Classical statistical analysis usually relies on the independent assumption, however, this assumption does not hold for network data. Based on the characteristics of the network data, this project aims to contribute to the following three parts: (1) spatial regression for large scale network data and its efficient computation; (2) high dimensional time series modeling with network structure information; (3) variable selection and important nodes detection method for large scale network data. This project tries to establish the analysis framework for network data in the aspects of regression and time series analysis. Specifically, part (1) focuses on the spatial autoregression model for large scale network data and efficient computation especially when the network structure is sparse. Part (2) aims to build network vector autoregression models for high dimensional time series data. Lastly, part (3) investigates the variable selection and important nodes detection techniques for network data. The research results could be widely applied to real data analysis, thus have great practical values.
近年来,网络数据在用户画像、个性化营销、金融风险建模等多个领域起到重要作用,从而被大规模收集、存储以及分析。网络数据建模有广泛而巨大的应用场景,同时也对统计分析方法提出新的挑战。传统的统计学分析,往往依赖于样本独立性假设,这难以直接应用于网络数据。针对复杂网络数据,本项目将致力于如下三个问题的研究:(1)大规模网络数据空间自回归模型建模及高效计算;(2)大规模网络数据的高维时间序列建模方法;(3)大规模网络数据的变量选择方法。本项目试图通过以上三个方面研究,建立网络数据回归以及动态数据建模方面的分析框架和方法。其中,问题一将着重探讨给定网络稀疏性假设时,空间自回归模型的高效估计和渐近性质研究;问题二将探讨利用网络结构信息对高维时间序列数据建模;问题三将研究给定网络结构时重要变量及节点的选择方法。本项目研究成果可广泛应用实际数据分析,有非常实际的价值。
近年来,网络数据在用户画像、个性化营销、金融风险建模等多个领域起到重要作用,从而被大规模收集、存储以及分析。网络数据建模有广泛而巨大的应用场景,同时也对统计分析方法提出新的挑战。针对复杂网络数据,本项目致力于如下三个问题的研究:(1)大规模网络数据空间自回归模型建模及高效计算;(2)大规模网络数据的高维时间序列建模方法;(3)大规模网络数据的变量选择方法。本项目试图通过以上三个方面研究,建立网络数据回归以及动态数据建模方面的分析框架和方法。其中,问题一着重探讨给定网络稀疏性假设时,空间自回归模型的高效估计和渐近性质研究。具体而言,项目研究了针对双模网络、带网络结构的函数型数据、离散型动态数据的建模及计算问题。问题二探讨利用网络结构信息对高维时间序列数据建模。具体而言,项目探索了针对分位数自回归模型的网络数据建模方案。在考虑网络节点存在异质性的前提下,项目提出了多种基于社群或分组的结构的网络自回归模型。问题三主要研究给定网络结构时大规模数据的重要变量选择方法。本项目研究成果应用于污染物排放异常值检测、在线营销对话文本建模等。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
跨社交网络用户对齐技术综述
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
大规模生物数据计算的优化建模与高效算法研究
大规模社交网络中统计建模及假设检验
加权网络数据建模及其统计推断
有向网络数据统计抽样及建模问题的研究