It is well known that network data is increasingly common in a wide variety of fields such as in social sciences, biology, economics,computer science, et al. This creates an urgent need to do understand the generative mechanism of these networks and to explore various characteristics of the network structure. There is no doubt that statistical models are useful tools to study network data. Compared with the traditional data, the non-standard structure of network data poses new challenges for statistical analysis (due to increasing dimension and complex dependency relation), especially for the statistical sampling and modeling. On the basis of the bi-degree sequences of network data, this project mainly studies the related problems of the statistical sampling and modeling in network data.Firstly, basis on bi-degree sequence of directed network, the project aims at studying the sequential importance sampling for directed weighted network and related problems. Secondly, based on a bi-degree sequence, a directed weighted network is modeled, and then the approximate estimation of the maximum likelihood estimator of degree parameters will be established. Thirdly, based on the bi-degree sequence and the covariate information, we will model the directed weighted networks with the covariate information of the vertices and study the statistical theory of the maximum likelihood estimator for these networks. The research results of the project will enrich the theory of statistical sampling and modeling, and provide convenience and guide for the practical application.
在社会科学、生物科学、经济学、计算机科学等领域里,各种各样的网络数据呈现出井喷式增长的趋势。因此研究网络数据的生成机制、挖掘网络数据的结构特征变得十分重要。毫无疑问,统计建模方法是研究网络数据的重要工具之一。与传统数据相比,网络数据具有非结构化的特征(缘于增加的网络维数和复杂的相依关系),这给网络数据的统计分析带来新的挑战、新的问题,特别是统计抽样以及建模问题的研究。基于此,本论文主要利用双度序列来研究有向网络数据里统计抽样及建模的相关问题:(一)基于双度序列研究有向加权网络序贯重要性抽样的问题;(二)基于双度序列建模有向加权网络并研究该网络参数极大似然估计近似估计的相关问题;(三)基于双度序列及协变量信息建模带有协变量信息的有向加权网络并研究该网络参数极大似然估计量的统计性质。本项目的研究结果将进一步丰富和完善统计抽样、建模的理论,为实际应用提供便利和指导。
在社会科学、生物科学、经济学、计算机科学等领域里,存在着大量的网络数据。然而,为了探究网络的结构,通常利用统计方法来建模和分析网络特征。然而,这类数据的非标准结构特征,给网络数据统计分析研究带来了巨大的困难和挑战。特别是网络数据参数极大似然估计量的渐近性理论的研究。即网络中参数个数随节点个数而增加,并且样本量仅有单个网络,研究参数极大似然估计量的相合性与渐近正态性的理论问题。同时为了保护网络数据节点所包含的敏感信息,利用差分隐私的方法,建立了网络模型的渐近理论。主要研究内容和结果如下:.1.基于有向网络顶点的双度序列研究了网络节点参数的极大似然估计量近似值的估计问题和网络节点参数极大似然估计量的渐近性理论。进一步,我们考虑网络节点的异质性和同质性特征,并随着网络节点异质性和同质性参数的个数增加,我们建立了网络节点参数的渐近性理论。.2.基于1中的结果,考虑隶属网络与有向网络之间的内在联系。进一步,我们利用度序列证明了隶属网络参数节点参数极大似然估计量的渐近性理论。.3.在1和2中的结果,我们进一步地考虑了保护网络数据节点的敏感信息,并通过引入差分隐私的方法,我们证明了带有差分隐私度序列网络节点参数估计量的渐近性理论。.本课题所得研究成果丰富和发展了网络数据统计分析的相关渐近性理论,并将该理论应用到网络数据的隐私保护领域。同时该理论也为网络数据分析的实际应用提供新的理论依据和新的数据分析方法,满足科技工作者解决实际具体问题的需求
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
跨社交网络用户对齐技术综述
城市轨道交通车站火灾情况下客流疏散能力评价
有向图及网络的曲面嵌入亏格问题的研究
统计模拟抽样算法及相关问题研究
基于社交网络的敏感问题抽样设计与间接统计推断方法
加权网络数据建模及其统计推断