含网络结构的离散选择模型:理论及应用研究

基本信息
批准号:11601539
项目类别:青年科学基金项目
资助金额:19.00
负责人:潘蕊
学科分类:
依托单位:中央财经大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:周静,朱雪宁
关键词:
变量选择高维数据网络数据分析
结项摘要

An important sign of the rapid advance of the Internet and mobile Internet is the boom of social network sites. As a result, network data are becoming increasingly available. Network data have the characteristics of big volume, complex structure, and high dimension. Furthermore, network data play an important role in studying consumer behavior, exploring the flow of social capital, and providing user portrait. This leads to a large demand of statistical analysis of network data. However, the statistical tools that can be used directly are very limited at this stage. To this end, we develop the discrete choice model for network data. The model takes advantages of network structure and meets actual needs of the enterprises. We focus on the theories of model estimation methods, variable selection techniques and statistical inference based on network sampling. We intend to develop new statistical methods and further build up the theoretical framework for network data. At last, the newly proposed model can be applied to large-scale social networks. It can provide novel and efficient statistical tools in the study of network marketing, consumer behavior, and user portrait.

互联网和移动互联网的快速发展的一个重要标志即社交网站的兴起,由此产生了海量的网络结构数据。网络结构数据具有体量大、结构复杂、维度高等特点,在研究消费者行为、探求社会资本流动以及提供网站用户画像等方面起到了重要作用。这使得对网络结构数据的统计分析存在大量的实际需求。然而,现阶段能够直接使用的统计学工具却非常有限。本项目充分利用网络结构数据的特征和企业面临的实际需求,提出含网络结构的离散选择模型。重点研究模型的估计方法、变量选择方法和基于网络抽样的统计推断方法。试图建立围绕网络结构数据的统计分析新方法和理论体系。与此同时,本项目的研究能够广泛地应用于大规模网络结构数据,为互联网和移动互联网企业在网络营销、用户购买行为研究和用户画像等方面提供一类崭新而有效的统计工具,具有非常实际的应用价值。

项目摘要

项目的研究内容主要集中在两个方面,一是大规模网络结构数据的回归分析,包括模型的建立、估计以及理论性质的研究;二是以车联网数据为典型代表的应用研究。.在理论研究方面,主要的研究进展包括网络的生成机制研究和带有网络结构的回归分析研究。一方面,在网络生成机制的研究中,提出了用于解释网络生成的潜在移动平均模型。另一方面,在带有网络结构的回归分析的研究问题上,对带有时间序列特征的网络结构数据进行了统计分析,提出了网络向量自回归模型,重点研究了模型估计方法和理论性质,并且将这一模型应用于新浪微博数据的动态分析。该论文成果Network Vector Autoregression发表在Annals of Statistics上。此外,对于含网络结构的离散选择模型,利用网络结构数据和线性判别分析的工具解决分类问题。论文成果Network Linear Discriminant Analysis已经在Computational Statistics and Data Analysis上发表。另外一篇基于网络结构数据和逻辑回归模型解决分类问题的工作Network Logistic Regression Model也已经被Statistica Sinica接收。.在应用研究方面,关注以车联网数据和位置数据为主的统计分析与建模。在这一研究方向上,有2个重要的科研论文发表。论文Usage Based Insurance with POI data以UBI车险业务为研究对象。文章通过车联前装设备采集驾驶行为数据与车辆位置点数据,以车辆出险情况为因变量,建立逻辑回归模型。根据分析结果,文章对驾驶员出险风险进行细分,并且针对车险保费定价的实施给出了一定的解读与建议。项目负责人与车联网大数据公司有着长期的合作,研究所使用的数据部分来自该公司。论文的研究成果,已经被公司采纳并且落地成数据产品,帮助制定个性化UBI车险,为公司带来了一定的社会经济效益。另一篇论文A case study for Beijing Point of Interest Data Using Group Linked Cox Process研究了上百万数量级的位置数据,主要为新浪微博的北京市的签到数据。文章利用随机点过程中的Cox过程,将北京的位置点数据进行了分组和归纳,并且对北京的各类商圈聚集效应进行了解读。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
5

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021

潘蕊的其他基金

相似国自然基金

1

离散选择模型和受限因变量模型的前沿理论与应用研究

批准号:71001054
批准年份:2010
负责人:赵娜
学科分类:G0105
资助金额:17.70
项目类别:青年科学基金项目
2

线性区间模型的变量选择理论及其应用研究

批准号:71501115
批准年份:2015
负责人:杨威
学科分类:G0105
资助金额:17.40
项目类别:青年科学基金项目
3

基于前景理论的消费者离散选择行为模型及应用研究

批准号:71601127
批准年份:2016
负责人:苗蕴慧
学科分类:G0103
资助金额:17.50
项目类别:青年科学基金项目
4

离散时间系统△调制理论及其应用研究

批准号:60674113
批准年份:2006
负责人:盖如栋
学科分类:F0301
资助金额:8.00
项目类别:面上项目