近年来我国电子商务的飞速发展,网上交易额占社会消费品零售总额的比重的持续扩大,对我国转变经济发展方式、扩大内需、调整经济结构产生了积极促进作用,同时,也存在缺乏权威的电子商务交易统计数据,未形成系统的和有针对性的预测方法等问题。现有文献表明,互联网搜索数据中蕴含了众多网民的搜索意图和行为倾向,应用这一"意图数据库"可以用来预测典型的社会经济行为。本课题拟探索微观的搜索行为与宏观的电子商务交易规模之间的关联关系,并选择3C这一主流网上交易商品为代表,采用基于网络搜索数据的方法来预测我国3C电子商务交易量,重点解决:①基本关键词词库的建立方法;②有预测能力的关键词选择方法;③搜索指数的合成方法;④基于搜索指数的预测模型及实证研究等问题。. 本课题所探索的是一种全新的预测方法,在电子商务全产业交易量的预测方面有创新价值,也可以为相关管理部门提供可靠而及时的决策依据。
在互联网经济和电子商务普及性应用时代,大数据极其应用得到快速发展。应用网络搜索数据分析和预测社会经济问题,已成成为当前学术热点。然而,《Nature》和《Sciences》先后发文指出利用网络搜索大数据应用与分析和预测社会经济热点时,容易出现大数据测不准的问题。探索利用网络搜索大数据应用的方法和技术方案问题,成为本项目解决的核心目标。基于,本项目立足于从理论方法建立和实证应用研究两个方面展开。.在理论分析和基础方法建立方面,本项目重点研究了五个方面的基础性问题:①比较了文本挖掘方法和调查问卷方法后,提出了基于搜索引擎推荐的启发式关键词库建立方法。该方法具有可操作性强、建立关键词库的速度快、可复制性好、成本低、预测效果好等优点;②分析了时差相关判别方法、赫斯特指数方法、动态时间弯曲方法在甄别有预测能力关键词的基础上,提出判别有预测能力关键词的组合方法TE-TDC。③提出了简单相加法、权重加权法、权重指数加权法、错位合成法和逐步合成法等五种网络搜索指数合成方法。④分析了网络搜索数据信号噪声产生的机理、提出了基于经验模态分解的搜索合成指数信号分解和噪声信号处理方法。⑤在预测模型的选择方面,比较分析了线性回归模型、时间序列模型和机器学习模型(包含支持向量机、随机森林和神经网络)在动态预测中的有效性。.在实践应用方面,本项目应用百度、google和淘宝站内的搜索数据实证分析过的问题包括:①预测了淘宝网的3C商品、服装品和美容护肤品等三大类商品的电子商务交易量;②预测了2010年上海世博会、2013年北京园博会、海南省旅游接待量等游客数量;③预测了汽车、房地产等大宗商品交易量;④预测了中国国家CPI、沪市等宏观经济指标;⑤预测了流感、艾滋病HIV、梅毒等流行疾病疫情。同时,还利用百度搜索数据建立了中国中小企业景气指数系统。.从诸多实证应用中,本项目研究后得到三个结论:其一,网络搜索数据可以作为电子商务交易与大宗商品交易、旅游客流量、流行疾病疫情和若干社会经济问题的先行指标,通过对相关网络搜索数据的监测,就可以对相关问题进行有效的预判,以利于政府、行业和企业即时采取应对策略;其二,网络搜索数据作为一种典型的大数据,其有效应用和精准的分析,还需要不断地在方法方面作出进一步的提高和改进;最后,网络搜索大数据还应该与其他多源数据相互融合才能更为有效地分析和预测社会经济问题。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
跨社交网络用户对齐技术综述
基于LASSO-SVMR模型城市生活需水量的预测
基于多模态信息特征融合的犯罪预测算法研究
城市轨道交通车站火灾情况下客流疏散能力评价
情绪因素对网络搜索预测的影响研究:以旅游市场为例
电子商务对农村社会网络的影响及作用机制研究——以江苏“淘宝村”为例
多维视角下的网络舆情预测研究——以公共政策网络舆情为例
我国农产品期货市场功能发挥与品种预测—以大豆和小麦为例