The wide use of GPS devices in real life leads to the generation of a large number of spatio-temporal data of moving objects from multiple platforms. After linking all accounts belonging to the same user, we can obtain abundant data, which can support many real applications. Although existing work has made great contributions in user linkage, the methods proposed in their work cannot link users from multiple platforms simultaneously. This is because the results are returned by computing user similarity between all user pairs, then they will face the problem of user combination explosion. As a result, this project proposes the idea of linking users from multiple platforms based on spatio-temporal data. The key scientific issues to be solved contain user similarity transfer failure and user combination explosion. The specific research contents include: (1) cleaning the spatio-temporal data from multiple platforms; (2) constructing the spatio-temporal index structure; (3) computing the similarity between multiple users; (4) exploring the pruning strategy for the problem of user combination explosion.
随着GPS设备在日常生活中的广泛应用,人们获得了大量来自不同平台移动对象的时空数据。通过跨平台的用户连接可以获得丰富的原始数据,为其他诸多应用提供坚实的数据基础。虽然目前的工作在跨两个平台的用户连接方面做出了重要的贡献,但是这些工作中提出的方法无法解决多(三个及以上)平台用户连接的问题。这主要是因为现有方法是通过枚举用户对并计算相似度来实现用户连接的,而这些方法在多平台的环境下会面临用户对数量爆炸增长的问题。面对这种现象,本课题提出了基于时空数据同时连接来自多平台用户的概念并展开详细研究。在研究的过程中拟解决两个关键科学问题:相似度传递失效问题、用户组合数爆炸问题。具体研究内容包括:(1) 开展多平台时空数据的清洗;(2) 开展多平台时空索引的构建;(3) 开展多平台用户相似度的计算;(4) 探索针对用户组合数爆炸问题的剪枝策略。
GPS设备在日常生活中的广泛普及使得人们获得了大量来自不同平台的时空数据。在跨平台的场景下,用户连接可以帮助人们获得和用户相关的大量原始数据。当前的跨平台用户连接工作主要集中在两个平台之间,无法有效解决跨三个及以上平台的用户连接。这主要是因为随着平台数的增加,潜在的用户组合数会呈现爆炸增长的趋势。为解决该问题,本项目围绕减少计算量的核心思想,展开了多平台时空数据清洗、多平台时空索引构建、多平台用户相似度计算以及针对用户组合数爆炸问题的剪枝设计等工作。本项目研究将从效率和准确率两个方面帮助人们获得高质量的跨平台用户数据集,这有利于后续的地图导航、在线推荐、广告投放等应用。项目研究过程中发表了11篇高质量论文,并申请了专利和软件著作权。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
多源数据驱动CNN-GRU模型的公交客流量分类预测
circ_0000817抑制 IGF2BP3/ GPER1轴逆转雌激素促甲状腺乳头状癌作用与机制研究
基于轨迹数据的用户意图挖掘关键技术研究
基于多源监测数据融合的云平台故障诊断关键技术研究
基于用户意图的语义大数据处理关键技术研究
多平台PSInSAR的关键技术研究