面向微博的地理兴趣点抽取及其用户行为意图分析研究

基本信息
批准号:61502344
项目类别:青年科学基金项目
资助金额:21.00
负责人:李晨亮
学科分类:
依托单位:武汉大学
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:孙爱欣,史玉玲,张平,王浩然,刘潇阳,孙月明
关键词:
Web信息抽取
结项摘要

Given the real-time information sharing in microblogs, user location identification based on the content of microblogs has become an important research area. This class of techniques provides scientific support for personalized location services, advertisement and smart city, and so on. Existing studies mainly reply on the explicit location sharing of the users, which cannot provides fine-grained location estimation, or the extracted user behavior intent is unknown for the above applications. In this project, based on the content of microblogs, our endeavor is devoted to the development of point-of-interest (POI) extraction, POI location identification and POI-specific user behavior intent analysis, aiming at inferring user’s location, activity schedule and content in a fine-grained scale. Following the text mining and natural language processing methodology, we intensively address the following aspects: (1) the extraction, transformation and representation of the semantic and contextual features regarding POI; (2) POI location estimation approach based on both the spatial behavior pattern and spatial topic distribution; (3) the extraction and measurement of the temporal awareness features regarding POI. This project will make significant contribution to the development of text processing techniques and fulfill the requirements on the user geographical data analysis from industry.

微博实时的信息分享使得基于微博内容开展用户位置研究变成一个重要研究内容,这类技术的发展对个性化地理服务、广告营销和智慧城市等领域提供了科学技术层面的支持。现有研究工作主要依赖于用户的主动地理信息分享,由于其位置分析精细度较低并且用户行为意图信息不明,这些技术很难支撑上述应用。本课题旨在通过分析用户微博内容,依次研究微博地理兴趣点(POI)抽取算法, POI地理位置推断算法和用户关于POI的行为意图分析算法,实现细粒度地获知用户的地理位置、活动计划和内容的目标。项目将采用文本挖掘与自然语言处理相关技术理论,重点研究:(1)POI词条的语义语境特征的抽取、转换和表征方法;(2)基于空间行为模式与空间主题分布的POI位置推断方法;(3)用户关于POI的时间趋势特征抽取与度量方法。本项研究对于推动文本处理技术的进一步发展以及满足应用领域对用户地理信息分析的需求,具有重要的科学意义和应用价值。

项目摘要

微博实时的信息分享使得基于微博内容开展用户位置研究变成一个重要研究内容,这类技术的发展对个性化地理服务、广告营销和智慧城市等领域提供了科学技术层面的支持。现有研究工作主要依赖于用户的主动地理信息分享,由于其位置分析精细度较低并且用户行为意图信息不明,这些技术很难支撑上述应用。本课题旨在通过分析用户微博内容,依次研究微博地理兴趣点(POI)抽取算法, POI地理位置推断算法和用户关于POI的行为意图分析算法,实现细粒度地获知用户的地理位置、活动计划和内容的目标。项目将采用文本挖掘与自然语言处理相关技术理论,重点研究:(1)POI词条的语义语境特征的抽取、转换和表征方法;(2)基于空间行为模式与空间主题分布的POI位置推断方法;(3)用户关于POI的时间趋势特征抽取与度量方法。本项目经过三年的科学研究,在短文本的主题建模、微博文本POI的抽取及其用户时间趋势解析、和无监督和零样本的文本分类与过滤三个方面取得了一系列的研究成果。项目结合深度学习词向量表示,提出了一种利用波利亚罐子模型来缓解短文本单词共生信息稀疏的短文本主题模型,并进一步提出了基于泊松分布的新短文本主题模型,通过引入自适应调节短文本主题个数,从而实现细粒度的短文本的主题建模效果。与此同时,项目研制了一种新的二阶段的地理兴趣点抽取及其用户时间趋势解析算法。该工作发现地理兴趣点抽取与用户时间趋势解析两个任务所涉及的特征信息并不相同。地理兴趣点的抽取主要涉及微博文本中地理兴趣点的语境特点、语言学特征和地理兴趣点词典特征。然而,对于时间趋势解析任务,其更多的涉及微博的语言学特征与时间信息。在真实微博数据集上的测试表明,该工作提出的二阶段算法显著优于现有前沿算法。最后,项目就文本分类深入研究无监督的文本分类与基于深度学习的零样本文本过滤技术,为POI相关语义语境特征的获取扩展了更多的思路和技术途径。本项研究对于推动文本处理技术的进一步发展以及满足应用领域对用户地理信息分析的需求,具有重要的科学意义和应用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

中外学术论文与期刊的宏观差距分析及改进建议

中外学术论文与期刊的宏观差距分析及改进建议

DOI:
发表时间:2021
2

环境信息披露会影响分析师盈余预测吗?

环境信息披露会影响分析师盈余预测吗?

DOI:
发表时间:2017
3

国际比较视野下我国开放政府数据的现状、问题与对策

国际比较视野下我国开放政府数据的现状、问题与对策

DOI:
发表时间:2016
4

水文水力学模型及其在洪水风险分析中的应用

水文水力学模型及其在洪水风险分析中的应用

DOI:
发表时间:2019
5

基于体素化图卷积网络的三维点云目标检测方法

基于体素化图卷积网络的三维点云目标检测方法

DOI:10.3788/IRLA20200500
发表时间:2021

李晨亮的其他基金

相似国自然基金

1

面向微博的用户动态兴趣建模和智能推荐方法研究

批准号:61702176
批准年份:2017
负责人:杨超
学科分类:F0207
资助金额:21.00
项目类别:青年科学基金项目
2

面向用户意图的行为轨迹搜索与推荐系统

批准号:61402312
批准年份:2014
负责人:许佳捷
学科分类:F0202
资助金额:26.00
项目类别:青年科学基金项目
3

基于用户言语行为的微博内容挖掘研究

批准号:61272291
批准年份:2012
负责人:李文捷
学科分类:F0211
资助金额:80.00
项目类别:面上项目
4

基于随机博弈网的微博用户行为及信息传播分析

批准号:61303244
批准年份:2013
负责人:李静远
学科分类:F0206
资助金额:25.00
项目类别:青年科学基金项目