Event detection is a hot topic of information processing research area. An event can be defined as a thing occurred at a specific time and location. Therefore, it is an important task to exact the location accurately and do analysis on those event related locations. However, existing event detection methods do not pay much attention on this, and have some deficiencies: (1) They cannot obtain the accurate geographic information in text, which lead to the uncertainty of final event's location. (2) They do not calculate the relevance on text's spatial relationship and geo-semantics, so the events are lack of necessary geographical and spatial reference. (3) No further spatial analysis and spatial data mining research can be done appositely on those events, and no spatial distribution knowledge can be concluded too. To solve the problems above, this project will use geographical information retrieval approaches and spatial data mining technologies, combines with the traditional information processing methods to do geo-location related event detection and knowledge discovery. Microblogging is a new type of social media, with wide coverage, high degree of precision, large amount of information, spread fast, real-time updates and many other features. Moreover, microblogging data is in rich of geospatial information, which can be used for event detection. This project focuses on Sina Weibo data, do researches below: (1) Design effective place name recognition and disambiguation method based on those kinds of geospatial information, (2) Establish self-adaptive geospatial semantic relevancy and text semantic relevancy fusion model, and to achieve the detection of geo-location related events. (3) Do spatial data mining on those events, in order to find spatio-temporal abnormal cluster patterns. These researches will give effective methodology and technologies support on detection of place of occurrence, spatial distribution, spatio-temporal evolution of events in text. Also improving the accuracy and real-timing.
事件检测是信息处理领域的研究热点,对事件发生地点的准确识别和分析是事件检测的一个重要组成部分。然而,现有事件检测方法在文本地理信息的获取和文本地理空间语义关系的计算上存在不足,使得提取事件时缺乏必要的位置关系参考,事件定位困难,也无法对事件的空间分布进行有效分析。本项目利用地理信息检索、空间数据挖掘的相关技术方法,与传统信息处理方法相结合,进行位置相关事件的检测及数据挖掘研究。微博是一种新型的社交媒体,具有信息量大、实时更新等特点,并且微博数据中含有丰富的地理空间信息。本项目拟以新浪微博数据为研究对象,设计有效的地名识别与消歧方法,建立自适应的地理空间语义相关度和文本语义相关度融合模型,以实现位置相关事件的检测。更进一步的,对这些事件在时空分布上的显著聚集效果和异常聚类模式进行挖掘。本项目的研究将为及时、准确的获悉事件的发生地、空间分布、时空演化等提供有效的方法和技术支持。
事件检测是信息处理领域的研究热点,对事件发生地点的准确识别和分析是事件检测的一个重要组成部分。然而,现有事件检测方法在文本地理信息的获取和文本地理空间语义关系的计算上存在不足,使得提取事件时缺乏必要的位置关系参考,事件定位困难,也无法对事件的空间分布进行有效分析。本项目以新浪微博数据为研究对象,利用地理信息检索、空间数据挖掘的相关技术方法,与传统信息处理方法相结合,进行位置相关事件的检测及数据挖掘研究。. 项目建立了北京市微博签到数据库。该数据库完整的记录了北京市98万微博用户自注册帐号至2016年9月为止的1100多万条签到行为,以及近20万条包含地理位置信息的兴趣点分类数据,对于开展微博事件检测和轨迹行为分析等研究提供了重要基础。. 经过持续四年的研究,项目提出了位置相关的微博时空热点事件检测方法,点集数据不规则形状时空异常聚类模式挖掘算法,完成了立项时的两项核心任务。研究成果可为及时、准确的获悉事件的发生地、空间分布、时空演化等提供有效的方法和技术支持。. 与此同时,项目还针对微博文本的情感度分析、北京市与非北京市微博用户的签到行为差异性、POI数据的自动分类方法、城市热点功能区识别、地理语义相结合的签到轨迹相似度度量,以及地理空间网络的社区结构发现等相关内容展开了深入的分析挖掘研究。在利用微博大数据开展人群活动的分析、城市空间结构分析方面提出了创新性的方法。研究成果可用于城市结构优化、城市资源优化配置和城市发展规划等应用领域。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
监管的非对称性、盈余管理模式选择与证监会执法效率?
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
基于全模式全聚焦方法的裂纹超声成像定量检测
面向时空轨迹数据异常和关联模式的挖掘模型
面向微博数据流的事件主线挖掘技术研究
面向微博的实时事件深度挖掘研究
面向视频结构分析和事件检测的非监督模式挖掘技术