Nowadays, people living in big cities are suffering from air pollution, energy consumption, and traffic jams. Those problems are caused by the large-scale human mobility in a city. This investigation aims to study the causal and semantic aspects regarding how and why traffic flows perform as such and reveal the spatial-temporal correlations from the prespective of big data. The main tasks are: (1) Correlation analysis on the spatial-temporal evoluatoin patterns of multimodal data. (2) Discovery of main routes and traffic bottlenecks from human trace similarity. (3) Region function discovery and spatial-temporal causal modeling of traffic in a mutual learning manner. The novelties lie in the following 2 points: (1) We have little knowledge about the city mobility patterns as well as the underlying social motivation and casue to result in such patterns. Studying it from the causal and semantic perspective is a new area so far. (2) The location data of people in a city are in a multimodal form such as GPS traces and check-in data on mobile internet. Development of theoretical framework to mine concepts, patterns, and correlations from such heterogeneous data should be the main focus of big dat science. In this study, we apply multimodal data in order to tackle the problem that may not be well solved based on the data from only one source.
当今碳排放、能源损耗、交通拥堵等"大城市病"困扰着我们,这与城市中大规模人群移动关系密切。本项目基于大数据时空关联分析进行城市交通流机理和语义挖掘的研究。包括:(1) 集群移动多源数据时空图谱关联分析;(2) 基于群体轨迹相似度的主要交通路线及脆弱性发现;(3)区域功能与交通流时空分布关联建模。特色:(1)由于人类对于自身活动规律、以及人类集群移动的社会动机和需求还知之甚少,大数据驱动的城市动力学机理研究、语义挖掘是一个新的领域。(2)城市中用户位置数据呈现多模态,如网络签到、GPS等,建立多模态数据的自动分析和理解的方法,从海量异构数据中自动挖掘出状态、模式、时空演化和关联规律,是城市大数据智能处理的基础科学问题之一。本项目结合了多种模态的数据进行研究,有可能更好地解决单一模态数据难以解决的问题。
基于大数据预测的交通流调控是城市大脑的主要目标,交通流时空关联规律挖掘是预测需要解决的主要问题,项目组提出基于稀疏表达的交通流预测方法,通过基于稀疏表达的变量选择自动发现与预测任务关联的节点,3000多个预测任务提前1小时平均预测精度高于86%,相比传统方法提高了约7%,同时发现了以下规律:(1)与某个预测任务关联的传感器并非固定,时空关联范围随着预测时间提前而扩大;(2)交通流的动力学演化可以看作是马尔可夫过程。提出基于PageRank的交通流动力学模型,发现了交通流演化的PageRank指数与随后的拥堵指数存在概率上的线性关系。研究了人类出行目的与城市规划之间的关系,提出基于稀疏表达技术挖掘城市功能各变量(POI)对于出租车上下客量的影响规律,客流预测精度约为76%。选址对于实体商业至关重要,提出利用稀疏表达技术从区域POI数据、出租车上下客量、地理信息、网络点评等异构数据中挖掘出各社会情境变量对商业活跃度的影响规律,对北京和上海商圈活跃度的预测精度平均为77%。提出基于深度学习识别遥感图像中的各类地物,基于地物类型预测区域商业活力的R2指标达到0.822;提出融合街景图像和遥感图像的商业活力预测。面向视觉和非视觉特征的融合判决,提出情境感知的神经网络集成技术,实验证明融合遥感图像、时空数据的商业活力预测性能优于单通道数据;提出了新的神经网络架构和工作机制,通过神经网络学习神经网络在不同情境下的行为特征,从而实现情境感知的自适应动态加权判决。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
空气电晕放电发展过程的特征发射光谱分析与放电识别
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
面向轨迹大数据的语义标注与语义模式挖掘算法研究
数据驱动的软件过程挖掘研究
数据驱动的人体图像语义分割研究
面向入侵检测的数据流挖掘研究