As traditional land use classification methods usually employ remote sensing data, the social functions of urban areas are classified coarsely, and moreover the social function intensity of urban areas can not be measured. Thus the decision on land use and road planning is irrational, and the accuracy of advertisement cast, social recommendation and location choosing for a business is also affected.. The development of information and communication technology makes it possible to obtain massive spaito-temporal data. As these data implies rich information on social functions of urban areas, this project perform social function mining using massive spaito-temporal data. As the social function of urban areas is usually not unique, and the attraction degree of different locations within the same functional area is also inconsistent, the project measures the social function of urban areas by computing function distribution vectors and function intensity.. On the basis of points of interest, we use GPS of taxis to obtain massive spaito-temporal data. We employ data mining, statistical analysis, and cloud computing technologies, and construct a valid taxi trajectory selecting model, a maps segmentation model, a Dirichlet multinomial regression model on function distribution, and kernel density estimation model on function intensity. Therefore, we can achieve accurate calculation of the function distribution and functional intensity, and provide scientific support for urban planning and commercial applications.
传统土地用途分类方法多使用遥感数据,对城市区域的社会功能分类较为粗糙,而且无法对社会功能的强度进行度量,造成土地使用和道路规划的不合理,也影响了移动互联网时代下广告投放、社交推荐和商业寻址应用的准确性。.信息通讯技术的发展,使得获取海量时空数据成为可能,这些数据又隐含着反映城市区域社会功能的丰富信息,所以本项目借助海量时空数据进行城市区域的社会功能挖掘。由于城市区域的社会功能通常不唯一,同一功能区域内不同位置处的吸引力也不一致,本项目通过计算功能分布向量和功能强度两指标来精确度量城市区域的社会功能。.本研究在兴趣点信息的基础上,利用出租车GPS获取海量时空数据,集成数据挖掘、空间统计分析和云计算等技术,通过构建有效出租车轨迹选取模型、地图分割模型、区域功能分布的狄利克雷多项式回归模型和区域功能强度的核密度估计模型,实现功能分布和功能强度的精确计算,为城市规划和商业应用提供科学支撑。
近些年随着信息通讯技术的发展,获取关于人群移动的海量时空数据成为了可能。本项目研究如何利用数据挖掘方法从人群移动的海量时空数据中获取有价值的信息。针对异常信息检测,提出了一种基于谱聚类的入侵检测方法,可以有效的提高检测的准确率和召回率。针对图像处理和图像识别,提出了一种迁移学习模型,通过构造极大一致分布子集可以很好的将辅助域的信息迁移到目标域中,从而提升目标域上的分类性能。该方法在多个UCI数据集上获得了良好的学习效果。此外,本项目团队提出了一种基于维数扩充的字符变量属性数值化方法,对比传统的字符变量属性离散化处理方法,提出的新方法可以使分类算法具有更高的性能。针对隐语义或隐空间模型的研究,提出了一种集成用户潜在因子向量的推荐方法,该方法通过UV分解可以很好的获取辅助域上用户和项目的隐空间表示。提出了一种基于非负矩阵分解的固有属性提取办法,可以有效地在隐空间抽取不变特征。另外,本项目团队还提出了一种基于局部加权线性回归的跨域迁移方法。针对海量数据高效分类研究,本项目团队提出了一种基于LDA主动学习的大规模数据分类算法;提出了一种基于蚁群优化的转导推理支持向量机算法。这些方法可以有效的提高海量数据分类的准确度与效率。此外,我们对大数据处理方法进行了综述。上述研究拓展了传统数据挖掘方法在城市计算领域的应用,具有重要的理论和应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
基于LASSO-SVMR模型城市生活需水量的预测
内点最大化与冗余点控制的小型无人机遥感图像配准
钢筋混凝土带翼缘剪力墙破坏机理研究
基于海量时空数据的城市居民移动模式研究
基于语义距离的分布式数据挖掘理论与方法
基于云计算的海量数据挖掘
基于数据挖掘的区域急诊疾病谱时空预测模型研究