In order to provide historical PM2.5 concentration data with high spatial and temporal resolution for the acute and chronic health effects assessment of PM2.5 in China, this study is designed to use the multi-source data, and integrate chemical transport model, satellite remote sensing, and machine learning techniques to build hybrid models and simulate historical PM2.5 concentration. We collect and use all available related variables in our machine learning modeling work, including satellite aerosol optical depth (AOD) data, surface albedo rate data, the output of the chemical transport model (CTMs), land use parameters (including road density, population density, impervious area, etc.), vegetation coverage index, and meteorological variables, etc. We use ten-fold cross validation and variable-grouping-and-selecting to observe and improved the PM2.5 concentration prediction machine learning models; We select Beijing-Tianjin-Hebei region, which has high haze occurrence frequency and high population density as the study area. (We have good data base in this region). We use the monitoring data of daily PM2.5 concentration from 2012 to 2016 to train and validate the model, and simulate the daily average concentration of PM2.5 in 2010-2016 in the study area with the spatial resolution of 1km grid. This study proposes a set of PM2.5 concentration simulation parameters based on machine learning methods, and provides a new method for the high-resolution simulation of PM2.5 concentration in China. The high spatial and temporal resolution of the historical PM2.5 concentration simulation results obtained in this study can provide reliable short-term exposure and long-term exposure data for the assessment of acute and chronic health effects of PM2.5 in epidemiological studies.
为了得到高时空分辨率的PM2.5历史浓度数据,支撑我国PM2.5急性和慢性健康效应评估,本研究拟利用多源时空数据,综合化学传输模型、卫星遥感、机器学习等技术手段,构建基于多变量(包括卫星AOD数据、地表反照率数据、化学传输模型的输出、土地利用参数、植被指数、气象变量等)的PM2.5浓度模拟预测机器学习模型;以我国雾霾发生频率较高、人口密度大、具有一定数据基础的京津冀地区为研究区,用2012年以来的监测数据训练和验证模型,并用十折交叉验证和参数调整改进模型(R2>0.85);模拟出2010-2016年研究区1km网格的逐日PM2.5日均浓度。本研究构建的基于机器学习方法的PM2.5浓度模拟参数集和模型,为我国历史PM2.5浓度的时空模拟,提供了新的方法。本研究得到的高时空分辨率历史PM2.5浓度模拟结果,可为流行病学研究中PM2.5的急性和慢性健康效应评估提供较为可靠的暴露数据。
近20年来京津冀地区由于经济的高速发展,细颗粒物(粒径小于2.5μm的颗粒物,particulate matter, PM2.5)污染对人体健康和生态环境造成了较大的危害。监测站点可对污染物进行高时间频率的测量,但是不能很好地反映PM2.5的空间变化,并且存在历史数据缺乏的问题。随着卫星遥感的不断发展,高时空分辨率的气溶胶光学厚度(AOD)逐渐被用于模拟PM2.5浓度,但模拟准确性和空间分辨率均需提高。同时卫星反演的AOD数据也往往存在着数据空间覆盖率不足的问题。本文研究的目的是提升京津冀地区PM2.5模拟精度并估算历史PM2.5的时空分布,以及解决卫星遥感AOD存在的空间覆盖率低等问题。.本研究基于京津冀地区2013~2016年逐日的PM2.5监测站数据,结合MODIS AOD数据、气象因素、气象滞后因素、植被覆盖因素、土地利用因素等构建随机森林模型,模拟了2010~2016年高时空分辨率(0.01°× 0.01°,每日)PM2.5浓度,结果显示模型有良好的表现(cv-R2=0.83,test-R2=0.86)。研究考虑加入了气象滞后效应对模型的影响,发现边界层高度滞后一天的数据对模型有着重要的贡献。AOD和高程变量也是模型构建的重要因素。模拟结果显示京津冀地区有着明显的季节分布特征和空间分布特征,冬季PM2.5浓度最高,同时研究区的南部平原地区的PM2.5浓度高于北部地区。.本研究构建的基于机器学习方法的PM2.5浓度模拟参数集和模型,为我国历史PM2.5浓度的时空模拟并提升时空分辨率和模拟精度,提供了新的方法。本研究得到的高时空分辨率历史PM2.5浓度模拟结果,形成了一套京津冀地区高精度逐日1km网格PM2.5浓度时空数据集,可为环境流行病学研究中PM2.5的急性和慢性健康效应评估提供较为可靠的暴露数据。
{{i.achievement_title}}
数据更新时间:2023-05-31
Intensive photocatalytic activity enhancement of Bi5O7I via coupling with band structure and content adjustable BiOBrxI1-x
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
基于LASSO-SVMR模型城市生活需水量的预测
基于SSVEP 直接脑控机器人方向和速度研究
基于机器学习和数据融合技术的高分辨率PM2.5浓度估算研究
基于LUR和空间杜宾模型耦合的PM2.5浓度时空精细模拟研究
基于多源遥感数据和深度学习的城市高时空分辨率动态人口分布估算
基于时空大数据的中国区域小时级精细分辨率PM2.5浓度分布研究