The world is now confronted with the pressing problem of the increasingly frequent occurrence of air pollution. The statistical modelling and deep learning are effective tools to analyze and predict the pollution data. Because of the massive pollution information and the seasonal difference, the static generalized Pareto distribution can’t perfectly match the time-related observed data. To solve this, this program aims to refine the big data of pollution, to screen record values, and based on which, take the application of dynamic generalized Pareto distribution, semiparametric regression and deep learning in air pollution as objects of study, conducting scientific research on the inference method and the prediction theory of record values. The research mainly contains: (1) according to the initial recorded pollution value, refine the record value sequence, building suitable fitting model and accurately estimate model parameter, which proves the superiority of this estimating method; (2) to provide prediction methods of upper records; (3) to use semiparametric regression and deep learning to establish a model of quantitative predication of pollution. The project aims to study the regularity and trend of pollution events, to establish an appropriate model for forecasting record-breaking pollution data and estimate the interval of record-breaking pollution, to build an effective risk protection program so that people can quickly respond to air pollution. The study can promote the development of eco-environment and make an active contribution to the combination of artificial intelligence and statistical modelling.
空气污染已成为全球面临的重大难题,统计建模理论和深度学习方法是缓解该问题的有效工具。面对监测到的空气污染大数据,为了提高预测能力,需首先对海量数据进行预处理,剔除影响估计精度的较小观测值,精炼筛选出高记录值。其次由于我国空气污染数据具有明显季节特征和周末效应,需考虑时间成分拟合恰当模型。为了解决这一问题,本项目基于污染物浓度数据,以参数模型、高维半参数模型、深度学习预测模型为研究对象,对其在我国空气质量分析中的应用进行统计推断。具体内容包括:(1)基于高记录值建立动态阈值的厚尾模型,研究模型适用的参数估计方法,特别是对尾指数的估计;(2)理论上给出动态阈值厚尾模型高记录值的预测方法;(3)融合应用高维半参数模型、深度学习技术,预测污染物浓度。本项目旨在揭示我国空气质量变化的规律性,评价空气污染治理效果,推动生态环境领域发展,为促进人工智能与统计建模的有机结合做出积极贡献。
空气污染已成为破坏人类生存环境的全球性问题,直接关系经济社会发展和生态环境建设。统计建模理论和机器学习方法是缓解该问题的有效工具。统计方法与人工智能技术相结合分析空气质量问题,是一个值得深入研究的课题。本项目结合统计方法与机器学习技术优势,研究污染物浓度有效的预测方法。首先,在前期研究参数估计的基础上,提出适用于超阈值下广义Pareto分布模型的估计方法,通过阈值选择确定合理阈值,筛选超阈值数据,估计模型参数,预测极端污染物浓度。其次,提出适用于高记录值下广义Pareto分布模型的估计方法,特别是针对形状参数未知时广义Pareto分布的参数估计方法,并对所提估计方法的估计精度与已有方法进行比较,结果显示所提方法具有较高的估计精度。项目组在模型参数点估计的基础上,针对高记录值样本,提出了参数所对应枢轴量的精确分布,进一步研究了位置和刻度参数的区间估计问题。第三,在理论研究的基础上,项目组利用三种不同类型的数据(超阈值、高记录值、时间序列),建立基于广义Pareto分布的预测模型;借助核机器技术进行参数估计和变量选择,拟合高维半参数模型;使用生成对抗网络尝试数据增广,结合深度学习思想,充分发掘数据特征,利用长短期记忆网络方法对未来空气污染物浓度进行预测。这些研究丰富了广义Pareto分布统计推断问题的理论成果,发挥统计方法与机器学习的技术优势,为首都大气污染防治工作提供了理论依据和有力工具。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
涡度相关技术及其在陆地生态系统通量研究中的应用
跨社交网络用户对齐技术综述
粗颗粒土的静止土压力系数非线性分析与计算方法
基于SSVEP 直接脑控机器人方向和速度研究
基于光子统计特性的深度学习鬼成像理论与算法研究
基于模糊建模和深度学习的图像质量评价
基于深度学习与统计特征模型的视频重编码检测技术研究
基于统计学习的复杂系统建模及控制技术研究