基于ARIMA模型的PM(2.5)预测
2024-01-09
来源:年旅网
第21卷 第6期 201 4年 工安全与环境 程 Vo1.2l NO.6 NOV. 2014 11月 Safety and Environmental Engineering 基于ARIMA模型的PM2.5预测 彭斯俊,沈加超,朱 雪 (武汉理工大学理学院,湖北武汉430070) 摘要:PMz.s的精确预测是大气污染评价和治理的关键性工作。本文针对PM 浓度变化的时间序列分布特征, 结合环境监测站提供的相关数据,应用自回归移动平均模型(ARIMA(p,d,q))预测短期PM 的日平均浓度。结 果表明:由于PMz s浓度变化受气象场、排放源、复杂下垫面、理化生过程的耦合等多种因素的影响,不同时段内的 变化模式存在巨大差异,因此采用分时段序列预测模型可以提高PM 的预测精度;通过将分时段序列模型与灰色 GM(1,1)模型和全年时间序列模型的预测结果进行对比,发现该模型预测效果更好。 关键词:PM s;时间序列;ARIMA模型;预测 中图分类号:X823 文献标识码:A 文章编号:1671—1556(2014)06—0125—04 Forecast of PM25 Based on the ARIMA Model .PENG Si—j un,SHEN Jia—chao,ZHU Xue (School of Science,Wuhan University of Technology,Wuhan 430070,China) Abstract:The accurate forecast of PM2 5 is key work of atmospheric pollutant assessment and management. According to the characteristics of time series of concentration chang of PM25 and with data provided by .the environmental monitoring station,this research adopts ARIMA( ,d,q)(Auto—regression Integrated Moving Average)model to forecast the daily average concentration of PM2The results show that there 5..are different patterns in different periods because the daily average concentration of PM2 5 varies greatly with time influenced by meteorological field,emission source,complex underlying surface,physical chemis— try reaction and SO on.So the paper chooses different models in different periods in order to improve the ac— curacy of forecast.Compared with the gray model and the annual time series model,the different models in different periods are proved to have better performance. Key words:PM25;time series;ARIMA mode1;forecast .伴随着经济的高速发展和城市的工业化进程, PM . 污染问题日益严重,已经成为发达国家和发展 1 PM。. 中国家共同关注的问题。PM . 一般指大气中的细 预测方法概述 颗粒物,它通过对太阳光的吸收、散射或反射,降低 大气能见度,导致太阳辐射强度减弱与日照时数的 减少,是雾霾天气的元凶之一。这种气溶胶微粒被 吸人人体后,会渗透到肺部组织的深处,可引起支气 PM 浓度预测方法主要有数值模式方法和统 计方法两种。由于数值模式方法需要较详尽的源强 时空分布资料和分辨率很高的气象模式,因此对现 阶段我国大多数城市而言,发展数值预测模式并不 成熟。国外对大气污染物进行统计预测应用较为广 泛,主要采用多元统计分析理论、灰色预测模型 GM(1,1)、神经网络预测模型等预测方法,目前应 管炎和肺癌等病变。对于大气污染尤其是空气细粒 子的准确预报,能提醒人们及时采取有效措施,保护 身体健康。PM . 作为城市大气污染治理的首要目 标,建立合理精确的预测模型具有非常重要的现实 收稿日期:2014—03—24 修回日期:2014—07 04 基金项目:国家自然科学基金项目(91324201) 作者简介:彭斯俊(1964一),男,博士,教授,主要从事大气污染物预测等方面的研究。E—mail:whutpsj@163.corn 126 安全与环境工程 第21卷 用比较广泛的是神经网络预测模型l1],它是拟合非 线性现象的强有力工具,但其具有易陷入局部最优、 过拟合、很难确定网络结构等问题,影响预测模型的 泛化能力 J。 时间序列分析方法属于统计学范畴,该方法通 过研究、分析和处理时间序列,提取出系统的相关信 息,从而揭示时间序列本身的结构与规律,挖掘系统 的固有特性,掌握系统与外界的联系,推断出系统的 未来变化趋势 ]。时间序列预测方法分为自回归模 型(AR)、移动平均模型(MA)、自回归移动平均模 型(ARIMA)等。尤其以Box和Jenkins提出的 ARIMA模型最为经典,它有效地结合了AR和 MA模型的优点,并且适用于非平稳时间序列。时 间序列分析方法已经不仅仅是一种数据处理的方 法,它已演变为一种系统分析的研究方法。某一监 测站的PM 的监测值随时间的推移而发生改变, 因此大气污染物浓度变化可以被看作是非平稳的时 间序列,通过对相关监测值建立时间序列模型,并以 历史资料进行参数估计,就可以进行模拟预测。 2 ARIMA模型及其算法 ARIMA模型作为一类常用的随机时间序列模 型,是一种精度较高的时间序列短期预测方法l_4]。 对此模型的分析研究,能够更好地认识时间序列的 结构与特征,获得最小方差意义下的最优预测。 2.1 ARIMA模型原理 具有如下结构的模型称为自回归移动平均模 型,即ARIMA(P,d,q)模型[ : r (L)A Y 一C+@(L)£ l E(e )一0 j Va (£ )一0 ( ) } fE(e ,£ )一0(s≠£) l{E(y ,e )一0(V < ) 式中:L为延迟算子;A 一(1一L) ,其中d为差分 阶数;Y 为时间序列;P为自回归多项式阶数;q为 移动平均多项式阶数;C为常数项 (£一1,2,…)为 高斯白噪声序列;S和 表示时间序列的不同时刻; E(s )为£时刻白噪声序列的均值;Vat(£ )为t时刻 白噪声序列的方差;E(s ,e )为t与s时刻白噪声序 列的协方差;E(y ,e )为{Y }序列t时刻与白噪声 序列s时亥0的协方差; (L)一1一 L一 L 一…一 声 为ARMA(p,g)模型自回归系数多项式,其中 ( 一1,2,…,户)为自回归多项式的待估系数;@ (L)一1+ L+ 2L +…+ L 为ARMA(P,q)模 型移动平均系数多项式,其中0 ( 一1,2,…,q)为模 型移动平均多项式的待估系数。 式(1)可以简记为 的 一 + e (2) 式中: 为时间序列y 的均值。 2.2 ARIMA模型算法步骤 ARIMA(P,d,q)模型的具体求解步骤_6 如下: (1)根据时间序列的散点图或折线图对序列进 行初步的平稳性判断,并采用ADF单位根对序列 的平稳性进行检验。对非平稳的时间序列,进行差 分处理,直至成为平稳序列,此时差分的次数即为 ARIMA(P,d,q)模型中的阶数d。 (2)计算时间序列样本的自相关系数(Auto— correlation)和偏自相关系数(Partial correlation), 并对模型中的P和q两个参数进行多种组合选择, 两个AIC和SC函数值达到最小的模型为相对最优 模型。 (3)利用最小二乘法对ARMA(P,g)模型 P+q+24"参数进行估计,并进行显著性检验。通 常应剔除不显著参数所对应的自变量并重新拟合模 型,以构造出结构更精炼的拟合模型。 (4)检验模型对原时间序列的拟合效果,即检 验残差序列是否为白噪声序列。 (5)根据检验和比较的结果,确定模型,并利用 该模型进行预测。 3 实证分析 3.1数据来源 本文采用武汉市环境监测站提供的2013年武 汉市大气PM . 日平均浓度数据资料,选取的时间 段为2013年1月1日至12月31日,除临时停电、 仪器故障等偶然因素存在缺失数据l3个外,共有 352个数据。为了能够反映PM . 时间序列的连续 性和可靠性,针对缺失数据,采用多重替代法 对原 数据进行了插补。 由2013年武汉市大气PM . 日平均浓度分布 图(见图1)可以看出,不同时间段浓度序列差异很 大。其中,1~3月份,由于排放源较多、温度较低, 不利于污染物的扩散,3O 的天数为重度污染,且污 染物浓度序列波动剧烈;10~12月份污染程度次 之;4~6月份和7~9月份,由于受降雨较多对污染 物有一定的冲刷作用的影响,为轻度污染,且污染物 浓度序列波动相对较缓。通过作分时段的PM。 浓 128 安全与环境工程 第21卷 以1~3月份为例,图4给出了ARIMA(2,1,1)模型 的残差Q检验图。由图4可见,白噪声的概率很大, 故不能拒绝序列相互独立的原假设,检验通过。 自相关系数 偏自相关系数 AC PAC O.Stat Prob l i il i 1 0 025 0025 00561 I I i i I i 2—0061-0 062 03936 I i ii 3.0005—0∞2 0 3957 I 目i i 盈i 4 0119 0116 1 7080 0191 l I i I 5-0 029—0 036 1 7869 040g l I i l l 6 0 022 0038 1 8332 0 608 ll i I l 7.0 052-0 058 2 O957 0 718 iI l i_ l 8-8 085.0 095 2 8109 072c il l i E l 9—01O6_01O2 3 9315 0 68£ i I I i 1 0 10 0084 0 073 4 6378 0 704 ili i 圈i 11 0128 0133 6 3154 0 61: ii I i 12—0037—0 017 64559 0 694 ii i i 13-0057.0 022 6 7977 0744 i 日i i 目i 14 O128 01O8 8 5390 0 66 图4 ARIMA(2,1,1)模型的残差Q检验图 Fig.4 Residual plot of ARIMA(2,1,1) 3.4预测结果与分析 利用灰色GM(1,1)模型、全年时间序列模型和 分时段序列模型这三种预测模型对各不同时段最后 一天的PM . 浓度进行预测,其预测结果见表2。 表2不同模型预测的各不同时段最后一天的 PMz.s浓度( g/m ) Table 2 PM 2.5 concentration forecast of the last day of different periods based on different models 由表2可以看出:分时段序列模型的相对误差 均不超过1O ,预测效果最好;分时段序列预测模 型,1~3月份和10~12月份PM。. 浓度的预测值较 高,分别属于中度污染和重度污染,4~6月份和 7~9B份PMz.s浓度的预测值相对较低,分别表示 空气质量状况为良和轻度污染。 4结论与建议 本文利用武汉市环境监测站提供的武汉市 2013年大气PM . 日平均浓度数据资料,根据不同 时段污染物浓度的分布特征,建立了分时段ARI— MA(P,d,q)预测模型,并预测不同时段最后一天污 染物PM . 浓度,通过将其与灰色GM(1,1)模型和 全年时间序列模型的预测结果进行对比验证,结果 显示分时段序列模型总体平均相对误差在8 左 右,表明该模型预测效果更好。 ARIMA模型能较好地拟合PM 浓度变化趋 势,但是由于PM . 浓度变化受到气象条件和排放 源等多方面因素的影响以及模型本身的限制因素, 只能进行短期预测,今后可结合非线性动力学方法 等对其进行改进[g]。 时间序列ARIMA模型是一种较为理想的 PM . 浓度的短期预测方法,该模型灵活,便于处理, 具有很强的泛化能力,且能够在其他城市推广使用。 在现阶段确定性数值模式方法并不成熟的条件下, 可将该模型用于PM。. 浓度预警,未来可以结合空 间预测模型,构建时空模型,为决策者关于大气污染 评价、预警和治理提供决策支持。 参考文献: [1]Grivas,G.,A.Chaloulakou.Artificial neural network models for prediction of PMlo hourly concentrations,in the Greater Area of Athens[J].Atmospheric Environment,2006,40(7):1216— 1229. [2]Paschalidou,A.K.,S.Karakitsios,S.Kleanthous,et a1.Forecas— ting hourly PM10 concentration in Cyprus through artificial neu ral networks and multiple regression models[J].Environment Pollution Research,2011,18(1):316—327. [33 Reilly,P.Time series modeling of global mean temperature for managerial decision—making[J].Journal of Environment Man— agement,2005,76(1):61—70. [4]Jenkins,G.M.,G.C.Riese1.Time Series Analysis:Forecasting and Control FM].NY:Prentice—Hall Inc,1994. [5]Shumway,R.H.,D.S.Stoffer.Time Series Analysis and It s Applications[M].New York:Springer Science Business Media, 2006:79—99. I-6]高铁梅.计量经济分析方法与建模[M].北京:清华大学出版社, 2006:126—154. [7]Kumar,U.,V.K.Jain.ARIMA forecasting of ambient air pollu— tants(Oa,NO,NOz and CO)[J].Stochastic Environmental Re— search andRiskAssessment,2010,24(5):751—760. [83 Cobourn,W.G.An enhanced PM2 5 air quality forecast model based on nonlinear regression and back-trajectory concentrations [J].Atmospheric Environment,2010,44(25):3015—3023. [9]Chelani。A.B.,S.Devotta.Prediction of ambient carbon monox— ide concentration using nonlinear time series analysis technique [J].Tr口 s声0r£0£ 0 Research,2007,12(8):596—600.