首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 125 毫秒
1.
为了能及时、准确的估算出PM2.5浓度及污染等级,分别构建了K最邻近模型(KNN)、BP神经网络模型(BPNN)、支持向量机回归模型(SVR)、高斯过程回归模型(GPR)、XGBoost模型和随机森林模型(RF)6个PM2.5浓度预测模型,选取江西省赣州市为实验区域,采用2017~2018年逐小时气象站数据、PM2.5浓度数据和Merra-2再分析数据开展PM2.5预测实验.结果表明,缺少污染物观测数据时,利用能见度和气象因子等数据也能较好的预测PM2.5浓度.在PM2.5浓度预测精度方面,XGBoost模型最高,随机森林模型次之,高斯过程回归模型最差.6个模型的预测精度总体呈现冬季最高,秋季和春季次之,夏季最低.XGBoost模型的PM2.5污染等级预测准确率高于其他模型,综合准确率达87.6%,并且XGBoost模型具有训练时间短,占用内存小等优点.XGBoost模型的变量重要性结果表明,能见度变量的重要性最高,相对湿度和时间变量次之.本研究可为环境部门准确预测、预报PM2.5浓度提供参考.  相似文献   

2.
精准预测大气污染颗粒物PM2.5、PM10浓度能为大气污染防治提供科学依据,但目前较多PM2.5和PM10浓度预测在缺少污染源排放清单和能见度数据时,预测精度不高。而目前深度学习模型应用于PM2.5和PM10浓度预测的研究还鲜见报道。基于广州市2015年6月1日—2018年1月10日的空气质量和气象监测历史数据,分别构建了随机森林模型(RF)、XGBoost模型2种传统的机器学习模型和长短时记忆网络(LSTM)、门控循环单元网络(GRU)2种深度学习模型,并对广州市的PM2.5、PM10日均浓度值进行预测。结果表明:在缺少污染源排放清单和能见度数据时,4种模型也能较好地预测PM2.5、PM10日均浓度。根据MSE、RMSE、MAPE、MAE和R2等评价指标,对4个模型的PM2.5、PM10预测效果进行测评,得出深度学习GRU模型预测效果均为最佳,RF模型的预测结果均为最差。相比目前研究及应用较多的RF模型、XGBoost模型、LSTM模型,基于深度学习的GRU模型能更好地预测PM2.5、PM10浓度。  相似文献   

3.
为进一步提高PM2.5浓度预测的精度,基于XGBoost和LSTM进行改进得到变权组合模型XGBoost-LSTM(Variable).过对预测因子进行相关性分析,得到其它大气污染物和气象因素对PM2.5浓度的影响,确定最优PM2.5浓度预测因子,再将预处理后数据集输入LSTM模型和XGBoost模型分别进行预测,采用基于残差改进的自适应变权组合方法得到最终预测结果.结果表明,污染物变量的相对重要性高于气象因子变量,其中当前PM2.5和CO浓度的相对重要性较高,而平均风速和相对湿度重要性较低.XGBoost-LSTM(Variable)模型的RMSE、MAE和MAPE值为1.75、1.12和6.06,优于LSTM、XGBoost、SVR、XGBoost-LSTM(Equal)和XGBoost-LSTM(Residual)模型.分季节预测结果表明,XGBoost-LSTM(Variable)模型在春季预测精度最好,而夏季预测精度较差.模型预测精度高的原因在于其不仅考虑了数据的时间序列特征,又兼顾了数据的非线性特征.  相似文献   

4.
PM2.5是大气的重要污染物,掌握其空间分布对于大气污染防控具有重要意义.目前,PM2.5遥感监测主要围绕卫星反演的日间AOD数据开展,无法反映夜间大气污染的空间格局.以2019年9—12月NPP/VIIRS夜间灯光影像和空气质量站点PM2.5观测数据对江苏省淮安市夜间PM2.5浓度进行估算研究.基于辐射传输方程分析夜间灯光辐射与PM2.5浓度之间的关系,在此基础上综合考虑灯光辐射直接衰减和散射补偿确定了计算夜间PM2.5浓度的空间自变量,运用多元线性回归模型(MLR)、随机森林(RF)、Cubist、极端梯度提升树(XGBoost)、神经网络(NNet)、支持向量机(SVM)及最近邻法(KNN)算法构建夜间PM2.5浓度遥感估算模型.结果表明,多元线性归回模型精度明显低于各个机器学习模型,所有模型中SVM模型精度最高,决定系数R2为0.77,平均绝对误差MAE为20.83μg·m-3,均方...  相似文献   

5.
董红召  廖世凯  杨强  应方 《中国环境科学》2022,42(10):4537-4546
为实现工业园区企业污染排放精细化管控,捕捉工业园区内企业污染排放与污染物浓度之间的响应关系,提出一种集成大气环境容量(AEC)和时空特征的工业园区PM2.5浓度预测模型.通过有限体积法获得工业园区日均大气自净能力指数(ASI),结合工业园区日排放数据作为AEC特征;同时利用小波分析和Pearson相关系数法提取时空特征,包括目标监测站PM2.5浓度的时间变化特征和其与周围监测点PM2.5的空间相关特征.通过CNN获取训练数据中PM2.5的关联特征,并利用BILSTM充分反映时间序列训练数据中隐含的关键历史长短期依赖关系,确保快速准确的预测性能,以2018~2020年濮阳市工业园区大气污染物观测数据、气象数据及排放数据进行实验验证.结果表明:本文提出的CNN-BILSTM预测模型相较于传统LSTM模型预测精度提升10%;AEC特征和时空特征有利于提高模型精度和稳定性,集成AEC和时空特征的CNN-BILSTM预测模型在PM2.5污染天数预测准确率最高,达93%;分季节预测结果表明,秋冬季的预测精度最高.  相似文献   

6.
于伸庭  刘萍 《环境工程》2020,38(6):176-180,66
准确预测PM2.5浓度可以有效避免重污染天气对人体带来的危害。现有方法往往重视本地历史信息对PM2.5浓度预测的影响,而忽略空间传输的作用。提出了一种长短期记忆网络和卷积神经网络(LSTM-CNN)相结合的方法,利用历史PM2.5浓度数据、历史气象数据和时间数据,对空气质量监测站未来6 h PM2.5浓度做出预测。该模型主要由2部分组成:1)基于长短期记忆网络的时序预测模型,模拟本地因素对PM2.5浓度预测的影响;2)基于一维卷积神经网络的特征提取模型,模拟周边地区污染物的传输与扩散对PM2.5浓度预测的影响。随机选取了北京市市区及郊区7个监测站在2014-05-01—2015-04-30期间的数据,用于研究和评估LSTM-CNN模型。结果表明:提出的LSTM-CNN模型相比于LSTM模型具有更好的预测效果,且对于郊区站点预测效果的改进略优于市区站点。  相似文献   

7.
近年来,我国面临着细颗粒物(PM2.5)污染形势依然严峻以及臭氧(O3)污染日益凸显的双重压力.为进一步准确预测郑州市大气PM2.5与O3浓度并探明气象因子的影响,本研究使用2018-2022年郑州市大气污染物和气象因子逐时数据,结合统计学单因素分析和机器学习LightGBM模型多因素分析,建立了一种基于长时间序列数据的PM2.5与O3浓度预测及气象因子影响分析的综合分析方法.结果表明:(1)训练后的LightGBM模型能够较好地预测PM2.5污染,准确率达80.8%;对O3污染预测的准确率为52.5%.(2)郑州市大气PM2.5浓度与气压呈正相关,与比湿和环境温度均呈负相关;大气O3 8 h滑动平均浓度(O3-8 h浓度)与比湿和太阳辐射均呈正相关,与气压呈负相关.(3)有利的气象条件可能是2021年PM2.5年均浓度得到显...  相似文献   

8.
以赣州市2017年全年的空气质量和气象数据为研究对象,通过最大相关最小冗余算法(MRMR)提取出最优的特征子集,并将其作为预测模型的输入数据,同时构造混合核函数(HK)对传统的支持向量机模型(SVM)进行改进,最终建立MRMR-HK-SVM模型.实验结果表明,MRMR-HK-SVM模型有着更低的平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和均方根误差(RMSE),相较于传统SVM模型,预测结果平均绝对误差下降了26.9%,且能更加准确的追踪到PM2.5浓度的突变时刻.可见,MRMR-HK-SVM模型具有更好的泛化能力,能够更加精确地预测PM2.5浓度.  相似文献   

9.
董浩  孙琳  欧阳峰 《环境工程》2022,40(6):48-54+62
针对现有PM2.5浓度时序预测模型预测精度不高的问题,基于Informer建立了1个Seq2Seq的单站点PM2.5浓度多步时序预测模型,以历史污染物数据和气象数据为输入,实现对未来一段时间PM2.5浓度的预测。所构建模型基于ProbSparse (概率稀疏)自注意力机制提取所输入的序列信息,能够广泛地捕获输入序列的长期依赖信息,并对影响因子之间复杂的非线性关系进行建模,从而提高预测准确度。采用北京市2015-2019年逐小时空气污染物数据与气象数据进行模型训练、验证和测试,建立与循环神经网络(RNN)、长短期记忆网络(LSTM)的对比实验并与其他现有研究方法进行比较,结果表明:对未来1~6 h的PM2.5浓度时序预测,Informer的平均绝对误差(MAE)、均方根误差(RMSE)和可决系数(R2)指标均为最好,实现了较为准确的预测。  相似文献   

10.
梁涛  谢高锋  米大斌  姜文 《环境工程》2020,38(2):107-113
针对PM10浓度时间序列具有明显的非线性和波动性特征,提出一种基于自适应噪声的完整集成经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)-样本熵(sample entropy,SE)和长短期记忆神经网络(long short-term memory,LSTM)的组合预测模型。首先利用CEEMDAN-SE将原始PM10浓度时间序列分解为若干个复杂度差异明显的子序列;然后针对各子序列的内在特性结合气象因素分别建立适当参数空间的LSTM预测模型;最后将预测结果进行叠加得到最终预测结果。以唐山市4个空气质量监测站的实测PM10浓度数据进行模型验证分析,结果表明:所提预测模型对比其他几种预测模型显示出较高的预测精度,以及良好的普适性。  相似文献   

11.
肖宇 《环境科学研究》2022,35(12):2693-2701
应用多种机器学习算法进行时空耦合从而建立一种新的多模式集合预报订正算法(简称“ET-BPNN算法”),对4种常规污染物(NO2、O3、PM2.5和PM10)的空气质量模型预报结果进行订正. 订正方法分为两步,第一步中利用随机森林、极端随机树和梯度提升回归树3种机器学习算法,采用4个空气质量数值预报模式(CMAQ、CAMx、NAQPMS和WRFChem)的多尺度污染物浓度预报数据、中尺度天气模式(WRF)的气象因子预报数据(包括2 m温度、2 m相对湿度、10 m风速、10 m风向、气压和小时累计降水量)以及污染物浓度观测数据作为训练集,训练结果进入基于均方根误差的择优选择器,选取3种机器学习算法中优化效果最好的算法;在第二步中利用了BP神经网络算法,通过加权平均获得集合模式订正预报结果. 结果表明:①与模式集合平均算法相比,ET-BPNN算法使NO2、O3、PM2.5和PM10浓度预报值与观测值之间的均方根误差分别减小了30.4%、18.9%、43.3%和38.1%. ②ET-BPNN算法的优化效果较随机森林、极端随机树和梯度提升回归树3个机器学习算法有明显提升,与极端随机树算法相比,ET-BPNN算法使NO2、O3、PM2.5和PM10浓度预报值与观测值之间的均方根误差分别降低了42.7%、20.1%、19.7%和9.7%. ③在易发生污染的秋冬季,ET-BPNN算法对PM2.5浓度的预报具有明显的优化效果,此外该算法明显缩小了不同站点预报和不同预报时效之间的偏差,具有较好的鲁棒性. ④对O3和PM2.5浓度预报而言,经ET-BPNN算法优化后的预报结果能够更好地把握污染过程,对污染物峰值浓度的预报也较模式集合平均算法更准确. 研究显示,ET-BPNN算法提高了空气质量模式对污染物浓度的预报效果.   相似文献   

12.
采用人工智能算法XGBoost结合大气化学模式WRF-Chem,利用北京地区大气污染物的模拟结果及站点监测数据,构建XGBoost统计预报算法模型,并对两种大气污染物(PM2.5和O3)进行优化模拟,同时分析其特征贡献要素.结果表明,该统计预报模型能够很好地优化大气化学模式模拟的大气污染物浓度,降低模拟误差,对于北京地区站点模拟浓度优化呈现出城区>近郊>远郊的优化特点,且算法模型对O3浓度优化程度更高,优化后相关系数提高达128%.此外,通过特征要素的贡献量分析表明,CO是影响O3优化的重要特征变量,城郊区特征贡献得分均高达1000以上,Q2(近地面2m比湿)是影响PM2.5优化的重要气象特征变量,城郊区特征贡献得分分别为950和824.  相似文献   

13.
为提升PM2.5浓度预报能力,尤其是对PM2.5重污染的预报能力,以中尺度气象-化学耦合模式系统(WRF-Chem)为基础,结合中尺度WRF气象预报数据、地面及高空气象观测数据、PM2.5浓度观测数据,基于人工智能深度学习序列到序列的算法建立了上海市PM2.5统计预报模型.结果表明,人工智能深度学习算法(Seq2seq)明显修正了WRF-Chem模式由于模型非客观性造成的偏差,提高了上海市PM2.5浓度的预报能力;该算法优化和修正了WRF-Chem模式结果,并通过检验发现可以使PM2.5浓度预报值与实况值间的相关系数由0.51上升至0.79,均方根误差由25.9μg/m3下降至15.01μg/m3.而单独使用套索法(Lasso)线性回归算法对WRF-Chem模式优化效果不理想.基于Seq2seq的PM2.5浓度预报修正模型能够有效提升预报精度.  相似文献   

14.
基于阶段式时序注意力网络的PM2.5鲁棒预测   总被引:1,自引:1,他引:0       下载免费PDF全文
陆瑶  杨洁  邵智娟  朱聪聪 《环境工程》2021,39(10):93-100
PM2.5浓度的预测对于大气污染治理、改善环境质量等起到重要作用。受气象条件变化与大气污染物排放等多种因素的交叉影响,PM2.5预测通常易受突变事件及噪声数据干扰。因此,基于对气象条件以及大气污染物与PM2.5的相关性分析,提出阶段式时序注意力网络模型(staged temporal-attention network,STAN),该方法融合多段注意力学习模块与循环神经网络,建模气象因素与大气污染物对PM2.5浓度的交叉影响。统计分析北京市、上海市、广州市预测结果的绝对误差值,可知:1)对比广泛使用的单一类模型支持向量机(support vector machine,SVM)、长短期时序记忆方法(long short-term memory,LSTM)和多层感知机(multilayer perceptron,MLP),STAN可达到10%以上的性能领先;对比最新的融合类模型U型网络(U-net),STAN领先了7%的优势。2)以北京市冬季预测结果为例进行统计分析,STAN的预测值与实测值之间的拟合系数可有95.2%的性能领先。此外,在鲁棒性分析中发现,STAN在含有10%噪声的数据上进行预测,误差上升幅度仅为9.3%。结果表明:注意力机制与时序学习模块相结合能够深度挖掘PM2.5变化规律并抑制噪声数据,且STAN模型可以进行PM2.5浓度的鲁棒预测。  相似文献   

15.
基于Stacking的地面PM2.5浓度估算   总被引:1,自引:1,他引:0       下载免费PDF全文
赵滨  刘斌 《环境工程》2020,38(2):153-159
为了解决地面PM2.5监测网络在空间和时间覆盖受限的问题,提出了基于宽时空覆盖的卫星气溶胶光学厚度AOD,利用Stacking方法建立地面PM2.5浓度估算模型,将AOD、PM2.5和各气象参数以及与PM2.5排放有关的数据进行训练,使用改进网格搜索对模型超参数进行优化,通过对多重共线性分析,建立基于Stacking的最优PM2.5浓度估算模型。选取2016-01-01-2016-12-31的数据作为实验对象,结果表明:相比于随机森林、GBRT和XGBoost 3种模型,使用岭回归作为元学习器的Stacking模型性能更优,可见Stacking适用于大范围地理区域的大气污染监测。  相似文献   

16.
基于源清单“Nudging”修正方法和XGBoost算法对徐州市2016年12月13个监测站点的PM2.5、PM10、O3、SO2、NO2、CO等6种污染物浓度预报值进行修正,并分析了修正前后模式预报改善效果.在源清单“Nudging”修正部分,本文结合IDW空间插值算法对SO2、NO2、CO等3种污染物浓度预报值进行修正,与修正前后模拟结果相比,采用同化源模拟的预报浓度值与观测值的相关系数提高了0.06~0.27不等,平均绝对误差和均方根误差减少的幅度较为明显,平均相对偏差(MFB)和平均相对误差(MFE)均在理想水平范围内,NO2修正效果最好,其次是SO2和CO.基于XGBoost算法的统计修正部分,本文结合WRF气象预报要素建立统计回归模型,对6种污染物进行统计修正,经滚动修正之后,预报偏低或偏高现象得到很大的改善,除了SO2之外,相关系数均提高到0.6~0.7左右,各项误差统计指标改进幅度非常明显.总体而言,本文采用的两种修正方法对中小尺度空气质量数值预报改进效果非常明显,反映了此优化方案的可行性和科学性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号