首页 | 本学科首页   官方微博 | 高级检索  
     检索      

湖南空气质量预报中的数据预处理和特征工程
引用本文:李细生,陈媛,罗慧妮,张克非,喻雨知,李巧媛,张华,易飞.湖南空气质量预报中的数据预处理和特征工程[J].中国环境监测,2023,39(4):185-195.
作者姓名:李细生  陈媛  罗慧妮  张克非  喻雨知  李巧媛  张华  易飞
作者单位:气象防灾减灾湖南省重点实验室, 湖南 长沙 410118;株洲市气象局, 湖南 株洲 412003;长沙市气象局, 湖南 长沙 410017
基金项目:湖南省气象局2020年重点课题(XQKJ20A001);国家自然科学基金项目(41271095)
摘    要:为提高空气质量预报的准确率,建立了融合气象和环境观测资料、结合机器学习和数值天气预报,且预测时效较长、预测精度较高的机器学习模型库。以湖南6个城市(长沙、株洲、湘潭、益阳、常德、岳阳)的空气质量预报为例,将数据预处理、特征工程方法运用到模型之中,得出以下几点结论:①数据预处理工作包括样本收集、数据清洗、缺失值处理、异常值剔除等,对提高模型预测稳定性帮助很大。②点、线、面的特征组合有助于完整地描述污染物的生消过程。引入传输指数后,株洲市模型对传输型污染过程的预测性能得到明显提高,对轻度、中度、重度污染的分类准确度分别提升了23.6%、16.6%、30.0%。引入静稳指数后,长沙市模型PM2.5浓度测试的相关系数由0.938提升至0.959,均方根误差由10.33下降至8.46,且模型对中度以上污染天气的极值预报结果更接近实况;益阳市模型在高浓度样本预测中存在的系统性偏低现象得到改善,对轻度以上污染天气的预报结果得到较大矫正。③随机森林的特征重要性排序功能可以大幅度减少特征的数量,使得模型的可解释性和稳定性增强。

关 键 词:机器学习  数据预处理  特征工程  空气质量预报
收稿时间:2022/3/7 0:00:00
修稿时间:2022/10/26 0:00:00

Data Preprocessing and Feature Engineering of Air Quality Forecast in Hunan Province
LI Xisheng,CHEN Yuan,LUO Huini,ZHANG Kefei,YU Yuzhi,LI Qiaoyuan,ZHANG Hu,YI Fei.Data Preprocessing and Feature Engineering of Air Quality Forecast in Hunan Province[J].Environmental Monitoring in China,2023,39(4):185-195.
Authors:LI Xisheng  CHEN Yuan  LUO Huini  ZHANG Kefei  YU Yuzhi  LI Qiaoyuan  ZHANG Hu  YI Fei
Institution:Hunan Key Laboratory for Meteorological Disaster Prevention and Mitigation, Changsha 410118, China;Zhuzhou Meteorological Office of Hunan Province, Zhuzhou 412003, China;Changsha Meteorological Office of Hunan Province, Changsha 410017, China
Abstract:
Keywords:machine learning  data preprocessing  feature engineering  air quality forecast
点击此处可从《中国环境监测》浏览原始摘要信息
点击此处可从《中国环境监测》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号