大数据背景下采用互信息与随机森林算法的空气质量预测 |
| |
引用本文: | 杨正理,史文,陈海霞,王长鹏.大数据背景下采用互信息与随机森林算法的空气质量预测[J].环境工程,2019,37(3):180-185. |
| |
作者姓名: | 杨正理 史文 陈海霞 王长鹏 |
| |
作者单位: | 三江学院机械与电气工程学院,南京,210012;三江学院机械与电气工程学院,南京,210012;三江学院机械与电气工程学院,南京,210012;三江学院机械与电气工程学院,南京,210012 |
| |
基金项目: | 江苏省高校自然科学研究面上项目 |
| |
摘 要: | 为了实现城市空气质量的精准预测,针对与城市空气质量预测相关的大数据种类多、规模大、维度高和生成速度快等特点,在研究城市不同区域空气质量评价指标的基础上,提出不同区域空气质量子空间聚类分析方法,挖掘不同区域空气质量的特征。通过对不同区域进行群体划分,并利用互信息矩阵从城市功能、地形、气象条件等方面辨识与不同区域空气质量相关联的因素,构建基于随机森林算法的城市空气质量预测模型。该方法可以有效识别城市不同区域空气质量的强关联因素,避免由于关联因素的差异性对空气质量预测造成的不利影响。仿真结果表明:该方法适用于大数据的分析与处理,并具有较高的预测精度。
|
关 键 词: | 大数据 关联因素辨识 互信息 随机森林 空气质量预测 云计算 |
AIR QUALITY FORECASTING WITH MUTUAL INFORMATION AND RANDOM FORESTS BASED ON BIG |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《环境工程》浏览原始摘要信息 |
| 点击此处可从《环境工程》下载免费的PDF全文 |
|