摘 要: | 为解决能用于煤与瓦斯突出预测模型的真实事故训练数据量小、数据集缺失严重的问题,提出采用数据挖掘多重填补(MI)算法填补事故数据中缺失参数,增大可用数据集,并将填补后的数据用于支持向量机(SVM)预测模型的训练与测试,选取K最近邻(KNN)算法与SVM进行对比。结果表明:SVM数据填补前后的平均识别率分别为88.37%和88.87%,事故数据的识别率分别79.71%和91.27%; KNN算法在数据填补前后,平均识别率分别为87.59%和88.37%,事故识别率分别为70.4%和84.23%;可见:MI对平均识别率的提升作用不大,对事故识别率的提升作用显著,可提高煤与瓦斯突出事故预测率,数据填补后SVM算法比KNN算法的事故识别率高。
|