摘 要: | 为解决轨道电路故障诊断任务中监测数据类别不平衡导致诊断模型决策边界产生偏移,以及数据海量导致训练速度慢的问题,提出数据重采样与集成学习算法相结合的轨道电路故障诊断方法。首先,通过特征合成和数据重采样处理不平衡数据,重采样包括随机降采样和合成少数类过采样技术(SMOTE);然后,利用训练高效的轻量梯度提升机(LightGBM)算法构建面向海量监测数据的故障诊断模块,并设计训练及诊断流程,以网格搜索和交叉验证方法调整关键参数;最后,引入不易受数据不平衡影响的Macro-F1值作为故障诊断模型评价指标。结果表明:特征合成、数据重采样对不平衡数据下的各故障诊断模型的综合表现均有不同程度的提升,LightGBM相较于其他算法在综合表现和训练时间上都是最佳,可保障准确性和面对海量数据时的快速性。
|