首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 203 毫秒
1.
为了建立不同环境系统皆能规范、统一、简洁、实用的回归支持向量机预测模型,针对传统的回归支持向量机预测模型存在结构不能普适、规范和统一及用于大样本、多因子预测会出现学习效率低、求解精度差的局限,提出适用于环境系统预测量及其影响因子参照值和规范变换式的设计原则和方法,使规范变换后的影响因子皆"等效"于同一个规范影响因子;为提高样本的预测精度,还提出预测样本的模型输出的误差修正法.在对环境系统的预测量及其影响因子进行规范变换的基础上,由有m个规范影响因子的每个建模样本生成m个"等效"训练样本,从建模样本中,选择各影响因子的最大规范值组成训练样本集的"参考样本",计算核函数中每个训练样本相对于"参考样本"的范数;并应用优化算法优化模型参数,建立适用于预测量及其影响因子规范值的仅有2个或3个支持向量的两种简单结构的回归支持向量机预测模型.将基于规范变换的两种简单结构的回归支持向量机模型与相似样本误差修正法相结合,用于河津大桥监测断面6个样本的COD月平均值预测,并与多种传统预测模型和方法进行了比较.结果表明:对同一个预测样本,两种模型的预测值十分接近;此外,两种预测模型用于6个样本预测,其相对误差绝对值的平均值分别为2.09%、2.79%,均远小于传统的投影寻踪回归预测的41.63%、支持向量机预测的40.99%、灰色神经网络预测的25.94%和马尔可夫预测的10.16%;而两种预测模型对异常样本预测的最大的相对误差绝对值分别为5.85%、5.13%,更加远远小于传统的4种预测模型的169.07%、180.45%、68.44%、41.96%.两种基于规范变换的回归支持向量机预测模型简洁、普适、规范和统一,避免了"大样本数困难",提高了学习效率和模型的预测精确度,对其他预测建模法也有借鉴作用.  相似文献   

2.
为了建立适用于环境系统的结构简洁、形式统一、程序规范、应用普适的神经网络和投影寻踪回归预测模型,针对传统的神经网络和投影寻踪回归用于多因子、大样本预测建模,存在模型结构复杂、学习效率低的局限,提出设置环境系统预测量及其影响因子参照值和规范变换式的原则和方法,使规范变换后的影响因子皆"等效"于同一个规范影响因子,从而将多因子的的预测建模简化为等效规范因子的预测建模,使模型结构得到极大地简化,提高了学习效率;此外,为了提高预测模型的预测精度,还提出了对预测样本的模型输出值的误差修正公式.在对环境系统的预测量及其影响因子进行规范变换的基础上,将m个规范影响因子的每个建模样本组成m个"等效"训练样本,应用免疫进化算法优化模型参数,分别建立适用于环境系统的2个或3个规范影响因子的前向神经网络和投影寻踪回归两类预测模型;并依据误差理论,对误差修正公式修正后的模型预测精度的提高进行了严格的数学论证.将基于规范变换与相似样本误差修正相结合的两类预测模型,用于某市5个点位的SO_2浓度预测,并与6种传统预测模型和方法的预测结果进行了比较.结果表明:对同一个预测样本,同类模型的两种不同结构的的预测值及其相对误差都几乎完全相同或彼此相差甚小;此外,两种不同结构的两类预测模型用于5个样本预测,其相对误差绝对值的平均值分别为2.59%、2.67%;2.18%、2.62%,均远小于传统BP神经网络模型的25.72%、传统PPR模型的14.20%、传统SVR模型的22.13%、模糊识别模型的21.57%、组合算子模型的18.36%和多元回归模型的25.31%;而两类模型预测的最大的相对误差绝对值分别为4.11%和3.57%,更加远远小于传统的6种预测模型的37.18%、56.07%、27.40%、32.14%、38.38%和60.26%.实例分析结果证实了误差修正公式对提高模型预测精度具有切实可行性.基于规范变换与误差修正相结合的前向神经网络和投影寻踪回归两类预测模型不仅避免了"维数灾难",提高了学习效率和模型的预测精确度,而且具有简洁、普适、规范、统一和稳定的特点,对其他预测建模也有借鉴作用.  相似文献   

3.
传统的不同预测变量的预测模型之间不具有兼容性和等效性,而同型规范变换和误差修正相结合的不同变量的预测模型的预测相对误差与预测对象的维数、样本数及预测模型类型皆无关,仅与预测变量的数据特性、相似样本的模型输出值及其相对误差和相似度有关,因而同型规范变换的不同预测变量的预测模型之间具有兼容性和等效性.其重要意义在于:只要对任意一个预测变量建立了基于规范变换的某种预测模型,就可以将此预测模型直接用于具有同型规范变换的其他预测变量的预测;若再将其与误差修正法相结合,还可以极大地提高模型的预测精度,获得与实际值很接近的预测结果.依据受3个因子影响的灞河口CODMn指数数据、受4个因子影响的伊犁河雅马渡站年径流量数据和牡丹江市TSP年均值的时序数据,分别建立具有同型规范变换(nj=2)的3个不同预测变量的3种智能预测模型和一元线性回归预测模型,并验证了3个不同预测变量的预测模型之间的兼容性和等效性.对同一个预测样本,用同型规范变换和误差修正相结合的不同预测变量的预测模型的实际预测值及其预测相对误差绝对值不仅差异甚微,而且预测值与实际值非常接近,其预测的相对误差绝对值平均值几乎全都小于3%,最大相对误差绝对值均小于5%,小于或远小于20种传统预测模型和方法预测的相应误差.  相似文献   

4.
为了预测并控制未来几年城市垃圾产量,以我国城市为例,利用K-近邻互信息的多变量特征从18个拟影响因素中确定了8个影响垃圾排放量因子,分别为常住人口、地区生产总值、社会消费品零售值、金融业增加值、工业增加值、批发和零售业增加值、住宿和餐饮业增加值和第三产业增加值.以2006~2013年数据为训练样本,2014~2015年数据为检验样本,根据影响因素建立径向基函数(RBF)神经网络预测模型,并基于平均相对误差对模型反向修正.然后结合两段式径向基预测模型,对全国各省市2017~2018年的垃圾总产量预测并可视化.结果表明,本文建立的两段式径向基预测模型平均相对误差是6.43%,预测精度为93.57%.可见,该模型的预测精度较高,能较好的在现实生活中对城市垃圾的产生量进行预测.  相似文献   

5.
在分析山洞油库具体空间结构和狭长受限空间内油气蔓延规律与特性的基础上,分别采用灰色GM(1,1)模型和一元线性回归模型对山洞油库地下管沟中的油气聚集量进行了预测,并应用MATLAB软件对预测模型进行编程以简化数学运算,通过对比分析两种预测模型的预测结果与预测误差可以得出:对山洞油库油气聚集量这种近似呈线性增长的预测对象而言,采用灰色GM(1,1)模型比一元线性回归模型具有更高的预测精度,且可确定油气达到爆炸下限的时间以及反映油气浓度变化的规律,以为山洞油库安全状态评估与决策提供依据。  相似文献   

6.
在介绍灰色预测模型和一元线性回归模型的基础上,结合某煤矿实际,采用两种模型对瓦斯涌出量进行了预测,并对两种模型的预测值进行比较,结果表明:对基本符合线性关系的数据,采用灰色GM(1,1)模型较一元线性回归模型的预测精度要高。  相似文献   

7.
基于多因素灰色预测模型的生活污水量预测研究   总被引:1,自引:0,他引:1  
生活污水作为城市水环境的主要污染源,进行生活污水排放量的预测是十分必要的.污水排放量预测方法有多种,不同的方法有各自不同的特点.为提高预测精度,采用灰色预测与多元线性回归相结合的方法,综合各种因素建立多因素灰色预测模型.并以人口和人均纯收入作为影响因素,将该模型应用于苏州横泾街道生活污水排放量的趋势预测中.结果表明:该模型能反映系统的实际情况,建模精度高,平均相对误差只有0.069 8%,值得在污水排放预测中推广应用.  相似文献   

8.
研究了多变量非线性河涌水质预测问题,提出了多核最小二乘支持向量机河涌水质预测模型。模型采用协同结构的非线性函数将水质时序样本映射到高维特征空间,进行多元线性回归。然后将该回归问题转化成半无限线性规划问题,运用交换集法求解。文章利用东江流域河涌水质数据进行了拟合预测实验,结果表明,与单核最小二乘支持向量机河涌水质预测模型相比,多核模型的预测误差减小了23%以上,它较单核模型具有更高的预测精度和更好的泛化推广性能。  相似文献   

9.
张宝刚  刘鸣 《上海环境科学》2010,29(2):52-54,65
因夜间天空亮度分布具有非线性变化特点,故引入神经网络算法,建立基于时间序列的夜天空亮度预测模型,夜天空亮度预测模型可为城市光污染防治提供评价依据.文章对神经网络的原理进行了论述,建立了基于时间序列预测模型.以测试数据为训练样本集,基于MATLAB(矩阵实验室,Matrix Laboratory的简称),采用改进的BP算法(误差反向传播算法)对网络进行学习训练,并对存在的误差进行了分析.基于时间序列BP神经网络的夜天空预测模型,当隐含层神经元数目为5,训练函数为L-M优化算法(trainlm)时,最大绝对误差可达到0.003 6 cd/m2,最大相对误差达到2.361 4%.结果表明,模型的运行结果与试验数据比较吻合,输出与目标矢量之间相关性也较好.  相似文献   

10.
一种战车主减速器温度预测方法研究   总被引:1,自引:0,他引:1  
目的针对战车主减速器温度预测需求,建立时间序列ARIMA多步预测和BP神经网络预测模型,提出基于BP神经网络修正误差的ARIMA模型温度预测方法。方法结合BP神经网络的非线性能力与ARIMA模型预测能力,分析ARIMA在多步预测时误差产生原因,在神经网络对ARIMA多步误差进行预测基础上计算修正因子,把误差修正因子和BP网络结合,实现对多步预测误差的修正。结果ARIMA模型多步预测时,预测误差随预测步数的逐步增加不断增大,引入了误差修正因子进行修正。通过预测值与实际值进行对比,可有效提高预测准确度。结论 BP神经网络和误差修正因子结合应用可显著提高温度预测效果。  相似文献   

11.
空气质量预报对于大气污染防治、打赢蓝天保卫战意义重大.本研究基于重庆市气象局的中尺度天气模式(WRF)和空气质量数值预报模式(CMAQ)的预报产品,采用2018年4个代表月份(1、4、7、10月,分别代表冬、春、夏和秋季)成渝地区22个观测站点的PM2.5浓度和气象要素观测数据,建立基础特征变量数据集(包括训练数据集和测试数据集),通过调整模型参数,并利用训练数据集采用机器学习方法(Lasso回归、随机森林回归、深度学习RNN-LSTM)进行模型训练,订正了成渝地区PM2.5数值预报.其中,通过Lasso回归算法对成渝地区4个区域分别进行变量优选,优化模型,利用测试数据集对模型进行测试并检验评估.结果表明,基于3种机器学习方法订正后的PM2.5小时浓度相比CMAQ模式模拟预报结果,偏差显著降低,相关系数显著提高.其中,随机森林回归和RNN-LSTM的订正效果优于Lasso回归,区域统计与站点统计结果较为一致;Lasso回归订正后的均方根误差减小50%左右,相关系数达70%,随机森林回归和RNN-LSTM订正后的均方根误差减小70%左右,相关系数达90%,随机森林回归与RNN-LSTM订正后的偏差范围相比Lasso回归集中范围更窄,最大概率分布更集中;3种方法对不同季节的订正效果与全年一致,其中,冬季订正效果更为显著.研究结果可为提高我国重点城市群区域—成渝地区PM2.5浓度的大气污染预报能力提供有益参考.  相似文献   

12.
根据2012~2014年拉萨站点的日太阳辐射观测数据,对3种日太阳总辐射估算模型(左大康、Prescoff和王炳忠等提出的估算模型)的估算结果和实际观测结果进行误差检验分析,结果表明:3种模型都通过了显著性检验,其平均绝对误差(MAE)分别为6.17 MJ/(m~2·d)、6.42 MJ/(m~2·d)和12.31 MJ/(m~2·d),均方根误差(RMSE)分别为1.60 MJ/(m~2·d)、1.65 MJ/(m~2·d)和2.78 MJ/(m~2·d),表明利用地理位置信息和日照时数的左大康估算模型对拉萨日太阳总辐射的估算效果优于Prescoff和王炳忠估算模型。利用左大康估算模型分别估算得到2015年拉萨、那曲和葛尔地区的日太阳总辐射值,并进行模型验证。通过分析拉萨1971~2015年的太阳总辐射变化和周期性特征,研究日太阳总辐射估算模型的时间尺度效应。按照11年和四季两种不同的时间尺度,利用线性回归法对日太阳总辐射估算结果和实际观测结果进行误差和相关性分析,得到经验参数a和b的值与时间尺度有一定关系。11年和四季两种时间尺度除夏季以外,其他时间拟合模型的精度均得到了提高。通过线性回归法得出45年的西藏日太阳总辐射优化估算模型,该模型估算日太阳总辐射的误差小于左大康模型,估算精度较高。  相似文献   

13.
The objective of this study was to develop linear and nonlinear statistical models to predict enteric methane emission (EME) from cattle (Bos) in the tropics based on dietary and animal characteristic variables. A database from 35 publications, which included 142 mean observations of EME measured on 830 cattle, was constructed to develop EME prediction models. Several extant equations of EME developed for North American and European cattle were also evaluated for suitability of those equations in this dataset. The average feed intake and methane production were 7.7?±?0.34 kg/day and 7.99?±?0.39 MJ/day, respectively. The simple linear equation that predicted EME with high precision and accuracy was: methane (MJ/day)?=?1.29(±0.906)?+?0.878(±0.125)?×?dry matter intake (DMI, kg/day), [root mean square prediction error (RMSPE)?=?31.0 % with 92 % of RMSPE being random error; R 2?=?0.70]. Multiple regression equation that predicted methane production slightly better than simple prediction equations was: methane (MJ/day)?=?0.910(±0.746)?+?1.472(±0.154)?×?DMI (kg/day) – 1.388(±0.451)?×?feeding level as a multiple of maintenace energy intake – 0.669(±0.338)?×?acid detergent fiber intake (kg/day), [RMSPE?=?22.2 %, with 99.6 % of MSPE from random error; R 2?=?0.84]. Among the nonlinear equations developed, Mitscherlich model, i.e., methane (MJ/day)?=?71.47(±22.14.6)?×?(1 - exp{?0.0156(±0.0051)?×?DMI (kg/day), [RMSPE?=?30.3 %, with 97.6 % of RMSPE from random error; R 2?=?0.83] performed better than simple linear and other nonlinear models, but the predictability and goodness of fits of the equation did not improve compared with the multiple regression models. Extant equations overestimated EME, and many extant models had low accuracy and precision. The equations developed in this study will be useful for improved estimates of national methane inventory preparation and for a better understanding of dietary factors influencing EME for tropical cattle feeding systems.  相似文献   

14.
神经网络模型在O_3浓度预测中的应用   总被引:4,自引:0,他引:4  
沈路路  王聿绚  段雷 《环境科学》2011,32(8):2231-2235
O3是近地面大气中一种重要的二次污染物.本研究采用神经网络多层感知器(Multi-Layer Perceptron)和多元线性回归2种模型,以广州万顷沙站2006年的气象观测数据为输入,对该站O3的1 h平均峰值浓度进行提前1 d的预测,并比较了2种模型的预测效果.模型的输入参数为前1d O3的最高1h平均浓度和第二天...  相似文献   

15.
该研究以浙江省2014-2019年PM2.5浓度数据为研究对象,应用多元线性回归和随机森林方法结合气象、植被、地形、经济、人口和基础设施等因子进行分析.研究结果表明PM2.5浓度时空分布不均匀,时间上季节变化差异显著,总体呈冬季>春季>秋季>夏季分布规律,每年呈下降趋势;空间上呈西北多东南少的分布特征.多元线性回归和随机森林模型显示日最低地表气温(MI-GST)、日最低气压(MI-PRS)、日蒸发量(EVP)、日最小相对湿度(MI-RHU)、月植被覆盖度(FVC)、日降水量(PRE)、日极大风速(MM-WIN)、日平均相对湿度(AV-RHU)、铁路密度(Railway)、日最大风速(MA-WIN)、日照时长(SSD)、海拔(DEM)、日平均风速(AV-WIN)和河流密度(River)等15个因子对PM2.5浓度影响显著;随机森林模型均方根误差(RMSE)、均方绝对百分比误差(MAPE)和变异解释量(R2)分别为0.133、17.83%和0.834,明显优于多元线性回归(0.278、40.48%和0.575),表明随机森林更适合浙江省PM2.5浓度估测,该研究揭示PM2.5时空分布及相关因子分析,为限制空气污染提供有效策略.  相似文献   

16.
吴英晗  许嘉  段玉森  伏晴艳  杨文 《环境科学》2023,44(10):5370-5381
地统计模型被广泛应用于环境空气污染物暴露模拟,但不同建模方法及其模拟结果之间的对比研究较少.基于上海2016~2019年55个环境空气监测点位的NO2和PM2.5观测数据,以及交通路网、排放源兴趣点和卫星数据等地统计变量,应用偏最小二乘回归(PLS)、监督学习线性回归(SLR)和机器学习随机森林(RF)这3种建模方法创建年暴露模型,并进一步应用普通克里金插值(OK)法分析模型残差,构建复合模型.应用交叉验证对模型的模拟效果进行检验,选取每一种建模方法的最优模型结构(是否应用OK)作为最终模型.结果表明,NO2模型中表现最好的是RF-OK (Rmse2为0.70~0.82)和PLS-OK模型(Rmse2为0.78~0.84);PM2.5模型中PLS模型(Rmse2为0.62~0.71)优于SLR-OK (Rmse2为0.40~0.79)和RF-OK (Rmse2:0.31~0.56)模型.应用3种建模方法对上海1 km网格开展年暴露模拟和对比,NO2模型间模拟结果的相关性(r为0.82~0.91)高于PM2.5模拟结果的相关性(r为0.66~0.96).基于3种模型2019年的模拟结果,评估了上海NO2和PM2.5的人群暴露水平.  相似文献   

17.
采用南京工业区2016年5月20日~8月15日这一高臭氧(O3)期的O3、O3前体物和常规气象资料数据,利用支持向量机回归(SVMr)方法分别预报O3的小时值、日最大值和最大8 h滑动平均值.结果表明,O3小时值预报的相关系数(R2)为0.84,平均绝对误差(MAE)和平均绝对百分误差(MAPE)分别为3.44×10-9和24.48,O3前期浓度、紫外B波段辐射(UVB)和NO2浓度是关键因子.O3日最大值预报的主要因子是NOx在07:00的浓度和UVB.预报O3 8 h时UVB和气温起重要作用.加入前体物项能够使O3的预报精度提升10%~28%.与多元线性回归方法相比,SVMr对O3浓度的预报有明显优势.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号