Page 187 - 《环境工程技术学报》2023年第1期
P. 187
第 1 期 陈伟等:基于经验小波变换的鄱阳 湖 COD M n 预测 · 183 ·
L
∑
|O l − P l |
l=1
MAE = (9)
L
v
t L
1 ∑
RMSE = (O l − P l ) 2 (10)
L
l=1
L
1 ∑ |O l − P l |
MAPE = (11)
L O l
l=1
式中:O 为实测值;P 为预测值; 为数据长度。
l
l
L
2.4.2 比较对象
注:x(1),x (2),···,x(t 为数据输入;y(1),y (2),···,y (t 为数据输出。
)
)
为了更清楚地展 示 EWT-BLST M 模型的高效
图 2 LST M 神经网络 和 BLST M 神经网络的对比
性, 表 1 展示了参与比较的模型的结构对比 。
Fig.2 Comparison between LSTM and BLSTM neural networks
表 1 参与比较的模型的结构
解成分 的 BLSTM 的输入变量;3 将上述选定的输 Table 1 Structure of the competitor models
)
)
入变量输入 到 BLST M 神经网络,得出每个分解成分 模型 数据分解算法 神经网络算法
的预测值;4 通过把所有分解成分的预测结果进行 BLSTM 不使用 BLSTM
)
重建,得到最终水质参 数 COD n 的预测值。
M WD-BLSTM WD BLSTM
图 3 显 示 EWT-BLST M 模型的预测过程,图中 EMD-BLSTM EMD BLSTM
BLSTM k (k = 1,2,··· ,K)表示第 k个分解成分对应的 EWT-SVR EWT SVR
BLST M 神经网 络 (预测模块), MODE k (k = 1,2,··· , EWT-ELM EWT ELM
′
是
K) MODE k 的预测结果。 EWT-LSTM EWT LSTM
3 结果与讨论
3.1 模型构建
模型的预测性能很大程度上受到模型超参数设
置的影响,为此使用训练集和验证集来确定模型的
结构并优化必要的超参数。
3.1.1 EW 数据分解
T
首先通 过 EW 将鄱阳湖数据中训练集和验证
T
集 的 COD n 时间序列分解 为 8 个模 式 (MODE ~
M 1
8
MODE )( 图 4)。其中,MODE 是通过识别多锥功率
8
谱估计中的峰值自动确定的。从 图 4可以看出,相较
于原始数据,大部分分解成分展现出更加清晰的变
化趋势。通过 表 2 所示的样本熵值,同样也可以看
出分解成分的熵值明显小于原 始 COD n 时间序列
图 3 地表水 体 COD n 预测流程 M
M 的熵值( 图 1)。因此,根据这些分解成分建立模型,可以
Fig.3 Flow chart of COD prediction of surface water
Mn
获得比使用原始数据建立的模型更高的预测精度。
模型的建立和测试通 过 MATLAB 2020 软件 3.1.2 PAC 分析
b
F
实现。 在建立模型之前,根据时间序列数据的特征,需
2.4 模型的预测性能评价 要确定输入因子。考虑到历史数据和预测值之间的
2.4.1 评价指标 相关性,使 用 PAC 分析来确定模型的输入因子。
F
通 过 1 和 7 后 的 COD n 预测来验证所提出方 具体计算过程:首先计算出每个分解成分时间序列
d
M
法的有效性,采用均绝对误 差 (MAE)、均方根误差 的 PACF,然后找出 95 % 置信区间的最大时间滞
(RMSE 和平均绝对百分比误 差 (MAPE) 个统计指 后值 (表 3)。以未来 1 预测的第一个分解成分
d
)
3
标进行模型性能评估,其计算公式如下: MODE 为例,确定的时间滞后值 是 47,因此,在任何
1