Page 187 - 《环境工程技术学报》2023年第1期
P. 187

第 1 期                         陈伟等:基于经验小波变换的鄱阳          湖  COD M n  预测                      · 183 ·


                                                                                     L
                                                                                    ∑
                                                                                       |O l − P l |
                                                                                     l=1
                                                                             MAE =                      (9)
                                                                                        L
                                                                                  v
                                                                                  t    L
                                                                                     1  ∑
                                                                          RMSE =         (O l − P l ) 2  (10)
                                                                                     L
                                                                                       l=1
                                                                                       L
                                                                                    1  ∑  |O l − P l |
                                                                            MAPE =                     (11)
                                                                                    L      O l
                                                                                      l=1
                                                               式中:O 为实测值;P 为预测值; 为数据长度。
                                                                     l
                                                                                 l
                                                                                           L
                                                                2.4.2 比较对象
              注:x(1),x (2),···,x(t 为数据输入;y(1),y (2),···,y (t 为数据输出。
                           )
                                              )
                                                                   为了更清楚地展        示  EWT-BLST  M  模型的高效
                图 2    LST M  神经网络 和  BLST M  神经网络的对比
                                                               性, 表  1 展示了参与比较的模型的结构对比 。
            Fig.2    Comparison between LSTM and BLSTM neural networks

                                                                          表 1    参与比较的模型的结构
            解成分    的  BLSTM 的输入变量;3 将上述选定的输                           Table 1    Structure of the competitor models
                                          )
                            )
            入变量输入      到  BLST M  神经网络,得出每个分解成分                      模型          数据分解算法         神经网络算法
            的预测值;4 通过把所有分解成分的预测结果进行                                 BLSTM          不使用            BLSTM
                       )
            重建,得到最终水质参          数  COD  n  的预测值。
                                       M                          WD-BLSTM          WD            BLSTM
                图  3  显 示  EWT-BLST M  模型的预测过程,图中                 EMD-BLSTM         EMD           BLSTM
            BLSTM k (k = 1,2,··· ,K)表示第 k个分解成分对应的                  EWT-SVR          EWT            SVR
            BLST M  神经网   络  (预测模块),     MODE k (k = 1,2,··· ,     EWT-ELM          EWT            ELM
                                               ′
               是
            K) MODE k 的预测结果。                                      EWT-LSTM          EWT            LSTM

                                                                3 结果与讨论
                                                                3.1 模型构建
                                                                   模型的预测性能很大程度上受到模型超参数设
                                                               置的影响,为此使用训练集和验证集来确定模型的
                                                               结构并优化必要的超参数。
                                                                3.1.1 EW 数据分解
                                                                        T
                                                                   首先通   过  EW 将鄱阳湖数据中训练集和验证
                                                                               T
                                                               集 的  COD  n  时间序列分解      为  8  个模 式  (MODE ~
                                                                        M                                 1
                                                                                        8
                                                               MODE )( 图  4)。其中,MODE 是通过识别多锥功率
                                                                     8
                                                               谱估计中的峰值自动确定的。从               图  4可以看出,相较
                                                               于原始数据,大部分分解成分展现出更加清晰的变
                                                               化趋势。通过      表  2  所示的样本熵值,同样也可以看
                                                               出分解成分的熵值明显小于原               始  COD  n  时间序列
                      图 3     地表水 体  COD  n  预测流程                                                M

                                       M                       的熵值(  图  1)。因此,根据这些分解成分建立模型,可以
               Fig.3    Flow chart of COD  prediction of surface water
                                  Mn
                                                               获得比使用原始数据建立的模型更高的预测精度。
                模型的建立和测试通           过  MATLAB 2020 软件           3.1.2 PAC 分析
                                                    b
                                                                         F
            实现。                                                    在建立模型之前,根据时间序列数据的特征,需
             2.4 模型的预测性能评价                                     要确定输入因子。考虑到历史数据和预测值之间的
             2.4.1 评价指标                                        相关性,使     用  PAC 分析来确定模型的输入因子。
                                                                               F
                通  过  1  和  7  后 的  COD  n  预测来验证所提出方          具体计算过程:首先计算出每个分解成分时间序列
                           d
                                     M
            法的有效性,采用均绝对误             差  (MAE)、均方根误差            的  PACF,然后找出      95 %  置信区间的最大时间滞
            (RMSE 和平均绝对百分比误            差  (MAPE) 个统计指          后值  (表  3)。以未来      1  预测的第一个分解成分
                                                                                    d
                   )
                                                3
            标进行模型性能评估,其计算公式如下:                                 MODE 为例,确定的时间滞后值             是  47,因此,在任何
                                                                     1
   182   183   184   185   186   187   188   189   190   191   192