Page 185 - 《环境工程技术学报》2023年第1期
P. 185

第 1 期                         陈伟等:基于经验小波变换的鄱阳          湖  COD M n  预测                      · 181 ·

            研究已经很多       [4-7] ,但鲜见鄱阳湖水域针      对  COD  n  的    性,并且该指标比溶解氧、p           H  等其他水质指标变化
                                                      M
                                                                                           T
            研究。COD      n  作为反映湖泊富营养化和有机质浓度                    更复杂   [22] ,因此有必要验    证  EW 在   COD   n  预测方
                       M                                                                            M
            的重要指标,与其他环境因子关系密切,其变化动态                            面的有效性。
            对预防藻类水华发生具有重要意义,因此,开展鄱阳                                笔者  将  EW 与   BLST M  神经网络相结合,开发
                                                                             T
            湖  COD   n  的预测与评价十分必要。                            出一种混合模型       对       n  进行预测,并以鄱阳湖入
                   M                                                            COD M
                目前对    于  COD  n  的治理主要依赖于实时监测                 水口        n  时间序列作为研究对象进行模型验
                              M                                    COD  M
            技术,但仅依靠实时监测技术只能进行污染后的修                             证。本研究的特色:1)将            EW 用于水体        COD
                                                                                           T
                                                                                                          Mn
            复工作,而不能规避未来可能发生的水体污染风                              预测;2)开   发  EW 与深度学习神经网络相结合组成
                                                                              T
            险。如果能将实时监测            的  CO D  数据与数学模型相            的预测模型进行水质预测。虽               然  Li 等 [21 ]  使用过
                                                                                                u
            结合实现水质的准确预测,就可以让相关部门及管                             EW 方法,但其研究中利用的是传统的机器学习算
                                                                  T
            理人员预判到可能存在的污染风险,并向上下流域                             法  (“浅层学习”),而不是深度学习算法。与传统的
            发出预警,从而为水资源的管理提供科学可靠的依                             机器学习相比,深度学习通过深层神经网络结构来
            据 [8-9] 。机器学习模型作为一种数据驱动的方法,具                       实现底层数据源的更高级别表示,而且能够在没有
            有非线性映射、鲁棒性和自适应性的优点,被认为是                            明确指示的情况下提取大量特征,受原始数据和噪
            水质预测的有效方法。近年来,机器学习在理论研                             声数据的影响较少        [23-24] 。EW 与深度学习算法相结
                                                                                        T
            究和实际应用中都取得了重大突破。在水质预测方                             合建立的模型可能达到更高的预测精度。
            面,Rube 等    [10 ]  通过多层传感器实现了对无锡市河
                    n
            流  COD   n  的预测;Mia 等   [11 ]  通过构建长短期记忆            1 研究区概况与数据来源
                                 o
                   M
            (LSTM)神经网络,实现了对有毒污水出                 水  CO 的        1.1 研究区概况
                                                      D
            精准预测,为实现系统故障预警提供了科学依据;
                                                                   鄱阳湖位于江西省北部,平水位时湖泊面积为
            Khulla 等 [12 ]  通过构建双向长短期记忆(BLSTM)神
                  r
                                                                      2
                                                               3 150 km 。鄱阳湖由赣江、新江、府河、饶河、修河
            经网络,对印度德里地区            的  COD 和 r  BOD 进行了
                                                   5
                                          C                    5 条河流汇入,通过一条狭长的北方河道与长江交
            预测,其表现出色。虽然机器学习在水质预测方面
                                                               汇,是长江中下游主要支流之一。该地区受季风控
            的研究有很多,但由         于  COD M n  这个指标具有高度不            制,年平均气温      为  18 ℃,降水量    为  1 500 mm。不同
            确定性且变化因素也比较复杂,单一的机器学习模
                                                               季节湖泊水位差较大,低水位时              仅  12 m,高水位时能
            型往往不能满足预测精度的要求                [13-14] 。为了克服这
                                                                            [4]
                                                               达 到  22  m  以上 。
            些局限性,专家学者将数据分解技术与机器学习神
                                                                1.2 数据来源
            经网络相结合,以此提高机器学习模型的预测精
                                                                   从生态环境部网        站  (https://www.mee.gov.cn 收
                                                                                                         )
            度。该混合模型的基本思想是通过数据分解将原始
                                                               集鄱阳湖入水口的水质监测站点——江西省南昌市
            的高噪声数据分解成几个低噪声数据,再对分解的
                                                               滁槎监测站      201 年   8  月  1  日—202 年  4  月  3 日
                                                                                               0
                                                                             7
                                                                                                         0
            低噪声数据应用机器学习神经网络进行预测。由于
                                                                   3
                                                                                                  h
            分解后的数据相较于原始数据更加稳定和便于处                              ( 共  3 个月) 的  COD Mn 监测数   据  ( 每  4  一次)。对
            理,因此该类方法的预测精度往往高于单一机器学                             得到的数据进行异常值处理,即根据                    GB 3838—
                                                                                                     L
            习模型    [15] 。而数据分解技术中,小波分          解  (WD)、经       2002《地表水环境质量标准》将高            于  15 mg/ 的值全
            验模式分     解  (EMD) [16 ]  是近年来最常用的数据分解技             部去除,再进行每日平         均  (单日监测    值  4  个以上的才
            术,并已经在水质预测模型方面得到了广泛应                               算有效,否则视为缺失值),得到每日平                均  COD M n  数
                                                                         8
                                                                                                         9
                                                                                        7
            用 [13,17-19] 。但 这  2  种数据分解方法存在明显的缺点:              据  (共 计  98 个)。其中,201 年      8  月  1  日—201 年
                                                                                              9
                                                                0
                                                                     1
            W 的分解性能很大程度上取决于母小波函数和分                             1 月  3 日的数据用于模型训练,201 年            1 月 1  1 日—
              D
                                                                  0
                                                                                                         0
                                                                           1
            解水平的设置,所以需要进行大量数值试验来确定                             202 年  1  月  3 日的数据用于模型验证,202 年
            这些超参数;      而  EM 缺少严谨的数学基础且存在模                    2 月  1 日— 月  3 日的数据用于模型测试。
                                                                        4
                                                                              0
                             D
                                                                                           7
            态混叠、重构误差大等问题,导致模型的预测性能十                                图  1 显示了该监测站      点  201 年  8 月  1 日—2020
                                                                      0
            分有限。经验小波变          换  (EWT 通过构建自适应小波               年  4  月  3 日 的  COD M n  监测数据。由   图  1  可知,鄱
                                       )
            函数,能够提取不同频率成分,具                有  W D  的严谨性        阳 湖  COD M n  具有明显的季节性变化,整体数值范围
            和  EM D  的 自 适 应 性   [20]  , 可 以 解 决 上 述  W 和      为  1.13~6.00 mg/L,平均值为(2.50±0.73)mg/L,标准
                                                      D
            EM 的缺点      [21] 。但现有的研究鲜见       将  EW 应用于         偏差较大,表明数据不稳定性较高,导致现有的很多
                                                  T
               D
            COD   n  预测。考虑到      COD   n  在水质方面的重要             模型无法达到较高的预测精度。
                 M                   M
   180   181   182   183   184   185   186   187   188   189   190