Page 185 - 《环境工程技术学报》2023年第1期
P. 185
第 1 期 陈伟等:基于经验小波变换的鄱阳 湖 COD M n 预测 · 181 ·
研究已经很多 [4-7] ,但鲜见鄱阳湖水域针 对 COD n 的 性,并且该指标比溶解氧、p H 等其他水质指标变化
M
T
研究。COD n 作为反映湖泊富营养化和有机质浓度 更复杂 [22] ,因此有必要验 证 EW 在 COD n 预测方
M M
的重要指标,与其他环境因子关系密切,其变化动态 面的有效性。
对预防藻类水华发生具有重要意义,因此,开展鄱阳 笔者 将 EW 与 BLST M 神经网络相结合,开发
T
湖 COD n 的预测与评价十分必要。 出一种混合模型 对 n 进行预测,并以鄱阳湖入
M COD M
目前对 于 COD n 的治理主要依赖于实时监测 水口 n 时间序列作为研究对象进行模型验
M COD M
技术,但仅依靠实时监测技术只能进行污染后的修 证。本研究的特色:1)将 EW 用于水体 COD
T
Mn
复工作,而不能规避未来可能发生的水体污染风 预测;2)开 发 EW 与深度学习神经网络相结合组成
T
险。如果能将实时监测 的 CO D 数据与数学模型相 的预测模型进行水质预测。虽 然 Li 等 [21 ] 使用过
u
结合实现水质的准确预测,就可以让相关部门及管 EW 方法,但其研究中利用的是传统的机器学习算
T
理人员预判到可能存在的污染风险,并向上下流域 法 (“浅层学习”),而不是深度学习算法。与传统的
发出预警,从而为水资源的管理提供科学可靠的依 机器学习相比,深度学习通过深层神经网络结构来
据 [8-9] 。机器学习模型作为一种数据驱动的方法,具 实现底层数据源的更高级别表示,而且能够在没有
有非线性映射、鲁棒性和自适应性的优点,被认为是 明确指示的情况下提取大量特征,受原始数据和噪
水质预测的有效方法。近年来,机器学习在理论研 声数据的影响较少 [23-24] 。EW 与深度学习算法相结
T
究和实际应用中都取得了重大突破。在水质预测方 合建立的模型可能达到更高的预测精度。
面,Rube 等 [10 ] 通过多层传感器实现了对无锡市河
n
流 COD n 的预测;Mia 等 [11 ] 通过构建长短期记忆 1 研究区概况与数据来源
o
M
(LSTM)神经网络,实现了对有毒污水出 水 CO 的 1.1 研究区概况
D
精准预测,为实现系统故障预警提供了科学依据;
鄱阳湖位于江西省北部,平水位时湖泊面积为
Khulla 等 [12 ] 通过构建双向长短期记忆(BLSTM)神
r
2
3 150 km 。鄱阳湖由赣江、新江、府河、饶河、修河
经网络,对印度德里地区 的 COD 和 r BOD 进行了
5
C 5 条河流汇入,通过一条狭长的北方河道与长江交
预测,其表现出色。虽然机器学习在水质预测方面
汇,是长江中下游主要支流之一。该地区受季风控
的研究有很多,但由 于 COD M n 这个指标具有高度不 制,年平均气温 为 18 ℃,降水量 为 1 500 mm。不同
确定性且变化因素也比较复杂,单一的机器学习模
季节湖泊水位差较大,低水位时 仅 12 m,高水位时能
型往往不能满足预测精度的要求 [13-14] 。为了克服这
[4]
达 到 22 m 以上 。
些局限性,专家学者将数据分解技术与机器学习神
1.2 数据来源
经网络相结合,以此提高机器学习模型的预测精
从生态环境部网 站 (https://www.mee.gov.cn 收
)
度。该混合模型的基本思想是通过数据分解将原始
集鄱阳湖入水口的水质监测站点——江西省南昌市
的高噪声数据分解成几个低噪声数据,再对分解的
滁槎监测站 201 年 8 月 1 日—202 年 4 月 3 日
0
7
0
低噪声数据应用机器学习神经网络进行预测。由于
3
h
分解后的数据相较于原始数据更加稳定和便于处 ( 共 3 个月) 的 COD Mn 监测数 据 ( 每 4 一次)。对
理,因此该类方法的预测精度往往高于单一机器学 得到的数据进行异常值处理,即根据 GB 3838—
L
习模型 [15] 。而数据分解技术中,小波分 解 (WD)、经 2002《地表水环境质量标准》将高 于 15 mg/ 的值全
验模式分 解 (EMD) [16 ] 是近年来最常用的数据分解技 部去除,再进行每日平 均 (单日监测 值 4 个以上的才
术,并已经在水质预测模型方面得到了广泛应 算有效,否则视为缺失值),得到每日平 均 COD M n 数
8
9
7
用 [13,17-19] 。但 这 2 种数据分解方法存在明显的缺点: 据 (共 计 98 个)。其中,201 年 8 月 1 日—201 年
9
0
1
W 的分解性能很大程度上取决于母小波函数和分 1 月 3 日的数据用于模型训练,201 年 1 月 1 1 日—
D
0
0
1
解水平的设置,所以需要进行大量数值试验来确定 202 年 1 月 3 日的数据用于模型验证,202 年
这些超参数; 而 EM 缺少严谨的数学基础且存在模 2 月 1 日— 月 3 日的数据用于模型测试。
4
0
D
7
态混叠、重构误差大等问题,导致模型的预测性能十 图 1 显示了该监测站 点 201 年 8 月 1 日—2020
0
分有限。经验小波变 换 (EWT 通过构建自适应小波 年 4 月 3 日 的 COD M n 监测数据。由 图 1 可知,鄱
)
函数,能够提取不同频率成分,具 有 W D 的严谨性 阳 湖 COD M n 具有明显的季节性变化,整体数值范围
和 EM D 的 自 适 应 性 [20] , 可 以 解 决 上 述 W 和 为 1.13~6.00 mg/L,平均值为(2.50±0.73)mg/L,标准
D
EM 的缺点 [21] 。但现有的研究鲜见 将 EW 应用于 偏差较大,表明数据不稳定性较高,导致现有的很多
T
D
COD n 预测。考虑到 COD n 在水质方面的重要 模型无法达到较高的预测精度。
M M