问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

在线机器学习助力污水处理厂应对突发事件

创作时间:
作者:
@小白创作中心

在线机器学习助力污水处理厂应对突发事件

引用
科学网
1.
https://news.sciencenet.cn/htmlpaper/2024/3/20243281205540098446.shtm

在污水处理领域,准确预测进水流量对于优化运行效率和管理决策至关重要。特别是在面对新冠疫情等突发事件时,传统的批处理监督学习方法往往难以应对输入-输出关系的动态变化。针对这一挑战,加拿大麦克马斯特大学和华北电力大学的研究团队提出了一种基于在线机器学习的解决方案,通过集成多种在线学习模型,实现了对污水处理厂进水流量的精准预测。

本研究利用在线学习模型对加拿大两个污水处理厂的进水量进行预测。在线学习模型能够有效地预测不断变化的数据模式,并且适用于处理大量的数据流。本研究有助于在新冠疫情、极端天气等突发事件下提供可靠的决策支持,使污水处理和管理更加高效(图1)。


图1 摘要图

进水流量的准确预测对于污水处理厂的运行和管理至关重要,因为其与污水的生化需氧量、总悬浮固体和pH等特性密切相关。传统的批处理监督学习可以有效预测进水流量,但并不适合于因新冠肺炎或其他突发事件影响而输入—输出关系发生动态变化的场景。本研究创新性地提出了三种具有代表性的在线机器学习模型,并将其结果作集成处理,用于优化流量预测。通过这一方法,我们成功实现了由新冠肺炎疫情导致的污水产生模式变化下的污水流量预测。

在线机器学习是一种高效的机器学习算法,在数据持续到达、应用规模庞大、以及数据生成模式及规律不断变化的情况下,它具有明显的优势。本研究选择了加拿大安大略省的两个污水处理厂 (A和B) 进行案例研究,收集了包括进水流量在内的多个相关变量的数据。数据涵盖了新冠疫情前后的连续观测数据,以反映不同的操作和环境等条件。这些数据被用于训练和评估批处理学习和在线学习模型的性能(Adaptive Random Forest, aRF; Adaptive K-Nearest Neighbors, aKNN; Adaptive Mult-Layer Perceptron, aMLP),为后续的模型比较和分析提供了基础(图2)。


图2 测试数据集上各模型进行预测的散点图:(a) A厂的在线学习模型,(b) A厂的批量学习模型,(c) B厂的在线学习模型,以及(d) B厂的批量学习模型。

通过比较不同模型的决定系数 (R2)、平均绝对百分比误差 (MAPE) 和均方根误差 (RMSE),发现在线机器学习模型在几乎所有情况下都表现更好,具有更高的准确性和更低的误差。对在线学习和批量学习的性能进行比较 (图3),发现在线学习模型能够实时地适应数据的变化和新的观测数据,能够更好地应对突发事件和数据模式的变化,以提供更准确的预测。相比于批量学习模型,在线学习模型具有更高的效率和灵活性,能够在短时间内处理大规模的进水数据流。


图3 在线学习方法和批量学习方法的性能比较:(a) 工厂A的预测误差直方图,(b) 工厂A的预测误差的框图,(c) 工厂B的预测误差的直方图,以及 (d) 工厂B的预测误差的框图。

通过对比不同在线机器学习方法在不同数据情况下的表现 (图4),发现这三种在线机器学习方法均能有效捕捉两厂的流量分布。A厂流量呈双峰分布,B厂流量则遵循泊松分布,这可能与A厂数据反映出的季节性变化有关。性能评估显示,在线机器学习aMLP模型最适合A厂,在线机器学习aKNN模型最适合B厂,而在线机器学习aRF模型在所有情况下均表现出最高的稳定性。


图4 在线学习方法的性能比较:(a) 工厂A的预测直方图,(b) 工厂A的预测框图,(c) 工厂B的预测直方图,以及 (d) 工厂B的预测的框图。

将多个在线学习模型的预测结果进行加权平均,形成了集成模型。研究发现,集成模型能够综合利用多个方法的优势,进一步减少误差并提高预测准确性,在预测污水处理厂进水流量方面具有更好的性能 (图5)。此外,通过不确定性分析,研究确定了最佳的集成权重,以进一步改善集成模型的预测性能。通过调整权重,可以根据各个在线学习方法的表现情况来调整其在集成模型中的贡献,以达到最佳的预测效果。


图5 (a) 工厂A和 (b) 工厂B的平均在线学习预测与观测的散点图

综上,在线学习模型在预测进水流量方面比传统的批量学习模型表现更好,并且具有更高的适应性和预测能力。通过对两个加拿大污水处理厂的实际案例进行比较,发现在线学习模型在所有情景下都达到了最高的预测性能。此外,通过不确定性分析,确定了最佳的预测策略。因此,本文提出的在线学习模型能够为污水处理厂在应对突发事件时提供支持,并为运营和管理决策提供可靠的依据。

本文内容来自FESE期刊2023年第17卷第12期发表的Research article文章“Online machine learning for stream wastewater influent flow rate prediction under unprecedented emergencies”。通讯作者为麦克马斯特大学Zhong Li 教授和华北电力大学张一梅教授。

引用格式:Pengxiao Zhou, Zhong Li, Yimei Zhang, Spencer Snowling, Jacob Barclay. Online machine learning for stream wastewater influent flow rate prediction under unprecedented emergencies. Front. Environ. Sci. Eng., 2023, 17(12): 152

本文来自Special issue—Artificial Intelligence/Machine Learning on Environmental Science & Engineering

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号