人工智能耦合先验知识,在溶解氧预测上取得新成果

  近期,华东师范大学河口海岸全国重点实验室程和琴研究员和软件工程学院陈曦教授科研团队合作取得人工智能驱动溶解氧预测的重要进展。相关成果以Dissolved Oxygen Prediction in the Dianchi River Basin with Explainable Artificial Intelligence based on Physical Prior Knowledge为题,发表于环境领域旗舰期刊Environmental Modelling & Software。
 
研究背景
  近年来,随着城市工业化和城市化的快速发展,淡水湖泊面临着严重的生态问题,其中溶解氧(DO)的急剧下降是导致淡水湖泊生物灾难性事件的重要诱因。滇池位于长江上游,作为中国重要的淡水湖泊之一,其水质问题尤为突出。因此,开发一种能够准确预测滇池溶解氧突然衰竭的模型迫在眉睫、刻不容缓。尽管采用机器学习模型模拟溶解氧的研究已相对成熟,但是仍然面临以下四个问题:
(1) 尽管学者们采用深度学习模型预测湖泊溶解氧取得了很好的效果,但对时间序列特征的考虑仍不全面。例如,溶解氧具有明显的季节变化特征,但以往的研究并未进一步考虑不同季节下影响溶解氧的因素是否相同。
(2) 虽然深度学习模型在模拟溶解氧方面具有卓越的能力,但这类模型仅仅是基于历史数据特征模拟后续溶解氧浓度的变化。换言之,这类模型忽略了溶解氧与其他因素之间的理化关系。因此,存在模拟结果偏离实际物理规则的潜在风险。
(3) 虽然通过采用机器学习模型可以大大提高溶解氧浓度预测的准确性,但是机器学习模型本身由大量的参数构成。因此,随着模型复杂度的增加,可解释性也必然受到影响。
(4) 考虑到溶解氧浓度的复杂性和非线性,将所有外部因素作为神经网络的输入会增加计算的复杂性。此外,由于多个变量之间的相互作用,还可能对预测精度造成负面影响。
 
研究结果
  团队提出了一种基于先验知识约束的双向长短时记忆网络模型(PKBiLSTM),并以滇池环湖19个水文观测站的溶解氧浓度作为研究对象。研究结果表明,物理先验知识的引入可大大提高溶解氧预测的准确性。具体来说,PKBiLSTM 模型的在19个数据集上的平均克林-古普塔效率系数 (KGE) 为0.926,与门控循环单元 (GRU) 和CatBoost模型相比,分别提高了3.35% 和 2.38%,具有有效性和竞争性。此外,通过引入SHAP对模型进行可解释性分析可以得出,pH对溶解氧的影响最为显著,且为正向影响。
 
图1 图文摘要
 
图2 各模型在不同数据集测试集上的R²热力图
 
图3 各模型在不同数据集测试集上的(a) RMSE , (b) NSE 和(c) KGE箱线图
 
图4 PKBiLSTM在不同数据集上的拟合效果
 
图5 pH和DO之间的特征依赖图
 
研究团队及资助
  该论文的第一作者为华东师范大学河口海岸全国重点实验室硕士生吴俊豪,通讯作者为软件工程学院陈曦教授,其他作者包括北京大学黄永贵研究员、香港教育大学Philip LH. Yu教授、爱琴海大学Adonis Velegrakis教授和华东师范大学数据科学与工程学院刘小平老师等。研究得到国家自然科学基金 (41871340和42271009) 和长三角智慧优质水网建设战略项目(23692123900) 的资助。
 
文献信息
Wu Junhao, Chen Xi, Dong Jinghan, et al. Dissolved Oxygen Prediction in the Dianchi River Basin with Explainable Artificial Intelligence based on Physical Prior Knowledge. Environmental Modelling & Software. 2025