关键词:
机器学习
新污染物
纳米材料
抗生素
微塑料
内分泌干扰物
摘要:
随着技术的不断发展,越来越多的新污染物(emerging contaminants,ECs)产生并进入环境中.这些ECs往往具有生物毒性和环境持久性,对生态环境和人类健康构成风险,因此越来越多的研究开始关注ECs的风险识别与防控.自然环境中ECs的存在情况复杂,传统的分析方法在ECs风险的识别与预测上费时费力.机器学习(machine learning,ML)是一种数据驱动的研究方法,使用已有的数据训练模型,以更好地预测和发现研究对象的发展变化规律.由于ML能够深入了解参数之间复杂的关系,近年来,ML在ECs风险识别与防控领域的应用愈加广泛.传统技术与ML结合能够降低计算成本,并通过优化和减少实验次数来节省实验时间和能源消耗.ML在ECs中的应用大致可以分为毒性预测、识别分类、性质评估与辅助去除.本文梳理了ML在典型ECs(纳米材料、微纳米塑料、抗生素抗性基因、全氟烷基和多氟烷基物质、内分泌干扰物和持久性有机污染物)中的应用情况与挑战.在毒性研究中,ML的使用能够减少动物实验,但是该领域目前普遍存在数据较少的情况,部分模型使用的数据集较小,数据质量较低,模型应用范围有限.并且并不是所有的环境问题都适用ML,没有必要过度依赖ML.复杂的ML模型通常伴随着可解释性的不足,使得研究者难以理解ML如何得出特定的预测结果,这对于解释和理解ECs的环境行为和风险是一个挑战.在ML中,除了模型算法本身,训练数据的质量决定着模型的准确性和预测的准确性.因此今后应重点提升ECs数据质量,实现数据共享,并建立统一完善的数据库,形成适合ECs研究的研究体系或框架.