关键词:
机器学习
农业水资源利用效率
北方农牧交错带
XGBoost回归算法
SHAP模型
摘要:
为提升我国北方农牧交错带农业水资源利用效率,研究旨在提出一种基于机器学习极限梯度提升(eXtreme Gradient Boosting,XGBoost)算法的农业水资源利用效率评价和分析框架。首先,利用熵权TOPSIS(Technique for Order Preference by Similarity to Ideal Solution)模型对北方农牧交错带七省区2008年至2021年的农业水资源利用效率进行测度;其次,将效率值作为XGBoost回归预测算法的先验样本进行训练测试,并使用贝叶斯优化(Bayesian Optimization,BO)算法对极限梯度提升回归预测模型的超参数进行优化。此外,应用五折交叉验证对TOPSIS-XGBoost回归模型结果进行稳健性检验;最后采用SHAP(Shapley Additive Explanation)模型系统分析影响北方农牧交错带七省区农业水资源利用效率的关键驱动因素。研究结果表明:2008年至2021年的北方农牧交错带七省区农业水资源利用效率整体有所提高,平均效率值由2008年的0.328上升至2021年的0.437,但总体效率均值较低;2021年河北省、宁夏回族自治区、辽宁省、陕西省和内蒙古自治区的农业水资源利用效率相对较高,效率值分布在0.40至0.59之间;甘肃省和山西省的农业水资源综合利用效率较低,效率值分别为0.33和0.31;BO-XGBoost回归预测模型测试集的R2较基准XGBoost模型提高了2.63%,且五折交叉验证的R2均值为0.96,表明模型误差较小,具有良好的预测性能和稳健性;供水模数、有效灌溉率以及农业规模化程度是影响七省区农业水资源利用效率的关键驱动因素。TOPSIS-BO-XGBoost-SHAP模型可为我国农业可持续发展提供科学参考和技术支持。