Sierra Leone's agriculture operates with almost no data-driven decision support, and no published machine learning study has examined the country's crop yields. We ask whether rice yield can be forecast from data Sierra Leone currently has. Using 25 years of FAOSTAT production data (2000-2024) for nine major crops, we train XGBoost, Gradient Boosting, and Random Forest under a strict anti-leakage protocol with expanding-window walk-forward evaluation across seven held-out years, benchmarked against naive persistence. No model trained on crop statistics alone outperforms persistence. Augmenting with free satellite climate data (CHIRPS rainfall, NASA POWER temperature) reverses this result: a climate-only XGBoost reduces forecast error by one third (RMSE 284 vs 428 kg/ha), a gain that holds for a linear model and is robust to excluding the anomalous 2018 season. Early-season (May-June) rainfall is the dominant predictor, implying seasonal yield risk is observable months before harvest. No model anticipated the 2018 collapse, whose origins were institutional rather than climatic. We translate the findings into policy recommendations for Sierra Leone's Feed Salone Strategy, with a fully open-source pipeline.


翻译:塞拉利昂的农业生产几乎缺乏数据驱动的决策支持,且尚未有机器学习研究探讨该国的作物产量。我们探究能否利用塞拉利昂现有数据预测水稻产量。使用25年(2000-2024年)FAOSTAT九种主要作物的生产数据,在严格的防泄漏协议下训练XGBoost、梯度提升和随机森林模型,通过扩展窗口滚动向前验证法在七个保留年份上进行评估,并以朴素持久性模型为基准。仅基于作物统计训练的模型均未能优于持久性模型。引入免费卫星气候数据(CHIRPS降水、NASA POWER温度)后结果发生逆转:仅含气候特征的XGBoost将预测误差降低三分之一(RMSE从428降至284 kg/ha),该优势在线性模型中仍然保持,且对排除异常2018年季节的结果具有稳健性。早期季节(5-6月)降水量是最主要的预测因子,表明季节产量风险在收获前数月即可观测。所有模型均未能预测2018年产量骤降,其根源在于制度因素而非气候因素。我们将研究结果转化为塞拉利昂"塞拉利昂粮食自给战略"的政策建议,并提供完全开源的完整流程。

0
下载
关闭预览

相关内容

《自动机器学习在军事数据耕耘法中的应用》
专知会员服务
11+阅读 · 6月10日
掌握“机器学习”,这可能是比啃西瓜书更高效的方法
计算机视觉life
10+阅读 · 2019年10月23日
NeurIPS2019机器学习顶会接受论文列表!
GAN生成式对抗网络
17+阅读 · 2019年9月6日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
用机器学习来预测股价(代码+文档)——2018年iNTUtion决赛大作!
量化投资与机器学习
25+阅读 · 2018年11月20日
最全数据科学学习资源:Python、线性代数、机器学习...
人工智能头条
12+阅读 · 2018年5月14日
基于信息理论的机器学习
专知
22+阅读 · 2017年11月23日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
1+阅读 · 今天14:45
综述 | 世界动作模型:少做梦,多行动
专知会员服务
1+阅读 · 今天14:43
美以伊冲突:无人机与人工智能的运用
专知会员服务
3+阅读 · 今天14:31
《特种部队在透明战场中的生存力》最新报告
专知会员服务
2+阅读 · 今天14:11
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关VIP内容
《自动机器学习在军事数据耕耘法中的应用》
专知会员服务
11+阅读 · 6月10日
相关资讯
相关基金
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员