Can Machine Learning Forecast Rice Yields in Data-Constrained Settings? Satellite Climate Data, National Crop Statistics, and Lessons from Sierra Leone - 专知论文

会员服务 ·

0

数据受限 · xgboost · 机器学习 · 梯度 · 梯度提升 ·

Can Machine Learning Forecast Rice Yields in Data-Constrained Settings? Satellite Climate Data, National Crop Statistics, and Lessons from Sierra Leone

翻译：机器学习能否在数据受限条件下预测水稻产量？基于卫星气候数据、国家作物统计及塞拉利昂的经验教训

Ibrahim Denis Fofanah

from arxiv, 32 pages, 7 figures. Code and data: https://github.com/Denis060/sierraleone-agri-ml

Sierra Leone's agriculture operates with almost no data-driven decision support, and no published machine learning study has examined the country's crop yields. We ask whether rice yield can be forecast from data Sierra Leone currently has. Using 25 years of FAOSTAT production data (2000-2024) for nine major crops, we train XGBoost, Gradient Boosting, and Random Forest under a strict anti-leakage protocol with expanding-window walk-forward evaluation across seven held-out years, benchmarked against naive persistence. No model trained on crop statistics alone outperforms persistence. Augmenting with free satellite climate data (CHIRPS rainfall, NASA POWER temperature) reverses this result: a climate-only XGBoost reduces forecast error by one third (RMSE 284 vs 428 kg/ha), a gain that holds for a linear model and is robust to excluding the anomalous 2018 season. Early-season (May-June) rainfall is the dominant predictor, implying seasonal yield risk is observable months before harvest. No model anticipated the 2018 collapse, whose origins were institutional rather than climatic. We translate the findings into policy recommendations for Sierra Leone's Feed Salone Strategy, with a fully open-source pipeline.

翻译：塞拉利昂的农业生产几乎缺乏数据驱动的决策支持，且尚未有机器学习研究探讨该国的作物产量。我们探究能否利用塞拉利昂现有数据预测水稻产量。使用25年（2000-2024年）FAOSTAT九种主要作物的生产数据，在严格的防泄漏协议下训练XGBoost、梯度提升和随机森林模型，通过扩展窗口滚动向前验证法在七个保留年份上进行评估，并以朴素持久性模型为基准。仅基于作物统计训练的模型均未能优于持久性模型。引入免费卫星气候数据（CHIRPS降水、NASA POWER温度）后结果发生逆转：仅含气候特征的XGBoost将预测误差降低三分之一（RMSE从428降至284 kg/ha），该优势在线性模型中仍然保持，且对排除异常2018年季节的结果具有稳健性。早期季节（5-6月）降水量是最主要的预测因子，表明季节产量风险在收获前数月即可观测。所有模型均未能预测2018年产量骤降，其根源在于制度因素而非气候因素。我们将研究结果转化为塞拉利昂"塞拉利昂粮食自给战略"的政策建议，并提供完全开源的完整流程。

0

相关内容

数据受限

《自动机器学习在军事数据耕耘法中的应用》

《自动机器学习在军事数据耕耘法中的应用》

专知会员服务

11+阅读 · 6月10日

《农业中的人工智能：作物、水产养殖与畜牧业中深度学习技术综述》

《农业中的人工智能：作物、水产养殖与畜牧业中深度学习技术综述》

专知会员服务

20+阅读 · 2025年7月31日

【MIT博士论文】从数据到模型，再回到数据：构建可预测且可靠的机器学习系统”

【MIT博士论文】从数据到模型，再回到数据：构建可预测且可靠的机器学习系统”

专知会员服务

23+阅读 · 2025年6月19日

【CVPR2022教程】马里兰大学《机器学习遥感处理:农业与粮食安全》教程，附ppt

【CVPR2022教程】马里兰大学《机器学习遥感处理:农业与粮食安全》教程，附ppt

专知会员服务

43+阅读 · 2022年6月25日

【干货书】智慧农业：数据分析和机器学习，云架构，自动化和物联网

【干货书】智慧农业：数据分析和机器学习，云架构，自动化和物联网

专知会员服务

64+阅读 · 2022年5月22日

【AI+农业病害识别】博士论文《使用多光谱航空影像进行农作物病害早期检测、识别和时空监测的深度学习》美国克莱蒙特研究大学

【AI+农业病害识别】博士论文《使用多光谱航空影像进行农作物病害早期检测、识别和时空监测的深度学习》美国克莱蒙特研究大学

专知会员服务

23+阅读 · 2022年4月29日

67页PPT【ML+气象】使用机器学习技术对季节和次季节研究和预测，Use of Machine Learning Techniques for Seasonal and Subseasonal Studies and Predictions

67页PPT【ML+气象】使用机器学习技术对季节和次季节研究和预测，Use of Machine Learning Techniques for Seasonal and Subseasonal Studies and Predictions

专知会员服务

19+阅读 · 2022年3月4日

【Google AI应用】利用机器学习来“短时预报”高分辨率的降水:Using Machine Learning to “Nowcast” Precipitation in High Resolution

【Google AI应用】利用机器学习来“短时预报”高分辨率的降水:Using Machine Learning to “Nowcast” Precipitation in High Resolution

专知会员服务

22+阅读 · 2020年1月15日

【O'Reilly AI Conference 2019】部署大规模分布式数据（How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE))，HPE BlueData，Thomas Phelan

【O'Reilly AI Conference 2019】部署大规模分布式数据（How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE))，HPE BlueData，Thomas Phelan

专知会员服务

19+阅读 · 2019年11月5日

【报告推荐】线上食品推荐中的数据分析（Computational Data Analytics on the Web for Better Food Decision Making）

【报告推荐】线上食品推荐中的数据分析（Computational Data Analytics on the Web for Better Food Decision Making）

专知会员服务

16+阅读 · 2019年10月2日

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

专知

19+阅读 · 2022年10月23日

掌握“机器学习”，这可能是比啃西瓜书更高效的方法

掌握“机器学习”，这可能是比啃西瓜书更高效的方法

计算机视觉life

10+阅读 · 2019年10月23日

NeurIPS2019机器学习顶会接受论文列表！

NeurIPS2019机器学习顶会接受论文列表！

GAN生成式对抗网络

17+阅读 · 2019年9月6日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

机器学习经典必读书，李航《统计学习方法》出视频课了！

机器学习经典必读书，李航《统计学习方法》出视频课了！

深度学习与NLP

15+阅读 · 2019年5月16日

用机器学习来预测股价（代码+文档）——2018年iNTUtion决赛大作！

用机器学习来预测股价（代码+文档）——2018年iNTUtion决赛大作！

量化投资与机器学习

25+阅读 · 2018年11月20日

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

AI研习社

13+阅读 · 2018年6月8日

最全数据科学学习资源：Python、线性代数、机器学习...

最全数据科学学习资源：Python、线性代数、机器学习...

人工智能头条

12+阅读 · 2018年5月14日

数据增强：数据有限时如何使用深度学习？（续）

数据增强：数据有限时如何使用深度学习？（续）

AI研习社

14+阅读 · 2018年5月6日

基于信息理论的机器学习

基于信息理论的机器学习

专知

22+阅读 · 2017年11月23日

旱稻抗旱基因DBL9的功能鉴定及分子机制研究

国家自然科学基金

0+阅读 · 2016年12月31日

基于改进型光化学植被指数（PRI）的冬小麦水胁迫监测研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

井震联合数据驱动下，多智能技术融合的煤层气储层参数预测与评价

国家自然科学基金

2+阅读 · 2015年12月31日

顾及物候的玉米作物干旱遥感监测模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

水稻OsSRO1c基因在干旱胁迫诱导的叶片衰老中的功能研究

国家自然科学基金

0+阅读 · 2015年12月31日

水稻株高与茎秆强度协同调控的遗传网络解析

国家自然科学基金

0+阅读 · 2014年12月31日

作物生长模型和遥感数据同化的双尺度作物氮素预测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

抗干扰的农作物种植模式自动提取方法

国家自然科学基金

0+阅读 · 2014年12月31日

Forecasting the U.S. Treasury Yield Curve: A Distributionally Robust Machine Learning Approach for Interest Rate Risk Management

Arxiv

0+阅读 · 6月14日

Enhancing Precision Agriculture with a Hybrid Deep Learning Framework for Multi-Class Plant Disease Classification and Interpretability

Arxiv

0+阅读 · 6月13日

Leveraging Physiological Signals to Predict Exam Outcomes with Machine Learning

Arxiv

0+阅读 · 6月12日

Data-driven Lake Water Quality Forecasting for Time Series with Missing Data using Machine Learning

Arxiv

0+阅读 · 6月10日

Instrumented data for causal scientific machine learning

Arxiv

0+阅读 · 6月5日

Machine Learning-Based Bitcoin Trading Under Transaction Costs: Evidence From Walk-Forward Forecasting

Arxiv

0+阅读 · 5月19日

Improving ecological inference and uncertainty quantification from camera trap data through the fusion of AI confidences and manual annotations

Arxiv

0+阅读 · 5月13日

Learning What Can Be Picked: Active Reachability Estimation for Efficient Robotic Fruit Harvesting

Arxiv

0+阅读 · 5月12日

Are vision-language models ready to zero-shot replace supervised classification models in agriculture?

Arxiv

0+阅读 · 5月11日

Machine Learning Research Has Outpaced Its Communication Norms and NeurIPS Should Act

Arxiv

0+阅读 · 5月9日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

《自动机器学习在军事数据耕耘法中的应用》

《自动机器学习在军事数据耕耘法中的应用》

专知会员服务

11+阅读 · 6月10日

《农业中的人工智能：作物、水产养殖与畜牧业中深度学习技术综述》

《农业中的人工智能：作物、水产养殖与畜牧业中深度学习技术综述》

专知会员服务

20+阅读 · 2025年7月31日

【MIT博士论文】从数据到模型，再回到数据：构建可预测且可靠的机器学习系统”

【MIT博士论文】从数据到模型，再回到数据：构建可预测且可靠的机器学习系统”

专知会员服务

23+阅读 · 2025年6月19日

【CVPR2022教程】马里兰大学《机器学习遥感处理:农业与粮食安全》教程，附ppt

【CVPR2022教程】马里兰大学《机器学习遥感处理:农业与粮食安全》教程，附ppt

专知会员服务

43+阅读 · 2022年6月25日

【干货书】智慧农业：数据分析和机器学习，云架构，自动化和物联网

【干货书】智慧农业：数据分析和机器学习，云架构，自动化和物联网

专知会员服务

64+阅读 · 2022年5月22日

【AI+农业病害识别】博士论文《使用多光谱航空影像进行农作物病害早期检测、识别和时空监测的深度学习》美国克莱蒙特研究大学

【AI+农业病害识别】博士论文《使用多光谱航空影像进行农作物病害早期检测、识别和时空监测的深度学习》美国克莱蒙特研究大学

专知会员服务

23+阅读 · 2022年4月29日

67页PPT【ML+气象】使用机器学习技术对季节和次季节研究和预测，Use of Machine Learning Techniques for Seasonal and Subseasonal Studies and Predictions

67页PPT【ML+气象】使用机器学习技术对季节和次季节研究和预测，Use of Machine Learning Techniques for Seasonal and Subseasonal Studies and Predictions

专知会员服务

19+阅读 · 2022年3月4日

【Google AI应用】利用机器学习来“短时预报”高分辨率的降水:Using Machine Learning to “Nowcast” Precipitation in High Resolution

【Google AI应用】利用机器学习来“短时预报”高分辨率的降水:Using Machine Learning to “Nowcast” Precipitation in High Resolution

专知会员服务

22+阅读 · 2020年1月15日

【O'Reilly AI Conference 2019】部署大规模分布式数据（How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE))，HPE BlueData，Thomas Phelan

【O'Reilly AI Conference 2019】部署大规模分布式数据（How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE))，HPE BlueData，Thomas Phelan

专知会员服务

19+阅读 · 2019年11月5日

【报告推荐】线上食品推荐中的数据分析（Computational Data Analytics on the Web for Better Food Decision Making）

【报告推荐】线上食品推荐中的数据分析（Computational Data Analytics on the Web for Better Food Decision Making）

专知会员服务

16+阅读 · 2019年10月2日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

专知

19+阅读 · 2022年10月23日

掌握“机器学习”，这可能是比啃西瓜书更高效的方法

掌握“机器学习”，这可能是比啃西瓜书更高效的方法

计算机视觉life

10+阅读 · 2019年10月23日

NeurIPS2019机器学习顶会接受论文列表！

NeurIPS2019机器学习顶会接受论文列表！

GAN生成式对抗网络

17+阅读 · 2019年9月6日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

机器学习经典必读书，李航《统计学习方法》出视频课了！

机器学习经典必读书，李航《统计学习方法》出视频课了！

深度学习与NLP

15+阅读 · 2019年5月16日

用机器学习来预测股价（代码+文档）——2018年iNTUtion决赛大作！

用机器学习来预测股价（代码+文档）——2018年iNTUtion决赛大作！

量化投资与机器学习

25+阅读 · 2018年11月20日

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

AI研习社

13+阅读 · 2018年6月8日

最全数据科学学习资源：Python、线性代数、机器学习...

最全数据科学学习资源：Python、线性代数、机器学习...

人工智能头条

12+阅读 · 2018年5月14日

数据增强：数据有限时如何使用深度学习？（续）

数据增强：数据有限时如何使用深度学习？（续）

AI研习社

14+阅读 · 2018年5月6日

基于信息理论的机器学习

基于信息理论的机器学习

专知

22+阅读 · 2017年11月23日

相关论文

Forecasting the U.S. Treasury Yield Curve: A Distributionally Robust Machine Learning Approach for Interest Rate Risk Management

Arxiv

0+阅读 · 6月14日

Enhancing Precision Agriculture with a Hybrid Deep Learning Framework for Multi-Class Plant Disease Classification and Interpretability

Arxiv

0+阅读 · 6月13日

Leveraging Physiological Signals to Predict Exam Outcomes with Machine Learning

Arxiv

0+阅读 · 6月12日

Data-driven Lake Water Quality Forecasting for Time Series with Missing Data using Machine Learning

Arxiv

0+阅读 · 6月10日

Instrumented data for causal scientific machine learning

Arxiv

0+阅读 · 6月5日

Machine Learning-Based Bitcoin Trading Under Transaction Costs: Evidence From Walk-Forward Forecasting

Arxiv

0+阅读 · 5月19日

Improving ecological inference and uncertainty quantification from camera trap data through the fusion of AI confidences and manual annotations

Arxiv

0+阅读 · 5月13日

Learning What Can Be Picked: Active Reachability Estimation for Efficient Robotic Fruit Harvesting

Arxiv

0+阅读 · 5月12日

Are vision-language models ready to zero-shot replace supervised classification models in agriculture?

Arxiv

0+阅读 · 5月11日

Machine Learning Research Has Outpaced Its Communication Norms and NeurIPS Should Act

Arxiv

0+阅读 · 5月9日

相关基金

旱稻抗旱基因DBL9的功能鉴定及分子机制研究

国家自然科学基金

0+阅读 · 2016年12月31日

基于改进型光化学植被指数（PRI）的冬小麦水胁迫监测研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

井震联合数据驱动下，多智能技术融合的煤层气储层参数预测与评价

国家自然科学基金

2+阅读 · 2015年12月31日

顾及物候的玉米作物干旱遥感监测模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

水稻OsSRO1c基因在干旱胁迫诱导的叶片衰老中的功能研究

国家自然科学基金

0+阅读 · 2015年12月31日

水稻株高与茎秆强度协同调控的遗传网络解析

国家自然科学基金

0+阅读 · 2014年12月31日

作物生长模型和遥感数据同化的双尺度作物氮素预测方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

抗干扰的农作物种植模式自动提取方法

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员