FutureX-Pro: Extending Future Prediction to High-Value Vertical Domains - 专知论文

会员服务 ·

0

基准 · 智能体 · 语言模型 · 通用智能 · 开放领域 ·

FutureX-Pro: Extending Future Prediction to High-Value Vertical Domains

翻译：FutureX-Pro：将未来预测拓展至高价值垂直领域

Jiashuo Liu,Siyuan Chen,Zaiyuan Wang,Zhiyuan Zeng,Jiacheng Guo,Liang Hu,Lingyue Yin,Suozhi Huang,Wenxin Hao,Yang Yang,Zerui Cheng,Zixin Yao,Lingyue Yin,Haoxin Liu,Jiayi Cheng,Yuzhen Li,Zezhong Ma,Bingjie Wang,Bingsen Qiu,Xiao Liu,Zeyang Zhang,Zijian Liu,Jinpeng Wang,Mingren Yin,Tianci He,Yali Liao,Yixiao Tian,Zhenwei Zhu,Anqi Dai,Ge Zhang,Jingkai Liu,Kaiyuan Zhang,Wenlong Wu,Xiang Gao,Xinjie Chen,Zhixin Yao,Zhoufutu Wen,B. Aditya Prakash,Jose Blanchet,Mengdi Wang,Nian Si,Wenhao Huang

from arxiv, 21 pages

Building upon FutureX, which established a live benchmark for general-purpose future prediction, this report introduces FutureX-Pro, including FutureX-Finance, FutureX-Retail, FutureX-PublicHealth, FutureX-NaturalDisaster, and FutureX-Search. These together form a specialized framework extending agentic future prediction to high-value vertical domains. While generalist agents demonstrate proficiency in open-domain search, their reliability in capital-intensive and safety-critical sectors remains under-explored. FutureX-Pro targets four economically and socially pivotal verticals: Finance, Retail, Public Health, and Natural Disaster. We benchmark agentic Large Language Models (LLMs) on entry-level yet foundational prediction tasks -- ranging from forecasting market indicators and supply chain demands to tracking epidemic trends and natural disasters. By adapting the contamination-free, live-evaluation pipeline of FutureX, we assess whether current State-of-the-Art (SOTA) agentic LLMs possess the domain grounding necessary for industrial deployment. Our findings reveal the performance gap between generalist reasoning and the precision required for high-value vertical applications.

翻译：基于为通用未来预测建立实时基准的FutureX，本报告介绍了FutureX-Pro，包括FutureX-Finance、FutureX-Retail、FutureX-PublicHealth、FutureX-NaturalDisaster和FutureX-Search。这些共同构成了一个将智能体未来预测拓展至高价值垂直领域的专业化框架。尽管通用智能体在开放领域搜索中表现出色，但它们在资本密集型和安全性关键领域的可靠性仍有待探索。FutureX-Pro瞄准四个经济与社会关键垂直领域：金融、零售、公共卫生和自然灾害。我们在入门级但基础性的预测任务上对智能体大语言模型进行基准测试——涵盖从预测市场指标和供应链需求到追踪流行病趋势与自然灾害。通过采用FutureX的无污染实时评估流程，我们评估当前最先进的智能体大语言模型是否具备工业部署所需的领域基础。我们的研究结果揭示了通用推理能力与高价值垂直应用所需精度之间的性能差距。

0

相关内容

《深度学习在时间序列预测中的应用：综述》

《深度学习在时间序列预测中的应用：综述》

专知会员服务

30+阅读 · 2025年3月14日

《2025 年热门科技趋势：人工智能驱动一切》最新104页

《2025 年热门科技趋势：人工智能驱动一切》最新104页

专知会员服务

53+阅读 · 2025年1月16日

深度预测学习：模型与应用

深度预测学习：模型与应用

专知会员服务

49+阅读 · 2022年12月5日

第六届未来网络发展大会《确定性网络技术发展与产业应用白皮书》

第六届未来网络发展大会《确定性网络技术发展与产业应用白皮书》

专知会员服务

36+阅读 · 2022年9月21日

重磅！80+位作者发布272页pdf《预测: 理论与实践》论文，百科全书式概述预测领域体系方法与实践

重磅！80+位作者发布272页pdf《预测: 理论与实践》论文，百科全书式概述预测领域体系方法与实践

专知会员服务

207+阅读 · 2022年3月14日

德勤发布《2022年度技术趋势》，135页ppt：帮助企业精准把握趋势，构建技术赋能的未来

德勤发布《2022年度技术趋势》，135页ppt：帮助企业精准把握趋势，构建技术赋能的未来

专知会员服务

49+阅读 · 2022年3月14日

2021年科技趋势报告，504页pdf：区块链、金融科技与加密技术、AI、5G、智造、农业等12个领域（PDF下载）

2021年科技趋势报告，504页pdf：区块链、金融科技与加密技术、AI、5G、智造、农业等12个领域（PDF下载）

专知会员服务

89+阅读 · 2021年6月23日

【WWW2020-腾讯】未来的数据有助于训练:为基于会话的推荐建立未来的上下文模型，Future Data Helps Training: Modelling Future Contexts for Session-based Recommendation

【WWW2020-腾讯】未来的数据有助于训练:为基于会话的推荐建立未来的上下文模型，Future Data Helps Training: Modelling Future Contexts for Session-based Recommendation

专知会员服务

25+阅读 · 2020年3月15日

【KDD2019|讲座推荐】大时间序列预测的理论与实践：Forecasting Big Time Series: Theory and Practice

【KDD2019|讲座推荐】大时间序列预测的理论与实践：Forecasting Big Time Series: Theory and Practice

专知会员服务

118+阅读 · 2019年12月6日

【CVPR 2019 | tutorial】自主汽车的感知、预测和大规模数据采集：Perception, Prediction, and Large Scale Data Collection for Autonomous Cars

【CVPR 2019 | tutorial】自主汽车的感知、预测和大规模数据采集：Perception, Prediction, and Large Scale Data Collection for Autonomous Cars

专知会员服务

33+阅读 · 2019年11月28日

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

专知

14+阅读 · 2022年11月12日

智库兰德2022最新发布《2035年新兴技术：基于典型场景的未来军事突发事件技术评估》118页研究报告

智库兰德2022最新发布《2035年新兴技术：基于典型场景的未来军事突发事件技术评估》118页研究报告

专知

53+阅读 · 2022年10月13日

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AINLP

10+阅读 · 2021年2月6日

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

专知

31+阅读 · 2020年4月24日

计算的未来是 “光”！科学家开发全光学计算平台，实现 “光控制光”

计算的未来是 “光”！科学家开发全光学计算平台，实现 “光控制光”

学术头条

11+阅读 · 2020年3月13日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

机器学习开放课程（终）：基于Facebook Prophet预测未来

机器学习开放课程（终）：基于Facebook Prophet预测未来

论智

11+阅读 · 2018年11月16日

【机器学习】机器学习：未来十年研究热点

【机器学习】机器学习：未来十年研究热点

产业智能官

17+阅读 · 2018年11月4日

15款免费预测分析软件！收藏好，别丢了！

15款免费预测分析软件！收藏好，别丢了！

七月在线实验室

11+阅读 · 2018年2月27日

回归预测&时间序列预测

回归预测&时间序列预测

GBASE数据工程部数据团队

44+阅读 · 2017年5月17日

面向金融市场走势预测的在线论坛公众情绪挖掘与演化分析算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多生物网络的蛋白质功能预测算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

几何与随机分析及其应用交叉平台

国家自然科学基金

0+阅读 · 2014年12月31日

稳健随机均值模型在时空数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

多特征融合与集成学习的城市高分辨率遥感影像变化检测

国家自然科学基金

4+阅读 · 2014年12月31日

考虑不确定性和方向性的结构随机极值和疲劳风致响应及抗风可靠性评价理论

国家自然科学基金

0+阅读 · 2014年12月31日

高维度、非线性模型下的金融资产定价和风险定量计算

国家自然科学基金

1+阅读 · 2014年12月31日

蛋白质结构类预测中的特征信息提取与分类算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

It's TIME: Towards the Next Generation of Time Series Forecasting Benchmarks

Arxiv

0+阅读 · 2月12日

Predictive Query Language: A Domain-Specific Language for Predictive Modeling on Relational Databases

Arxiv

0+阅读 · 2月10日

The Knowable Future: Mapping the Decay of Past-Future Mutual Information Across Forecast Horizons

Arxiv

0+阅读 · 2月1日

AverageTime: Enhance Long-Term Time Series Forecasting with Simple Averaging

Arxiv

0+阅读 · 1月31日

Protocol Futuring: Speculating Second-Order Dynamics of Protocols in Sociotechnical Infrastructural Futures

Arxiv

0+阅读 · 1月30日

A new strategy for finite-sample valid prediction of future insurance claims in the regression setting

Arxiv

0+阅读 · 1月29日

Uni-PrevPredMap: Extending PrevPredMap to a Unified Framework of Prior-Informed Modeling for Online Vectorized HD Map Construction

Arxiv

0+阅读 · 1月27日

FutureOmni: Evaluating Future Forecasting from Omni-Modal Context for Multimodal LLMs

Arxiv

0+阅读 · 1月20日

The Knowable Future: Mapping the Decay of Past-Future Mutual Information Across Forecast Horizons

Arxiv

0+阅读 · 1月20日

The Knowable Future: Mapping the Decay of Past-Future Mutual Information Across Forecast Horizons

Arxiv

0+阅读 · 1月15日

VIP会员

文章信息

相关主题

最新内容

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

4+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

6+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

6+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

6+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

4+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

7+阅读 · 7月20日

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

专知会员服务

6+阅读 · 7月20日

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

14+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

7+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

9+阅读 · 7月19日

《无人机蜂群通信技术研究》50页

《无人机蜂群通信技术研究》50页

专知会员服务

10+阅读 · 7月19日

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

15+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

8+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

16+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

11+阅读 · 7月18日

相关VIP内容

《深度学习在时间序列预测中的应用：综述》

《深度学习在时间序列预测中的应用：综述》

专知会员服务

30+阅读 · 2025年3月14日

《2025 年热门科技趋势：人工智能驱动一切》最新104页

《2025 年热门科技趋势：人工智能驱动一切》最新104页

专知会员服务

53+阅读 · 2025年1月16日

深度预测学习：模型与应用

深度预测学习：模型与应用

专知会员服务

49+阅读 · 2022年12月5日

第六届未来网络发展大会《确定性网络技术发展与产业应用白皮书》

第六届未来网络发展大会《确定性网络技术发展与产业应用白皮书》

专知会员服务

36+阅读 · 2022年9月21日

重磅！80+位作者发布272页pdf《预测: 理论与实践》论文，百科全书式概述预测领域体系方法与实践

重磅！80+位作者发布272页pdf《预测: 理论与实践》论文，百科全书式概述预测领域体系方法与实践

专知会员服务

207+阅读 · 2022年3月14日

德勤发布《2022年度技术趋势》，135页ppt：帮助企业精准把握趋势，构建技术赋能的未来

德勤发布《2022年度技术趋势》，135页ppt：帮助企业精准把握趋势，构建技术赋能的未来

专知会员服务

49+阅读 · 2022年3月14日

2021年科技趋势报告，504页pdf：区块链、金融科技与加密技术、AI、5G、智造、农业等12个领域（PDF下载）

2021年科技趋势报告，504页pdf：区块链、金融科技与加密技术、AI、5G、智造、农业等12个领域（PDF下载）

专知会员服务

89+阅读 · 2021年6月23日

【WWW2020-腾讯】未来的数据有助于训练:为基于会话的推荐建立未来的上下文模型，Future Data Helps Training: Modelling Future Contexts for Session-based Recommendation

【WWW2020-腾讯】未来的数据有助于训练:为基于会话的推荐建立未来的上下文模型，Future Data Helps Training: Modelling Future Contexts for Session-based Recommendation

专知会员服务

25+阅读 · 2020年3月15日

【KDD2019|讲座推荐】大时间序列预测的理论与实践：Forecasting Big Time Series: Theory and Practice

【KDD2019|讲座推荐】大时间序列预测的理论与实践：Forecasting Big Time Series: Theory and Practice

专知会员服务

118+阅读 · 2019年12月6日

【CVPR 2019 | tutorial】自主汽车的感知、预测和大规模数据采集：Perception, Prediction, and Large Scale Data Collection for Autonomous Cars

【CVPR 2019 | tutorial】自主汽车的感知、预测和大规模数据采集：Perception, Prediction, and Large Scale Data Collection for Autonomous Cars

专知会员服务

33+阅读 · 2019年11月28日

热门VIP内容

开通专知VIP会员享更多权益服务

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

印度精确打击与指挥架构的断层

美空军AI完成F-16战斗机自主空战历史性试飞

相关资讯

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

专知

14+阅读 · 2022年11月12日

智库兰德2022最新发布《2035年新兴技术：基于典型场景的未来军事突发事件技术评估》118页研究报告

智库兰德2022最新发布《2035年新兴技术：基于典型场景的未来军事突发事件技术评估》118页研究报告

专知

53+阅读 · 2022年10月13日

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AAAI21最佳论文Informer：效果远超Transformer的长序列预测神器！

AINLP

10+阅读 · 2021年2月6日

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

【CMU-Amazon】时间序列预测：理论与实践，379页ppt阐述大规模时序预测工具与方法

专知

31+阅读 · 2020年4月24日

计算的未来是 “光”！科学家开发全光学计算平台，实现 “光控制光”

计算的未来是 “光”！科学家开发全光学计算平台，实现 “光控制光”

学术头条

11+阅读 · 2020年3月13日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

机器学习开放课程（终）：基于Facebook Prophet预测未来

机器学习开放课程（终）：基于Facebook Prophet预测未来

论智

11+阅读 · 2018年11月16日

【机器学习】机器学习：未来十年研究热点

【机器学习】机器学习：未来十年研究热点

产业智能官

17+阅读 · 2018年11月4日

15款免费预测分析软件！收藏好，别丢了！

15款免费预测分析软件！收藏好，别丢了！

七月在线实验室

11+阅读 · 2018年2月27日

回归预测&时间序列预测

回归预测&时间序列预测

GBASE数据工程部数据团队

44+阅读 · 2017年5月17日

相关论文

It's TIME: Towards the Next Generation of Time Series Forecasting Benchmarks

Arxiv

0+阅读 · 2月12日

Predictive Query Language: A Domain-Specific Language for Predictive Modeling on Relational Databases

Arxiv

0+阅读 · 2月10日

The Knowable Future: Mapping the Decay of Past-Future Mutual Information Across Forecast Horizons

Arxiv

0+阅读 · 2月1日

AverageTime: Enhance Long-Term Time Series Forecasting with Simple Averaging

Arxiv

0+阅读 · 1月31日

Protocol Futuring: Speculating Second-Order Dynamics of Protocols in Sociotechnical Infrastructural Futures

Arxiv

0+阅读 · 1月30日

A new strategy for finite-sample valid prediction of future insurance claims in the regression setting

Arxiv

0+阅读 · 1月29日

Uni-PrevPredMap: Extending PrevPredMap to a Unified Framework of Prior-Informed Modeling for Online Vectorized HD Map Construction

Arxiv

0+阅读 · 1月27日

FutureOmni: Evaluating Future Forecasting from Omni-Modal Context for Multimodal LLMs

Arxiv

0+阅读 · 1月20日

The Knowable Future: Mapping the Decay of Past-Future Mutual Information Across Forecast Horizons

Arxiv

0+阅读 · 1月20日

The Knowable Future: Mapping the Decay of Past-Future Mutual Information Across Forecast Horizons

Arxiv

0+阅读 · 1月15日

相关基金

面向金融市场走势预测的在线论坛公众情绪挖掘与演化分析算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多生物网络的蛋白质功能预测算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

几何与随机分析及其应用交叉平台

国家自然科学基金

0+阅读 · 2014年12月31日

稳健随机均值模型在时空数据分析中的应用

国家自然科学基金

1+阅读 · 2014年12月31日

多特征融合与集成学习的城市高分辨率遥感影像变化检测

国家自然科学基金

4+阅读 · 2014年12月31日

考虑不确定性和方向性的结构随机极值和疲劳风致响应及抗风可靠性评价理论

国家自然科学基金

0+阅读 · 2014年12月31日

高维度、非线性模型下的金融资产定价和风险定量计算

国家自然科学基金

1+阅读 · 2014年12月31日

蛋白质结构类预测中的特征信息提取与分类算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员