OpenSpatial: A Principled Data Engine for Empowering Spatial Intelligence - 专知论文

会员服务 ·

0

引擎 · 规范化 · 数据集 · 空间智能 · 系统 ·

OpenSpatial: A Principled Data Engine for Empowering Spatial Intelligence

翻译：OpenSpatial：赋能空间智能的规范化数据引擎

Jianhui Liu,Haoze Sun,Wenbo Li,Yanbing Zhang,Rui Yang,Zhiliang Zhu,Yijun Yang,Shenghe Zheng,Nan Jiang,Jiaxiu Jiang,Haoyang Huang,Tien-Tsin Wong,Nan Duan,Xiaojuan Qi

Spatial understanding is a fundamental cornerstone of human-level intelligence. Nonetheless, current research predominantly focuses on domain-specific data production, leaving a critical void: the absence of a principled, open-source engine capable of fully unleashing the potential of high-quality spatial data. To bridge this gap, we elucidate the design principles of a robust data generation system and introduce OpenSpatial -- an open-source data engine engineered for high quality, extensive scalability, broad task diversity, and optimized efficiency. OpenSpatial adopts 3D bounding boxes as the fundamental primitive to construct a comprehensive data hierarchy across five foundational tasks: Spatial Measurement (SM), Spatial Relationship (SR), Camera Perception (CP), Multi-view Consistency (MC), and Scene-Aware Reasoning (SAR). Leveraging this scalable infrastructure, we curate OpenSpatial-3M, a large-scale dataset comprising 3 million high-fidelity samples. Extensive evaluations demonstrate that versatile models trained on our dataset achieve state-of-the-art performance across a wide spectrum of spatial reasoning benchmarks. Notably, the best-performing model exhibits a substantial average improvement of 19 percent, relatively. Furthermore, we provide a systematic analysis of how data attributes influence spatial perception. By open-sourcing both the engine and the 3M-scale dataset, we provide a robust foundation to accelerate future research in spatial intelligence.

翻译：空间理解是人类级智能的基本基石。然而，当前研究主要集中于特定领域的数据生产，导致一个关键空白：缺少能够充分释放高质量空间数据潜力的规范化开源引擎。为填补这一空白，我们阐明了稳健数据生成系统的设计原则，并推出OpenSpatial——一个面向高质量、大规模可扩展性、广泛任务多样性和优化效率的开源数据引擎。OpenSpatial采用3D边界框作为基本基元，构建了涵盖五项基础任务的全面数据层级：空间测量（SM）、空间关系（SR）、相机感知（CP）、多视角一致性（MC）以及场景感知推理（SAR）。借助这一可扩展的基础架构，我们整理了OpenSpatial-3M——一个包含300万个高保真样本的大规模数据集。广泛评估表明，基于该数据集训练的多功能模型在多种空间推理基准上取得了最先进的性能。值得注意的是，性能最优模型平均相对提升达19%。此外，我们系统分析了数据属性如何影响空间感知。通过开源引擎与300万规模数据集，我们为加速未来空间智能研究提供了坚实基础。

0

相关内容

AI原生数据库发展趋势白皮书

AI原生数据库发展趋势白皮书

专知会员服务

18+阅读 · 5月16日

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

专知会员服务

16+阅读 · 2月20日

【斯坦福博士论文】面向地理空间数据的多模态与多尺度建模：时空生成式人工智能

【斯坦福博士论文】面向地理空间数据的多模态与多尺度建模：时空生成式人工智能

专知会员服务

43+阅读 · 2025年12月16日

空间智能研究报告

空间智能研究报告

专知会员服务

31+阅读 · 2025年5月16日

《可解释人工智能的四个原则》美国国家标准与技术研究院（NIST），最新43页报告

《可解释人工智能的四个原则》美国国家标准与技术研究院（NIST），最新43页报告

专知会员服务

74+阅读 · 2022年8月7日

【开放书】《大数据价值的要素》，411页pdf，Elements of big data value

【开放书】《大数据价值的要素》，411页pdf，Elements of big data value

专知会员服务

27+阅读 · 2022年3月24日

【人工智能+人力资源】人力资源专业人士的工具箱，Human-Centred Artificial Intelligence for Human Resources: A Toolkit for Human Resources Professionals

【人工智能+人力资源】人力资源专业人士的工具箱，Human-Centred Artificial Intelligence for Human Resources: A Toolkit for Human Resources Professionals

专知会员服务

29+阅读 · 2022年2月17日

空间数据智能：概念、技术与挑战

空间数据智能：概念、技术与挑战

专知会员服务

93+阅读 · 2022年2月3日

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具，Interpreting Interpretability: Understanding Data Scientists’Use of Interpretability Tools for Machine Learning

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具，Interpreting Interpretability: Understanding Data Scientists’Use of Interpretability Tools for Machine Learning

专知会员服务

55+阅读 · 2020年3月8日

【VLDB2019 tutorial】空间数据中的机器学习 Machine Learning Meets Big Spatial Data，明尼苏达大学|Ibrahim Sabek，卡塔尔计算研究所首席科学家|Mohamed F.Mokbel

【VLDB2019 tutorial】空间数据中的机器学习 Machine Learning Meets Big Spatial Data，明尼苏达大学|Ibrahim Sabek，卡塔尔计算研究所首席科学家|Mohamed F.Mokbel

专知会员服务

30+阅读 · 2019年8月29日

OpenAI超级对话模型ChatGPT发布！智能回答堪比雅思口语满分案例

OpenAI超级对话模型ChatGPT发布！智能回答堪比雅思口语满分案例

新智元

29+阅读 · 2022年12月1日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

产业智能官

35+阅读 · 2019年4月30日

论文公布啦！腾讯AI Lab开源最大规模多标签图像数据集，刷新行业数据集基准

论文公布啦！腾讯AI Lab开源最大规模多标签图像数据集，刷新行业数据集基准

专知

10+阅读 · 2019年1月8日

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

产业智能官

12+阅读 · 2018年10月22日

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

AI研习社

13+阅读 · 2018年6月8日

【知识图谱】【智能医疗】病历智能处理引擎的设计、实现和应用

【知识图谱】【智能医疗】病历智能处理引擎的设计、实现和应用

产业智能官

11+阅读 · 2018年1月6日

Deepmind 新成果，让机器挑战更复杂阅读理解问题

Deepmind 新成果，让机器挑战更复杂阅读理解问题

AI掘金志

11+阅读 · 2018年1月3日

资源 | 清华大学开源OpenKE：知识表示学习平台

资源 | 清华大学开源OpenKE：知识表示学习平台

机器之心

10+阅读 · 2017年11月4日

基于空分复用的全光互联数据中心网络关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于粒计算的大数据特征融合理论与方法

国家自然科学基金

8+阅读 · 2015年12月31日

适应于大数据特性的智能存储技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

状态空间搜索的anytime模式及其高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多域认知的空天信息网络智能拓扑构建机制基础研究

国家自然科学基金

0+阅读 · 2015年12月31日

集群环境下内存空间数据库管理与查询技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

行为轨迹数据高性能时空聚类及社会分析

国家自然科学基金

2+阅读 · 2014年12月31日

大数据背景下开放政府数据的因素与机理研究：系统动力学建模与政策仿真

国家自然科学基金

6+阅读 · 2014年12月31日

面向大数据的粒计算理论与方法

国家自然科学基金

4+阅读 · 2014年12月31日

Making the complete OpenAIRE citation graph easily accessible through compact data representation

Arxiv

0+阅读 · 4月27日

DataClaw: An Autonomous Data Agent with Instant Messaging Integration

Arxiv

0+阅读 · 4月27日

Exploring Spatial Intelligence from a Generative Perspective

Arxiv

0+阅读 · 4月22日

IGen: Scalable Data Generation for Robot Learning from Open-World Images

Arxiv

0+阅读 · 4月15日

Tensor Memory Engine: On-the-fly Data Reorganization for Ideal Locality

Arxiv

0+阅读 · 4月14日

OpenDT: Exploring Datacenter Performance and Sustainability with a Self-Calibrating Digital Twin

Arxiv

0+阅读 · 4月13日

MolmoWeb: Open Visual Web Agent and Open Data for the Open Web

Arxiv

0+阅读 · 4月9日

Synergy: A Next-Generation General-Purpose Agent for Open Agentic Web

Arxiv

0+阅读 · 3月30日

TopoPilot: Reliable Conversational Workflow Automation for Topological Data Analysis and Visualization

Arxiv

0+阅读 · 3月26日

TrustGeoGen: Formal-Verified Data Engine for Trustworthy Multi-modal Geometric Problem Solving

Arxiv

0+阅读 · 3月26日

VIP会员

文章信息

相关主题

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

5+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

2+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

2+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

13+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

12+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

12+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

8+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

13+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

9+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

22+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

11+阅读 · 6月17日

相关VIP内容

AI原生数据库发展趋势白皮书

AI原生数据库发展趋势白皮书

专知会员服务

18+阅读 · 5月16日

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

OpenEarthAgent：一种面向工具增强型地理空间智能体的统一框架

专知会员服务

16+阅读 · 2月20日

【斯坦福博士论文】面向地理空间数据的多模态与多尺度建模：时空生成式人工智能

【斯坦福博士论文】面向地理空间数据的多模态与多尺度建模：时空生成式人工智能

专知会员服务

43+阅读 · 2025年12月16日

空间智能研究报告

空间智能研究报告

专知会员服务

31+阅读 · 2025年5月16日

《可解释人工智能的四个原则》美国国家标准与技术研究院（NIST），最新43页报告

《可解释人工智能的四个原则》美国国家标准与技术研究院（NIST），最新43页报告

专知会员服务

74+阅读 · 2022年8月7日

【开放书】《大数据价值的要素》，411页pdf，Elements of big data value

【开放书】《大数据价值的要素》，411页pdf，Elements of big data value

专知会员服务

27+阅读 · 2022年3月24日

【人工智能+人力资源】人力资源专业人士的工具箱，Human-Centred Artificial Intelligence for Human Resources: A Toolkit for Human Resources Professionals

【人工智能+人力资源】人力资源专业人士的工具箱，Human-Centred Artificial Intelligence for Human Resources: A Toolkit for Human Resources Professionals

专知会员服务

29+阅读 · 2022年2月17日

空间数据智能：概念、技术与挑战

空间数据智能：概念、技术与挑战

专知会员服务

93+阅读 · 2022年2月3日

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具，Interpreting Interpretability: Understanding Data Scientists’Use of Interpretability Tools for Machine Learning

【CHI2020-微软】解释可解释性:理解数据科学家使用机器学习的可解释性工具，Interpreting Interpretability: Understanding Data Scientists’Use of Interpretability Tools for Machine Learning

专知会员服务

55+阅读 · 2020年3月8日

【VLDB2019 tutorial】空间数据中的机器学习 Machine Learning Meets Big Spatial Data，明尼苏达大学|Ibrahim Sabek，卡塔尔计算研究所首席科学家|Mohamed F.Mokbel

【VLDB2019 tutorial】空间数据中的机器学习 Machine Learning Meets Big Spatial Data，明尼苏达大学|Ibrahim Sabek，卡塔尔计算研究所首席科学家|Mohamed F.Mokbel

专知会员服务

30+阅读 · 2019年8月29日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

OpenAI超级对话模型ChatGPT发布！智能回答堪比雅思口语满分案例

OpenAI超级对话模型ChatGPT发布！智能回答堪比雅思口语满分案例

新智元

29+阅读 · 2022年12月1日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

浅谈群体智能——新一代AI的重要方向

浅谈群体智能——新一代AI的重要方向

中国科学院自动化研究所

44+阅读 · 2019年10月16日

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

【数字孪生】数字孪生是制造业实现“智能+”的技术接口

产业智能官

35+阅读 · 2019年4月30日

论文公布啦！腾讯AI Lab开源最大规模多标签图像数据集，刷新行业数据集基准

论文公布啦！腾讯AI Lab开源最大规模多标签图像数据集，刷新行业数据集基准

专知

10+阅读 · 2019年1月8日

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

【工业大数据】工业大数据始于业务止于业务、车间物联网数据管理、面向产品全寿期的xBOM、构建制造型企业新型能力

产业智能官

12+阅读 · 2018年10月22日

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

Databricks 开源 MLflow 平台，解决机器学习开发四大难点

AI研习社

13+阅读 · 2018年6月8日

【知识图谱】【智能医疗】病历智能处理引擎的设计、实现和应用

【知识图谱】【智能医疗】病历智能处理引擎的设计、实现和应用

产业智能官

11+阅读 · 2018年1月6日

Deepmind 新成果，让机器挑战更复杂阅读理解问题

Deepmind 新成果，让机器挑战更复杂阅读理解问题

AI掘金志

11+阅读 · 2018年1月3日

资源 | 清华大学开源OpenKE：知识表示学习平台

资源 | 清华大学开源OpenKE：知识表示学习平台

机器之心

10+阅读 · 2017年11月4日

相关论文

Making the complete OpenAIRE citation graph easily accessible through compact data representation

Arxiv

0+阅读 · 4月27日

DataClaw: An Autonomous Data Agent with Instant Messaging Integration

Arxiv

0+阅读 · 4月27日

Exploring Spatial Intelligence from a Generative Perspective

Arxiv

0+阅读 · 4月22日

IGen: Scalable Data Generation for Robot Learning from Open-World Images

Arxiv

0+阅读 · 4月15日

Tensor Memory Engine: On-the-fly Data Reorganization for Ideal Locality

Arxiv

0+阅读 · 4月14日

OpenDT: Exploring Datacenter Performance and Sustainability with a Self-Calibrating Digital Twin

Arxiv

0+阅读 · 4月13日

MolmoWeb: Open Visual Web Agent and Open Data for the Open Web

Arxiv

0+阅读 · 4月9日

Synergy: A Next-Generation General-Purpose Agent for Open Agentic Web

Arxiv

0+阅读 · 3月30日

TopoPilot: Reliable Conversational Workflow Automation for Topological Data Analysis and Visualization

Arxiv

0+阅读 · 3月26日

TrustGeoGen: Formal-Verified Data Engine for Trustworthy Multi-modal Geometric Problem Solving

Arxiv

0+阅读 · 3月26日

相关基金

基于空分复用的全光互联数据中心网络关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于粒计算的大数据特征融合理论与方法

国家自然科学基金

8+阅读 · 2015年12月31日

适应于大数据特性的智能存储技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

状态空间搜索的anytime模式及其高效算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多域认知的空天信息网络智能拓扑构建机制基础研究

国家自然科学基金

0+阅读 · 2015年12月31日

集群环境下内存空间数据库管理与查询技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

行为轨迹数据高性能时空聚类及社会分析

国家自然科学基金

2+阅读 · 2014年12月31日

大数据背景下开放政府数据的因素与机理研究：系统动力学建模与政策仿真

国家自然科学基金

6+阅读 · 2014年12月31日

面向大数据的粒计算理论与方法

国家自然科学基金

4+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员