结非如此简单：一个用于空间推理的极简环境 (Knot So Simple: A Minimalistic Environment for Spatial Reasoning) - 专知论文

会员服务 ·

0

空间推理 · 操作 · 交互 · 包含 · 泛化 ·

Knot So Simple: A Minimalistic Environment for Spatial Reasoning

翻译：结非如此简单：一个用于空间推理的极简环境

Zizhao Chen,Yoav Artzi

from arxiv, Fix camera ready footer

We propose KnotGym, an interactive environment for complex, spatial reasoning and manipulation. KnotGym includes goal-oriented rope manipulation tasks with varying levels of complexity, all requiring acting from pure image observations. Tasks are defined along a clear and quantifiable axis of complexity based on the number of knot crossings, creating a natural generalization test. KnotGym has a simple observation space, allowing for scalable development, yet it highlights core challenges in integrating acute perception, spatial reasoning, and grounded manipulation. We evaluate methods of different classes, including model-based RL, model-predictive control, and chain-of-thought reasoning, and illustrate the challenges KnotGym presents. KnotGym is available at https://github.com/lil-lab/knotgym.

翻译：我们提出了KnotGym，这是一个用于复杂空间推理与操作的交互式环境。KnotGym包含一系列目标导向的绳索操作任务，这些任务具有不同的复杂度，均要求仅基于纯图像观测进行动作执行。任务根据绳结交叉点的数量，沿着一条清晰且可量化的复杂度轴线进行定义，从而构成了一个自然的泛化测试。KnotGym具有简单的观测空间，有利于可扩展的开发，同时它突显了整合敏锐感知、空间推理与具身操作的核心挑战。我们评估了不同类别的方法，包括基于模型的强化学习、模型预测控制以及思维链推理，并阐明了KnotGym所带来的挑战。KnotGym可在 https://github.com/lil-lab/knotgym 获取。

0

相关内容

空间推理

多模态大型语言模型中的空间推理：任务、基准和方法综述

多模态大型语言模型中的空间推理：任务、基准和方法综述

专知会员服务

22+阅读 · 2025年11月21日

在回答之前先解释：组合视觉推理综述

在回答之前先解释：组合视觉推理综述

专知会员服务

15+阅读 · 2025年8月27日

超越语言的推理：潜在思维链推理的综合综述

超越语言的推理：潜在思维链推理的综合综述

专知会员服务

22+阅读 · 2025年5月23日

神经图推理：复杂逻辑查询回答的综述

神经图推理：复杂逻辑查询回答的综述

专知会员服务

28+阅读 · 2024年12月10日

【ACL2023教程】自然语言的复杂推理，240多页ppt

【ACL2023教程】自然语言的复杂推理，240多页ppt

专知会员服务

56+阅读 · 2023年7月13日

神经图推理:满足图数据库的复杂逻辑查询回答

神经图推理:满足图数据库的复杂逻辑查询回答

专知会员服务

16+阅读 · 2023年4月3日

斯坦福大学Jure团队提出《大规模可扩展知识图谱多跳推理框架SMORE》，实现单机运行8千万实体3亿级知识图谱推理

斯坦福大学Jure团队提出《大规模可扩展知识图谱多跳推理框架SMORE》，实现单机运行8千万实体3亿级知识图谱推理

专知会员服务

58+阅读 · 2021年11月3日

因果推断，Causal Inference：The Mixtape

因果推断，Causal Inference：The Mixtape

专知会员服务

110+阅读 · 2021年8月27日

【NeurIPS2020】可处理的反事实推理的深度结构因果模型

【NeurIPS2020】可处理的反事实推理的深度结构因果模型

专知会员服务

49+阅读 · 2020年9月28日

【机器推理可解释性】Machine Reasoning Explainability

【机器推理可解释性】Machine Reasoning Explainability

专知会员服务

35+阅读 · 2020年9月3日

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

55+阅读 · 2023年4月13日

《关于兵棋推演场景设计的一些思考》【译文】20页报告

《关于兵棋推演场景设计的一些思考》【译文】20页报告

专知

25+阅读 · 2022年10月15日

【完整译文】《在复杂陆基场景中对中间部队能力进行兵棋推演》加拿大国防研究与发展部技术报告

【完整译文】《在复杂陆基场景中对中间部队能力进行兵棋推演》加拿大国防研究与发展部技术报告

专知

32+阅读 · 2022年9月5日

「因果推理」概述论文，13页pdf

「因果推理」概述论文，13页pdf

专知

16+阅读 · 2021年3月20日

系列教程GNN-algorithms之三：《将图卷积简化进行到底—SGC》

系列教程GNN-algorithms之三：《将图卷积简化进行到底—SGC》

专知

10+阅读 · 2020年8月5日

TheFatRat 一款简易后门工具

TheFatRat 一款简易后门工具

黑白之道

35+阅读 · 2019年10月23日

图卷积网络到底怎么做，这是一份极简的Numpy实现

图卷积网络到底怎么做，这是一份极简的Numpy实现

机器之心

17+阅读 · 2019年2月20日

为机器学习插上因果推理的翅膀：这是一本系统的因果推理开源书

为机器学习插上因果推理的翅膀：这是一本系统的因果推理开源书

机器之心

34+阅读 · 2019年1月4日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

推荐｜caffe-orc主流ocr算法：CNN+BLSTM+CTC架构实现！

推荐｜caffe-orc主流ocr算法：CNN+BLSTM+CTC架构实现！

全球人工智能

19+阅读 · 2017年10月29日

基于参数和结构优化的置信规则库推理方法研究

国家自然科学基金

5+阅读 · 2015年12月31日

非均匀介质中非线性拋物型方程的奇性分析

国家自然科学基金

0+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于特征学习的空间非合作目标单目视觉位姿测量研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于算子空间的微分流形及非线性偏微分方程的研究

国家自然科学基金

0+阅读 · 2015年12月31日

考虑非结构因素的高层结构-地基土相互作用非线性地震反应分析

国家自然科学基金

0+阅读 · 2014年12月31日

非线性动力系统的最简正规形及其相关问题的研究

国家自然科学基金

0+阅读 · 2014年12月31日

在多尺度系统中具有稳定性交替的空间对照结构研究

国家自然科学基金

0+阅读 · 2014年12月31日

含有隐变量的因果结构学习与统计因果推断

国家自然科学基金

21+阅读 · 2013年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

MedVLThinker: Simple Baselines for Multimodal Medical Reasoning

Arxiv

0+阅读 · 2月18日

From Pixels to Policies: Reinforcing Spatial Reasoning in Language Models for Content-Aware Layout Design

Arxiv

0+阅读 · 2月17日

Reliable Thinking with Images

Arxiv

0+阅读 · 2月16日

Canvas-of-Thought: Grounding Reasoning via Mutable Structured States

Arxiv

0+阅读 · 2月11日

Thinking in Structures: Evaluating Spatial Intelligence through Reasoning on Constrained Manifolds

Arxiv

0+阅读 · 2月8日

LogicSkills: A Structured Benchmark for Formal Reasoning in Large Language Models

Arxiv

0+阅读 · 2月6日

Reuse, Don't Recompute: Efficient Large Reasoning Model Inference via Memory Orchestration

Arxiv

0+阅读 · 2月2日

FloorplanQA: A Benchmark for Spatial Reasoning in LLMs using Structured Representations

Arxiv

0+阅读 · 1月30日

NoReGeo: Non-Reasoning Geometry Benchmark

Arxiv

0+阅读 · 1月15日

ThinkBrake: A Simple Test-Time Decoding Control for Efficient Reasoning

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

相关VIP内容

多模态大型语言模型中的空间推理：任务、基准和方法综述

多模态大型语言模型中的空间推理：任务、基准和方法综述

专知会员服务

22+阅读 · 2025年11月21日

在回答之前先解释：组合视觉推理综述

在回答之前先解释：组合视觉推理综述

专知会员服务

15+阅读 · 2025年8月27日

超越语言的推理：潜在思维链推理的综合综述

超越语言的推理：潜在思维链推理的综合综述

专知会员服务

22+阅读 · 2025年5月23日

神经图推理：复杂逻辑查询回答的综述

神经图推理：复杂逻辑查询回答的综述

专知会员服务

28+阅读 · 2024年12月10日

【ACL2023教程】自然语言的复杂推理，240多页ppt

【ACL2023教程】自然语言的复杂推理，240多页ppt

专知会员服务

56+阅读 · 2023年7月13日

神经图推理:满足图数据库的复杂逻辑查询回答

神经图推理:满足图数据库的复杂逻辑查询回答

专知会员服务

16+阅读 · 2023年4月3日

斯坦福大学Jure团队提出《大规模可扩展知识图谱多跳推理框架SMORE》，实现单机运行8千万实体3亿级知识图谱推理

斯坦福大学Jure团队提出《大规模可扩展知识图谱多跳推理框架SMORE》，实现单机运行8千万实体3亿级知识图谱推理

专知会员服务

58+阅读 · 2021年11月3日

因果推断，Causal Inference：The Mixtape

因果推断，Causal Inference：The Mixtape

专知会员服务

110+阅读 · 2021年8月27日

【NeurIPS2020】可处理的反事实推理的深度结构因果模型

【NeurIPS2020】可处理的反事实推理的深度结构因果模型

专知会员服务

49+阅读 · 2020年9月28日

【机器推理可解释性】Machine Reasoning Explainability

【机器推理可解释性】Machine Reasoning Explainability

专知会员服务

35+阅读 · 2020年9月3日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

图上如何建模因果性？PSU等最新《图反事实学习》综述，50页pdf全面综述图公平性、可解释性等方法

专知

55+阅读 · 2023年4月13日

《关于兵棋推演场景设计的一些思考》【译文】20页报告

《关于兵棋推演场景设计的一些思考》【译文】20页报告

专知

25+阅读 · 2022年10月15日

【完整译文】《在复杂陆基场景中对中间部队能力进行兵棋推演》加拿大国防研究与发展部技术报告

【完整译文】《在复杂陆基场景中对中间部队能力进行兵棋推演》加拿大国防研究与发展部技术报告

专知

32+阅读 · 2022年9月5日

「因果推理」概述论文，13页pdf

「因果推理」概述论文，13页pdf

专知

16+阅读 · 2021年3月20日

系列教程GNN-algorithms之三：《将图卷积简化进行到底—SGC》

系列教程GNN-algorithms之三：《将图卷积简化进行到底—SGC》

专知

10+阅读 · 2020年8月5日

TheFatRat 一款简易后门工具

TheFatRat 一款简易后门工具

黑白之道

35+阅读 · 2019年10月23日

图卷积网络到底怎么做，这是一份极简的Numpy实现

图卷积网络到底怎么做，这是一份极简的Numpy实现

机器之心

17+阅读 · 2019年2月20日

为机器学习插上因果推理的翅膀：这是一本系统的因果推理开源书

为机器学习插上因果推理的翅膀：这是一本系统的因果推理开源书

机器之心

34+阅读 · 2019年1月4日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

推荐｜caffe-orc主流ocr算法：CNN+BLSTM+CTC架构实现！

推荐｜caffe-orc主流ocr算法：CNN+BLSTM+CTC架构实现！

全球人工智能

19+阅读 · 2017年10月29日

相关论文

MedVLThinker: Simple Baselines for Multimodal Medical Reasoning

Arxiv

0+阅读 · 2月18日

From Pixels to Policies: Reinforcing Spatial Reasoning in Language Models for Content-Aware Layout Design

Arxiv

0+阅读 · 2月17日

Reliable Thinking with Images

Arxiv

0+阅读 · 2月16日

Canvas-of-Thought: Grounding Reasoning via Mutable Structured States

Arxiv

0+阅读 · 2月11日

Thinking in Structures: Evaluating Spatial Intelligence through Reasoning on Constrained Manifolds

Arxiv

0+阅读 · 2月8日

LogicSkills: A Structured Benchmark for Formal Reasoning in Large Language Models

Arxiv

0+阅读 · 2月6日

Reuse, Don't Recompute: Efficient Large Reasoning Model Inference via Memory Orchestration

Arxiv

0+阅读 · 2月2日

FloorplanQA: A Benchmark for Spatial Reasoning in LLMs using Structured Representations

Arxiv

0+阅读 · 1月30日

NoReGeo: Non-Reasoning Geometry Benchmark

Arxiv

0+阅读 · 1月15日

ThinkBrake: A Simple Test-Time Decoding Control for Efficient Reasoning

Arxiv

0+阅读 · 1月14日

相关基金

基于参数和结构优化的置信规则库推理方法研究

国家自然科学基金

5+阅读 · 2015年12月31日

非均匀介质中非线性拋物型方程的奇性分析

国家自然科学基金

0+阅读 · 2015年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

基于特征学习的空间非合作目标单目视觉位姿测量研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于算子空间的微分流形及非线性偏微分方程的研究

国家自然科学基金

0+阅读 · 2015年12月31日

考虑非结构因素的高层结构-地基土相互作用非线性地震反应分析

国家自然科学基金

0+阅读 · 2014年12月31日

非线性动力系统的最简正规形及其相关问题的研究

国家自然科学基金

0+阅读 · 2014年12月31日

在多尺度系统中具有稳定性交替的空间对照结构研究

国家自然科学基金

0+阅读 · 2014年12月31日

含有隐变量的因果结构学习与统计因果推断

国家自然科学基金

21+阅读 · 2013年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员