Formalizing Task-Space Complexity for Zero-Shot Generalization - 专知论文

会员服务 ·

0

泛化理论 · 散度 · 情景 · 贪心 · 控制器 ·

Formalizing Task-Space Complexity for Zero-Shot Generalization

翻译：暂无翻译

Jung-Hoon Cho,Heling Zhang,Siqi Du,Roy Dong,Cathy Wu

Policies must operate across diverse conditions, yet a single policy is often conservative while fully adaptive schemes can be complex. We study zero-shot generalization in contextual dynamical systems and introduce a performance-centric, directional task dissimilarity--the signed divergence--that upper bounds the generalization gap from a source context to a target context. The signed divergence induces $\varepsilon$-tolerance sets that certify when a source policy class generalizes, and it yields a concrete notion of task-space complexity: the minimum number of source contexts needed so that every target context incurs at most $\varepsilon$ generalization gap. Under a mild local smoothness assumption on performance, the induced tolerance sets admit certified inner/outer balls and instance-dependent volume bounds on task-space complexity. In the finite-oracle setting, source selection reduces to set cover; a greedy strategy inherits the standard $H(n)$ approximation guarantee. Using a Mass-Spring-Damper system with linear-quadratic regulator (LQR) controllers and a nonlinear CartPole system with deep reinforcement learning controllers, we show that greedy selection achieves the same $\varepsilon$-coverage with fewer policies than uniform or random baselines. Our approach delivers a performance-based task similarity measure and practical certificates for building generalizable control with simple policies.

翻译：暂无翻译

0

相关内容

泛化理论

《防空协同制导：用于中段目标分配的多目标成本函数》

《防空协同制导：用于中段目标分配的多目标成本函数》

专知会员服务

22+阅读 · 5月6日

《多域空战指挥体系：驾驭复杂性的艺术》

《多域空战指挥体系：驾驭复杂性的艺术》

专知会员服务

31+阅读 · 2025年8月23日

《基于模型和系统理论的空中优势任务高级自主性设计方法：忠诚僚机案例研究》最新130页

《基于模型和系统理论的空中优势任务高级自主性设计方法：忠诚僚机案例研究》最新130页

专知会员服务

53+阅读 · 2025年3月16日

【ICML2024】揭示Graph Transformers 中的过全局化问题

【ICML2024】揭示Graph Transformers 中的过全局化问题

专知会员服务

21+阅读 · 2024年5月27日

有人 / 无人机协同空战任务规划技术

有人 / 无人机协同空战任务规划技术

专知会员服务

85+阅读 · 2024年4月13日

空地异构无人系统侦察任务规划方法

空地异构无人系统侦察任务规划方法

专知会员服务

86+阅读 · 2024年2月26日

作战资源分配 |《在有竞争性环境中快速设计作战空运网络的博弈论模型》2023最新65页论文

作战资源分配 |《在有竞争性环境中快速设计作战空运网络的博弈论模型》2023最新65页论文

专知会员服务

78+阅读 · 2023年5月5日

《培养空军多域作战太空专家队伍》，（空军）DIACC官方期刊精选论文

《培养空军多域作战太空专家队伍》，（空军）DIACC官方期刊精选论文

专知会员服务

34+阅读 · 2023年1月30日

《跨域/跨任务资源分配和重新规划》美海军2022最新79页论文

《跨域/跨任务资源分配和重新规划》美海军2022最新79页论文

专知会员服务

272+阅读 · 2022年12月5日

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

专知会员服务

36+阅读 · 2019年10月17日

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

【CVPR2021】面向通用领域自适应的领域共识聚类

【CVPR2021】面向通用领域自适应的领域共识聚类

专知

24+阅读 · 2021年5月6日

初学者系列：Attentional Factorization Machines（AFM）详解

初学者系列：Attentional Factorization Machines（AFM）详解

专知

82+阅读 · 2019年9月16日

参数少一半，效果还更好，天津大学和微软提出Transformer压缩模型

参数少一半，效果还更好，天津大学和微软提出Transformer压缩模型

机器之心

15+阅读 · 2019年7月13日

利用动态深度学习预测金融时间序列基于Python

利用动态深度学习预测金融时间序列基于Python

量化投资与机器学习

18+阅读 · 2018年10月30日

Single-Shot Object Detection with Enriched Semantics

Single-Shot Object Detection with Enriched Semantics

统计学习与视觉计算组

14+阅读 · 2018年8月29日

跨越注意力：Cross-Attention

跨越注意力：Cross-Attention

我爱读PAMI

172+阅读 · 2018年6月2日

半监督多任务学习：Semisupervised Multitask Learning

半监督多任务学习：Semisupervised Multitask Learning

我爱读PAMI

18+阅读 · 2018年4月29日

【论文推荐】最新六篇知识图谱相关论文—Zero-shot识别、卷积二维知识图谱、变分知识图谱推理、张量分解、推荐

【论文推荐】最新六篇知识图谱相关论文—Zero-shot识别、卷积二维知识图谱、变分知识图谱推理、张量分解、推荐

专知

50+阅读 · 2018年4月25日

Focal Loss for Dense Object Detection

Focal Loss for Dense Object Detection

统计学习与视觉计算组

12+阅读 · 2018年3月15日

武器装备体系架构的跨领域组合决策分析与冲突消解方法

国家自然科学基金

122+阅读 · 2015年12月31日

基于四维航迹运行的航路网络飞行安全间隔保持理论与方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

一类大规模实对称锥规划算法

国家自然科学基金

0+阅读 · 2015年12月31日

广义双随机相位编码系统中以QR码为载体的信息加密及无损恢复

国家自然科学基金

0+阅读 · 2015年12月31日

解决地图要素空间冲突的智能化协同模型和算法

国家自然科学基金

6+阅读 · 2014年12月31日

产业链离散化空间逻辑及其演化机制、衔接模式与大国区间雁阵架构研究

国家自然科学基金

0+阅读 · 2014年12月31日

自动化集装箱码头装卸作业的时空同步策略与优化方法

国家自然科学基金

1+阅读 · 2014年12月31日

高动态环境下低可探测性飞行器自主任务规划方法研究

国家自然科学基金

18+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

面向武器系统协同的态势感知一致性计算方法研究

国家自然科学基金

55+阅读 · 2011年12月31日

Self-Evolution for Multi-Turn Tool-Calling Agents via Divergence-Point Preference Learning

Arxiv

0+阅读 · 6月22日

Distilling Collaborative Dynamics into Latent Space for Implicit Coordination in Decentralized Multi-Agent Manipulation

Arxiv

0+阅读 · 6月22日

Temporal Logic Guidance for Action-Only Diffusion Policies with World Models

Arxiv

0+阅读 · 6月22日

Keyless Attention: Value-Space Routing and Value-Only Caching for Efficient Transformers

Arxiv

0+阅读 · 6月20日

Simultaneously Efficient Allocation of Indivisible Items Across Multiple Dimensions

Arxiv

0+阅读 · 6月19日

Factor-Aware Mixture-of-Experts with Pretrained Encoder for Combinatorial Generalization

Arxiv

0+阅读 · 6月19日

Diffusion-Driven State Space Models

Arxiv

0+阅读 · 6月19日

Inductive Generalization for Robotic Manipulation

Arxiv

0+阅读 · 6月19日

Object-Centric Residual RL for Zero-Shot Sim-to-Real VLA Enhancement

Arxiv

0+阅读 · 6月17日

Structural Distinguishability of Static and Adaptive Policy Regimes in Agent-Based Regulatory Simulation

Arxiv

0+阅读 · 6月15日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

《防空协同制导：用于中段目标分配的多目标成本函数》

《防空协同制导：用于中段目标分配的多目标成本函数》

专知会员服务

22+阅读 · 5月6日

《多域空战指挥体系：驾驭复杂性的艺术》

《多域空战指挥体系：驾驭复杂性的艺术》

专知会员服务

31+阅读 · 2025年8月23日

《基于模型和系统理论的空中优势任务高级自主性设计方法：忠诚僚机案例研究》最新130页

《基于模型和系统理论的空中优势任务高级自主性设计方法：忠诚僚机案例研究》最新130页

专知会员服务

53+阅读 · 2025年3月16日

【ICML2024】揭示Graph Transformers 中的过全局化问题

【ICML2024】揭示Graph Transformers 中的过全局化问题

专知会员服务

21+阅读 · 2024年5月27日

有人 / 无人机协同空战任务规划技术

有人 / 无人机协同空战任务规划技术

专知会员服务

85+阅读 · 2024年4月13日

空地异构无人系统侦察任务规划方法

空地异构无人系统侦察任务规划方法

专知会员服务

86+阅读 · 2024年2月26日

作战资源分配 |《在有竞争性环境中快速设计作战空运网络的博弈论模型》2023最新65页论文

作战资源分配 |《在有竞争性环境中快速设计作战空运网络的博弈论模型》2023最新65页论文

专知会员服务

78+阅读 · 2023年5月5日

《培养空军多域作战太空专家队伍》，（空军）DIACC官方期刊精选论文

《培养空军多域作战太空专家队伍》，（空军）DIACC官方期刊精选论文

专知会员服务

34+阅读 · 2023年1月30日

《跨域/跨任务资源分配和重新规划》美海军2022最新79页论文

《跨域/跨任务资源分配和重新规划》美海军2022最新79页论文

专知会员服务

272+阅读 · 2022年12月5日

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

专知会员服务

36+阅读 · 2019年10月17日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

《通过近似动态规划解决具有动态目标到达的多Agent路由问题》美国空军大学130页学位论文

专知

15+阅读 · 2022年7月22日

【CVPR2021】面向通用领域自适应的领域共识聚类

【CVPR2021】面向通用领域自适应的领域共识聚类

专知

24+阅读 · 2021年5月6日

初学者系列：Attentional Factorization Machines（AFM）详解

初学者系列：Attentional Factorization Machines（AFM）详解

专知

82+阅读 · 2019年9月16日

参数少一半，效果还更好，天津大学和微软提出Transformer压缩模型

参数少一半，效果还更好，天津大学和微软提出Transformer压缩模型

机器之心

15+阅读 · 2019年7月13日

利用动态深度学习预测金融时间序列基于Python

利用动态深度学习预测金融时间序列基于Python

量化投资与机器学习

18+阅读 · 2018年10月30日

Single-Shot Object Detection with Enriched Semantics

Single-Shot Object Detection with Enriched Semantics

统计学习与视觉计算组

14+阅读 · 2018年8月29日

跨越注意力：Cross-Attention

跨越注意力：Cross-Attention

我爱读PAMI

172+阅读 · 2018年6月2日

半监督多任务学习：Semisupervised Multitask Learning

半监督多任务学习：Semisupervised Multitask Learning

我爱读PAMI

18+阅读 · 2018年4月29日

【论文推荐】最新六篇知识图谱相关论文—Zero-shot识别、卷积二维知识图谱、变分知识图谱推理、张量分解、推荐

【论文推荐】最新六篇知识图谱相关论文—Zero-shot识别、卷积二维知识图谱、变分知识图谱推理、张量分解、推荐

专知

50+阅读 · 2018年4月25日

Focal Loss for Dense Object Detection

Focal Loss for Dense Object Detection

统计学习与视觉计算组

12+阅读 · 2018年3月15日

相关论文

Self-Evolution for Multi-Turn Tool-Calling Agents via Divergence-Point Preference Learning

Arxiv

0+阅读 · 6月22日

Distilling Collaborative Dynamics into Latent Space for Implicit Coordination in Decentralized Multi-Agent Manipulation

Arxiv

0+阅读 · 6月22日

Temporal Logic Guidance for Action-Only Diffusion Policies with World Models

Arxiv

0+阅读 · 6月22日

Keyless Attention: Value-Space Routing and Value-Only Caching for Efficient Transformers

Arxiv

0+阅读 · 6月20日

Simultaneously Efficient Allocation of Indivisible Items Across Multiple Dimensions

Arxiv

0+阅读 · 6月19日

Factor-Aware Mixture-of-Experts with Pretrained Encoder for Combinatorial Generalization

Arxiv

0+阅读 · 6月19日

Diffusion-Driven State Space Models

Arxiv

0+阅读 · 6月19日

Inductive Generalization for Robotic Manipulation

Arxiv

0+阅读 · 6月19日

Object-Centric Residual RL for Zero-Shot Sim-to-Real VLA Enhancement

Arxiv

0+阅读 · 6月17日

Structural Distinguishability of Static and Adaptive Policy Regimes in Agent-Based Regulatory Simulation

Arxiv

0+阅读 · 6月15日

相关基金

武器装备体系架构的跨领域组合决策分析与冲突消解方法

国家自然科学基金

122+阅读 · 2015年12月31日

基于四维航迹运行的航路网络飞行安全间隔保持理论与方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

一类大规模实对称锥规划算法

国家自然科学基金

0+阅读 · 2015年12月31日

广义双随机相位编码系统中以QR码为载体的信息加密及无损恢复

国家自然科学基金

0+阅读 · 2015年12月31日

解决地图要素空间冲突的智能化协同模型和算法

国家自然科学基金

6+阅读 · 2014年12月31日

产业链离散化空间逻辑及其演化机制、衔接模式与大国区间雁阵架构研究

国家自然科学基金

0+阅读 · 2014年12月31日

自动化集装箱码头装卸作业的时空同步策略与优化方法

国家自然科学基金

1+阅读 · 2014年12月31日

高动态环境下低可探测性飞行器自主任务规划方法研究

国家自然科学基金

18+阅读 · 2013年12月31日

面向现代防御系统的多无人机协同优化与决策

国家自然科学基金

17+阅读 · 2012年12月31日

面向武器系统协同的态势感知一致性计算方法研究

国家自然科学基金

55+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员