On the Expressive Power and Limitations of Multi-Layer SSMs - 专知论文

会员服务 ·

0

CoT · 状态空间 · 表达力 · 在线 · 空间模型 ·

On the Expressive Power and Limitations of Multi-Layer SSMs

翻译：多层状态空间模型的表达力与局限性研究

Nikola Zubić,Qian Li,Yuyi Wang,Davide Scaramuzza

from arxiv, 25 pages, 6 theorems

We study the expressive power and limitations of multi-layer state-space models (SSMs). First, we show that multi-layer SSMs face fundamental limitations in compositional tasks, revealing an inherent gap between SSMs and streaming models. Then, we examine the role of chain-of-thought (CoT), showing that offline CoT does not fundamentally increase the expressiveness, while online CoT can substantially increase its power. Indeed, with online CoT, multi-layer SSMs become equivalent in power to streaming algorithms. Finally, we investigate the tradeoff between width and precision, showing that these resources are not interchangeable in the base model, but admit a clean equivalence once online CoT is allowed. Overall, our results offer a unified perspective on how depth, finite precision, and CoT shape the power and limits of SSMs.

翻译：我们研究了多层状态空间模型（SSMs）的表达能力及其局限性。首先，我们证明多层SSMs在处理组合任务时面临根本性局限，揭示了SSMs与流式模型之间的固有差距。接着，我们探讨了思维链（CoT）的作用，表明离线CoT无法根本性提升表达力，而在线CoT能显著增强其能力。事实上，引入在线CoT后，多层SSMs在能力上等价于流式算法。最后，我们研究了宽度与精度之间的权衡，发现这些资源在基础模型中不可互换，但一旦允许在线CoT，二者便呈现清晰的等价关系。整体而言，我们的结果为深度、有限精度与CoT如何塑造SSMs的能力与边界提供了统一视角。

0

相关内容

CoT

【博士论文】弥合多模态基础模型与世界模型之间的鸿沟

【博士论文】弥合多模态基础模型与世界模型之间的鸿沟

专知会员服务

33+阅读 · 2025年10月9日

用于多模态对齐的基础模型表征潜力：一项综述

用于多模态对齐的基础模型表征潜力：一项综述

专知会员服务

18+阅读 · 2025年10月8日

【ETZH博士论文】低维与高维空间中潜在表示的分析、建模与变换，169页pdf

【ETZH博士论文】低维与高维空间中潜在表示的分析、建模与变换，169页pdf

专知会员服务

19+阅读 · 2025年7月30日

多模态推理的基础、方法与未来前沿

多模态推理的基础、方法与未来前沿

专知会员服务

27+阅读 · 2025年7月6日

【EPFL博士论文】在多模态基础模型中扩展模态能力，附185页slides

【EPFL博士论文】在多模态基础模型中扩展模态能力，附185页slides

专知会员服务

26+阅读 · 2025年5月14日

非Transformer不可？最新《状态空间模型（SSM）》综述

非Transformer不可？最新《状态空间模型（SSM）》综述

专知会员服务

75+阅读 · 2024年4月16日

《多模态大型语言模型》最新进展，详述26种现有MM-LLMs

《多模态大型语言模型》最新进展，详述26种现有MM-LLMs

专知会员服务

65+阅读 · 2024年1月25日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知会员服务

195+阅读 · 2020年12月3日

多模态摘要简述

专知会员服务

149+阅读 · 2020年9月6日

深度多模态表示学习综述论文，22页pdf

专知会员服务

186+阅读 · 2020年6月21日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

22+阅读 · 2022年7月16日

多模态情绪识别研究综述

多模态情绪识别研究综述

专知

25+阅读 · 2020年12月21日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

深度多模态表示学习综述论文，22页pdf

深度多模态表示学习综述论文，22页pdf

专知

33+阅读 · 2020年6月21日

多模态深度学习综述，18页pdf

多模态深度学习综述，18页pdf

专知

51+阅读 · 2020年3月29日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

专知

53+阅读 · 2019年12月1日

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

AI前线

15+阅读 · 2019年3月21日

多层动态网络的建模、群体动力学分析与控制

国家自然科学基金

3+阅读 · 2015年12月31日

层次粒化的不确定多态网络重叠社区发现方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于反馈型级联连接模型的多模态语义SFM方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

含耦合支链的多层多环空间机构的构型综合理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于Phase-type分布的多状态系统可靠性模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于形态改变的多体空间系统动力学建模、运动规划与最优控制

国家自然科学基金

0+阅读 · 2014年12月31日

一种面向非共格性界面的分级式多尺度力学模型及应用

国家自然科学基金

0+阅读 · 2014年12月31日

拓扑动力系统中的多重传递及其相关问题

国家自然科学基金

0+阅读 · 2014年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

An expressivity analysis of hierarchical modelling in deep transformers via bounded-depth grammars

Arxiv

0+阅读 · 6月16日

Latent Thought Flow: Efficient Latent Reasoning in Large Language Models

Arxiv

0+阅读 · 6月15日

The limits of interpretability in multiple linear regression

Arxiv

0+阅读 · 6月14日

A Large-Scale Multi-Dimensional Empirical Study of LLMs for Conversation Summarization

Arxiv

0+阅读 · 6月14日

DLWM: Diverse Latent World Models for Efficient Multimodal Reasoning

Arxiv

0+阅读 · 6月13日

Multi-view feature High-order Fusion for Space Weak Object Detection and Segmentation

Arxiv

0+阅读 · 6月13日

LaME: Learning to Think in Latent Space for Multimodal Embedding via Information Bottleneck

Arxiv

0+阅读 · 6月11日

On limitations of polyconvexity

Arxiv

0+阅读 · 5月29日

Expressive Power of Deep Homomorphism Networks over Relational Databases

Arxiv

0+阅读 · 5月18日

Scaling Spatial Intelligence with Multimodal Foundation Models

Arxiv

0+阅读 · 3月28日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

2+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

4+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

7+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

4+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

6+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

5+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

3+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

8+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

6+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

9+阅读 · 6月22日

相关VIP内容

【博士论文】弥合多模态基础模型与世界模型之间的鸿沟

【博士论文】弥合多模态基础模型与世界模型之间的鸿沟

专知会员服务

33+阅读 · 2025年10月9日

用于多模态对齐的基础模型表征潜力：一项综述

用于多模态对齐的基础模型表征潜力：一项综述

专知会员服务

18+阅读 · 2025年10月8日

【ETZH博士论文】低维与高维空间中潜在表示的分析、建模与变换，169页pdf

【ETZH博士论文】低维与高维空间中潜在表示的分析、建模与变换，169页pdf

专知会员服务

19+阅读 · 2025年7月30日

多模态推理的基础、方法与未来前沿

多模态推理的基础、方法与未来前沿

专知会员服务

27+阅读 · 2025年7月6日

【EPFL博士论文】在多模态基础模型中扩展模态能力，附185页slides

【EPFL博士论文】在多模态基础模型中扩展模态能力，附185页slides

专知会员服务

26+阅读 · 2025年5月14日

非Transformer不可？最新《状态空间模型（SSM）》综述

非Transformer不可？最新《状态空间模型（SSM）》综述

专知会员服务

75+阅读 · 2024年4月16日

《多模态大型语言模型》最新进展，详述26种现有MM-LLMs

《多模态大型语言模型》最新进展，详述26种现有MM-LLMs

专知会员服务

65+阅读 · 2024年1月25日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知会员服务

195+阅读 · 2020年12月3日

多模态摘要简述

专知会员服务

149+阅读 · 2020年9月6日

深度多模态表示学习综述论文，22页pdf

专知会员服务

186+阅读 · 2020年6月21日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

22+阅读 · 2022年7月16日

多模态情绪识别研究综述

多模态情绪识别研究综述

专知

25+阅读 · 2020年12月21日

多模态视觉语言表征学习研究综述

多模态视觉语言表征学习研究综述

专知

27+阅读 · 2020年12月3日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

深度多模态表示学习综述论文，22页pdf

深度多模态表示学习综述论文，22页pdf

专知

33+阅读 · 2020年6月21日

多模态深度学习综述，18页pdf

多模态深度学习综述，18页pdf

专知

51+阅读 · 2020年3月29日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

【IEEE Fellow何晓东&邓力】多模态智能论文综述：表示学习，信息融合与应用，259篇文献带你了解AI热点技

专知

53+阅读 · 2019年12月1日

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

AI前线

15+阅读 · 2019年3月21日

相关论文

An expressivity analysis of hierarchical modelling in deep transformers via bounded-depth grammars

Arxiv

0+阅读 · 6月16日

Latent Thought Flow: Efficient Latent Reasoning in Large Language Models

Arxiv

0+阅读 · 6月15日

The limits of interpretability in multiple linear regression

Arxiv

0+阅读 · 6月14日

A Large-Scale Multi-Dimensional Empirical Study of LLMs for Conversation Summarization

Arxiv

0+阅读 · 6月14日

DLWM: Diverse Latent World Models for Efficient Multimodal Reasoning

Arxiv

0+阅读 · 6月13日

Multi-view feature High-order Fusion for Space Weak Object Detection and Segmentation

Arxiv

0+阅读 · 6月13日

LaME: Learning to Think in Latent Space for Multimodal Embedding via Information Bottleneck

Arxiv

0+阅读 · 6月11日

On limitations of polyconvexity

Arxiv

0+阅读 · 5月29日

Expressive Power of Deep Homomorphism Networks over Relational Databases

Arxiv

0+阅读 · 5月18日

Scaling Spatial Intelligence with Multimodal Foundation Models

Arxiv

0+阅读 · 3月28日

相关基金

多层动态网络的建模、群体动力学分析与控制

国家自然科学基金

3+阅读 · 2015年12月31日

层次粒化的不确定多态网络重叠社区发现方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于反馈型级联连接模型的多模态语义SFM方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

含耦合支链的多层多环空间机构的构型综合理论研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于Phase-type分布的多状态系统可靠性模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于形态改变的多体空间系统动力学建模、运动规划与最优控制

国家自然科学基金

0+阅读 · 2014年12月31日

一种面向非共格性界面的分级式多尺度力学模型及应用

国家自然科学基金

0+阅读 · 2014年12月31日

拓扑动力系统中的多重传递及其相关问题

国家自然科学基金

0+阅读 · 2014年12月31日

城市群空间交互情景分析与多尺度协同模拟

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员