Akasha 2: Hamiltonian State Space Duality and Visual-Language Joint Embedding Predictive Architectur - 专知论文

会员服务 ·

0

状态空间 · 对偶性 · 联合嵌入 · 嵌入 · 潜在 ·

Akasha 2: Hamiltonian State Space Duality and Visual-Language Joint Embedding Predictive Architectur

翻译：Akasha 2：哈密顿状态空间对偶性与视觉-语言联合嵌入预测架构

from arxiv, No supporting claims were validated in this automated agentic R&D research run

We present Akasha 2, a state-of-the-art multimodal architecture that integrates Hamiltonian State Space Duality (H-SSD) with Visual-Language Joint Embedding Predictive Architecture (VL-JEPA). The system leverages the Mamba-3 Selective State Space Model (SSM) augmented by a Sparse Mixture of Hamiltonian Experts (SMoE-HE) that enforces latent physical conservation laws through symplectic integration. For visual synthesis, we introduce Hamiltonian Flow Matching (HFM) and persistent 3D Gaussian Splatting (3DGS), enabling ultra-low latency (<50ms) on mobile hardware. This work establishes a new paradigm in latent world models, achieving unprecedented spatiotemporal coherence through a holographic memory architecture. Our approach demonstrates that incorporating physics-inspired inductive biases into neural architectures yields significant improvements: state-of-the-art video prediction (FVD: 287), 4x faster visual synthesis than diffusion models, and 3-18x inference speedup over transformer baselines while maintaining energy conservation over extended horizons.

翻译：我们提出Akasha 2，一种集成哈密顿状态空间对偶性（H-SSD）与视觉-语言联合嵌入预测架构（VL-JEPA）的最先进多模态架构。该系统利用由稀疏混合哈密顿专家（SMoE-HE）增强的Mamba-3选择性状态空间模型（SSM），通过辛积分强制施加潜在物理守恒定律。针对视觉合成，我们引入哈密顿流匹配（HFM）和持久化3D高斯泼溅（3DGS），在移动硬件上实现超低延迟（<50ms）。本工作建立了潜在世界模型的新范式，通过全息记忆架构实现了前所未有的时空一致性。我们的方法证明了将物理启发式归纳偏置融入神经架构可带来显著提升：最先进的视频预测（FVD: 287）、比扩散模型快4倍的视觉合成速度、以及相比Transformer基线3-18倍的推理加速，同时能在长时域上维持能量守恒。

0

相关内容

状态空间

综述 | 状态空间模型遇见遥感：SSM/Mamba如何重塑遥感视觉？

综述 | 状态空间模型遇见遥感：SSM/Mamba如何重塑遥感视觉？

专知会员服务

13+阅读 · 6月28日

ACL 2025 | 华南理工&北航等提出SEA：通过合成嵌入突破多模态安全对齐的资源瓶颈

ACL 2025 | 华南理工&北航等提出SEA：通过合成嵌入突破多模态安全对齐的资源瓶颈

专知会员服务

10+阅读 · 2025年5月24日

《面向遥感的多模态小语言模型——引入思维链推理与GRPO技术》

《面向遥感的多模态小语言模型——引入思维链推理与GRPO技术》

专知会员服务

27+阅读 · 2025年5月16日

《基于证据推理的空间态势感知预测传感器任务分配和决策支持》200页

《基于证据推理的空间态势感知预测传感器任务分配和决策支持》200页

专知会员服务

60+阅读 · 2024年9月16日

大模型+自动驾驶=？普渡大学等最新《自动驾驶领域多模态大型语言模型》综述

大模型+自动驾驶=？普渡大学等最新《自动驾驶领域多模态大型语言模型》综述

专知会员服务

76+阅读 · 2023年11月27日

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

专知会员服务

105+阅读 · 2023年6月27日

推荐！《联合全域指挥与控制（JADC2）先进技术的虚拟系统簇分析》2023最新论文，BAE系统公司

推荐！《联合全域指挥与控制（JADC2）先进技术的虚拟系统簇分析》2023最新论文，BAE系统公司

专知会员服务

129+阅读 · 2023年6月18日

《模拟空战团队态势感知精度测量技术——感知与绩效的曲线关系》芬兰国防大学

《模拟空战团队态势感知精度测量技术——感知与绩效的曲线关系》芬兰国防大学

专知会员服务

37+阅读 · 2022年6月20日

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf，Summary of the Joint All-Domain Command and Control Strategy

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf，Summary of the Joint All-Domain Command and Control Strategy

专知会员服务

272+阅读 · 2022年3月22日

【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联

【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联

专知会员服务

57+阅读 · 2020年5月14日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

专知

64+阅读 · 2022年7月15日

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf

专知

186+阅读 · 2022年3月23日

AI如何促进态势感知？2022美国空军AFRL等「态势感知」万字综述论文，24也pdf阐述智能战场态势感知技术、挑战和前景

AI如何促进态势感知？2022美国空军AFRL等「态势感知」万字综述论文，24也pdf阐述智能战场态势感知技术、挑战和前景

专知

132+阅读 · 2022年3月19日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

概率图模型体系：HMM、MEMM、CRF

概率图模型体系：HMM、MEMM、CRF

机器学习研究会

30+阅读 · 2018年2月10日

【AAAI 2018】多种注意力机制互补完成VQA（视觉问答），清华大学、香港中文大学等团队最新工作

【AAAI 2018】多种注意力机制互补完成VQA（视觉问答），清华大学、香港中文大学等团队最新工作

专知

22+阅读 · 2017年12月17日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

【360人工智能研究院与NUS颜水成团队】HashGAN:基于注意力机制的深度对抗哈希模型提升跨模态检索效果

【360人工智能研究院与NUS颜水成团队】HashGAN:基于注意力机制的深度对抗哈希模型提升跨模态检索效果

专知

16+阅读 · 2017年11月29日

Musielak-Orlicz-Sobolev 空间中的迹嵌入及其应用

国家自然科学基金

2+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于稀疏互质阵列的DOA估计算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

Semi-Markovian跳跃系统的分析、控制综合与状态估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

Hamilton系统同宿轨与双曲轨的研究

国家自然科学基金

0+阅读 · 2015年12月31日

带变号位势的Hamilton系统的同宿轨

国家自然科学基金

0+阅读 · 2014年12月31日

哈密尔顿系统及多体问题的周期解

国家自然科学基金

0+阅读 · 2014年12月31日

Hamilton系统基态解的存在性及稳定性

国家自然科学基金

0+阅读 · 2014年12月31日

局部条件下的二阶哈密顿系统同宿轨的存在性与多重性

国家自然科学基金

0+阅读 · 2014年12月31日

面向武器系统协同的态势感知一致性计算方法研究

国家自然科学基金

55+阅读 · 2011年12月31日

Ternary Mamba: Grouped Quantization-Aware Training of W1.58A16 State Space Models

Arxiv

0+阅读 · 6月16日

MambaH-Fit: Rethinking Hyper-surface Fitting-based Point Cloud Normal Estimation via State Space Modelling

Arxiv

0+阅读 · 6月14日

A Fixed-Point Neural Operator for Size- and Functional-Transferable Hamiltonian Prediction

Arxiv

0+阅读 · 6月12日

Jaguar: Fast Private CNN Inference with Power-of-Two Homomorphic Arithmetic

Arxiv

0+阅读 · 6月10日

SAM: A Mamba-2 State-Space Audio-Language Model

Arxiv

0+阅读 · 6月10日

HierSVA: A Data Synthesis Pipeline, Dataset, and Benchmark for LLM-Driven Hierarchical Hardware Formal Verification

Arxiv

0+阅读 · 6月9日

SpikeHash: Learning Binary Codes with Spiking Neural Networks for Cross-Modal Hashing Retrieval

Arxiv

0+阅读 · 5月30日

HE^2: A Communication-Light Heterogeneous Architecture for Efficient Fully Homomorphic Encryption

Arxiv

0+阅读 · 5月29日

Beyond Isotropy in JEPAs: Hamiltonian Geometry and Symplectic Prediction

Arxiv

0+阅读 · 5月19日

Super-resolution Multi-signal Direction-of-Arrival Estimation by Hankel-structured Sensing and Decomposition

Arxiv

0+阅读 · 5月18日

VIP会员

文章信息

相关主题

最新内容

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 今天4:35

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

3+阅读 · 今天4:24

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 今天4:18

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 今天4:15

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 今天4:08

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

7+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

“史诗怒火”行动：现代多域作战的重要节点

“史诗怒火”行动：现代多域作战的重要节点

专知会员服务

8+阅读 · 7月30日

《下一代无线网络中的多无人机通信资源管理》

《下一代无线网络中的多无人机通信资源管理》

专知会员服务

8+阅读 · 7月30日

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

专知会员服务

9+阅读 · 7月30日

《人机协同在安全关键型操作决策中的应用》120页

《人机协同在安全关键型操作决策中的应用》120页

专知会员服务

8+阅读 · 7月30日

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

专知会员服务

6+阅读 · 7月30日

相关VIP内容

综述 | 状态空间模型遇见遥感：SSM/Mamba如何重塑遥感视觉？

综述 | 状态空间模型遇见遥感：SSM/Mamba如何重塑遥感视觉？

专知会员服务

13+阅读 · 6月28日

ACL 2025 | 华南理工&北航等提出SEA：通过合成嵌入突破多模态安全对齐的资源瓶颈

ACL 2025 | 华南理工&北航等提出SEA：通过合成嵌入突破多模态安全对齐的资源瓶颈

专知会员服务

10+阅读 · 2025年5月24日

《面向遥感的多模态小语言模型——引入思维链推理与GRPO技术》

《面向遥感的多模态小语言模型——引入思维链推理与GRPO技术》

专知会员服务

27+阅读 · 2025年5月16日

《基于证据推理的空间态势感知预测传感器任务分配和决策支持》200页

《基于证据推理的空间态势感知预测传感器任务分配和决策支持》200页

专知会员服务

60+阅读 · 2024年9月16日

大模型+自动驾驶=？普渡大学等最新《自动驾驶领域多模态大型语言模型》综述

大模型+自动驾驶=？普渡大学等最新《自动驾驶领域多模态大型语言模型》综述

专知会员服务

76+阅读 · 2023年11月27日

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

中科大腾讯最新《多模态大型语言模型》综述，详述多模态指令微调、上下文学习、思维链和辅助视觉推理技术

专知会员服务

105+阅读 · 2023年6月27日

推荐！《联合全域指挥与控制（JADC2）先进技术的虚拟系统簇分析》2023最新论文，BAE系统公司

推荐！《联合全域指挥与控制（JADC2）先进技术的虚拟系统簇分析》2023最新论文，BAE系统公司

专知会员服务

129+阅读 · 2023年6月18日

《模拟空战团队态势感知精度测量技术——感知与绩效的曲线关系》芬兰国防大学

《模拟空战团队态势感知精度测量技术——感知与绩效的曲线关系》芬兰国防大学

专知会员服务

37+阅读 · 2022年6月20日

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf，Summary of the Joint All-Domain Command and Control Strategy

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf，Summary of the Joint All-Domain Command and Control Strategy

专知会员服务

272+阅读 · 2022年3月22日

【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联

【ACL2020-密歇根州立大学】语言和视觉推理的跨模态关联

专知会员服务

57+阅读 · 2020年5月14日

热门VIP内容

开通专知VIP会员享更多权益服务

隐身技术前沿综述：物理机理、工程实践与战略展望

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

相关资讯

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

美国陆军研究实验室《支持C2互操作性和传感器融合的全球信息网络架构评估》2022年技术总结报告

专知

64+阅读 · 2022年7月15日

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf

美国「联合全域指挥与控制 (JADC2)」战略发展最新总结报告，12页pdf

专知

186+阅读 · 2022年3月23日

AI如何促进态势感知？2022美国空军AFRL等「态势感知」万字综述论文，24也pdf阐述智能战场态势感知技术、挑战和前景

AI如何促进态势感知？2022美国空军AFRL等「态势感知」万字综述论文，24也pdf阐述智能战场态势感知技术、挑战和前景

专知

132+阅读 · 2022年3月19日

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

【复旦大学】最新《预训练语言模型》2020综述论文大全，50+PTMs分类体系，25页pdf205篇参考文献

专知

22+阅读 · 2020年3月19日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

概率图模型体系：HMM、MEMM、CRF

概率图模型体系：HMM、MEMM、CRF

机器学习研究会

30+阅读 · 2018年2月10日

【AAAI 2018】多种注意力机制互补完成VQA（视觉问答），清华大学、香港中文大学等团队最新工作

【AAAI 2018】多种注意力机制互补完成VQA（视觉问答），清华大学、香港中文大学等团队最新工作

专知

22+阅读 · 2017年12月17日

最新｜深度离散哈希算法，可用于图像检索！

最新｜深度离散哈希算法，可用于图像检索！

全球人工智能

14+阅读 · 2017年12月15日

【360人工智能研究院与NUS颜水成团队】HashGAN:基于注意力机制的深度对抗哈希模型提升跨模态检索效果

【360人工智能研究院与NUS颜水成团队】HashGAN:基于注意力机制的深度对抗哈希模型提升跨模态检索效果

专知

16+阅读 · 2017年11月29日

相关论文

Ternary Mamba: Grouped Quantization-Aware Training of W1.58A16 State Space Models

Arxiv

0+阅读 · 6月16日

MambaH-Fit: Rethinking Hyper-surface Fitting-based Point Cloud Normal Estimation via State Space Modelling

Arxiv

0+阅读 · 6月14日

A Fixed-Point Neural Operator for Size- and Functional-Transferable Hamiltonian Prediction

Arxiv

0+阅读 · 6月12日

Jaguar: Fast Private CNN Inference with Power-of-Two Homomorphic Arithmetic

Arxiv

0+阅读 · 6月10日

SAM: A Mamba-2 State-Space Audio-Language Model

Arxiv

0+阅读 · 6月10日

HierSVA: A Data Synthesis Pipeline, Dataset, and Benchmark for LLM-Driven Hierarchical Hardware Formal Verification

Arxiv

0+阅读 · 6月9日

SpikeHash: Learning Binary Codes with Spiking Neural Networks for Cross-Modal Hashing Retrieval

Arxiv

0+阅读 · 5月30日

HE^2: A Communication-Light Heterogeneous Architecture for Efficient Fully Homomorphic Encryption

Arxiv

0+阅读 · 5月29日

Beyond Isotropy in JEPAs: Hamiltonian Geometry and Symplectic Prediction

Arxiv

0+阅读 · 5月19日

Super-resolution Multi-signal Direction-of-Arrival Estimation by Hankel-structured Sensing and Decomposition

Arxiv

0+阅读 · 5月18日

相关基金

Musielak-Orlicz-Sobolev 空间中的迹嵌入及其应用

国家自然科学基金

2+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于稀疏互质阵列的DOA估计算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

Semi-Markovian跳跃系统的分析、控制综合与状态估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

Hamilton系统同宿轨与双曲轨的研究

国家自然科学基金

0+阅读 · 2015年12月31日

带变号位势的Hamilton系统的同宿轨

国家自然科学基金

0+阅读 · 2014年12月31日

哈密尔顿系统及多体问题的周期解

国家自然科学基金

0+阅读 · 2014年12月31日

Hamilton系统基态解的存在性及稳定性

国家自然科学基金

0+阅读 · 2014年12月31日

局部条件下的二阶哈密顿系统同宿轨的存在性与多重性

国家自然科学基金

0+阅读 · 2014年12月31日

面向武器系统协同的态势感知一致性计算方法研究

国家自然科学基金

55+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员