Not Like Transformers: Drop the Beat Representation for Dance Generation with Mamba-Based Diffusion Model - 专知论文

会员服务 ·

0

序列 · Mamba · 音乐 · 生成方法 · 扩散模型 ·

Not Like Transformers: Drop the Beat Representation for Dance Generation with Mamba-Based Diffusion Model

翻译：非Transformer架构：基于Mamba扩散模型的舞蹈生成与节拍表征

Sangjune Park,Inhyeok Choi,Donghyeon Soon,Youngwoo Jeon,Kyungdon Joo

from arxiv, Accepted by WACV 2026

Dance is a form of human motion characterized by emotional expression and communication, playing a role in various fields such as music, virtual reality, and content creation. Existing methods for dance generation often fail to adequately capture the inherently sequential, rhythmical, and music-synchronized characteristics of dance. In this paper, we propose \emph{MambaDance}, a new dance generation approach that leverages a Mamba-based diffusion model. Mamba, well-suited to handling long and autoregressive sequences, is integrated into our two-stage diffusion architecture, substituting off-the-shelf Transformer. Additionally, considering the critical role of musical beats in dance choreography, we propose a Gaussian-based beat representation to explicitly guide the decoding of dance sequences. Experiments on AIST++ and FineDance datasets for each sequence length show that our proposed method effectively generates plausible dance movements while reflecting essential characteristics, consistently from short to long dances, compared to the previous methods. Additional qualitative results and demo videos are available at \small{https://vision3d-lab.github.io/mambadance}.

翻译：舞蹈是一种以情感表达与交流为特征的人体运动形式，在音乐、虚拟现实及内容创作等多个领域发挥着重要作用。现有舞蹈生成方法往往难以充分捕捉舞蹈固有的时序性、节律性及音乐同步性特征。本文提出一种基于Mamba扩散模型的新型舞蹈生成方法——\emph{MambaDance}。Mamba架构因其擅长处理长序列自回归数据的特性，被整合至我们的两阶段扩散模型框架中，替代了现成的Transformer模块。此外，考虑到音乐节拍在舞蹈编排中的关键作用，我们提出一种基于高斯分布的节拍表征方法，以显式指导舞蹈序列的解码过程。在AIST++和FineDance数据集上针对不同序列长度的实验表明：相较于现有方法，我们提出的方法能有效生成符合舞蹈特性的合理动作，且从短序列到长序列均保持生成一致性。更多定性结果与演示视频可见于\small{https://vision3d-lab.github.io/mambadance}。

0

相关内容

数学上，序列是被排成一列的对象（或事件）；这样每个元素不是在其他元素之前，就是在其他元素之后。这里，元素之间的顺序非常重要。

【书籍】从零开始构建文本生成图像生成器：基于 Transformers 与扩散模型

【书籍】从零开始构建文本生成图像生成器：基于 Transformers 与扩散模型

专知会员服务

25+阅读 · 2025年12月27日

144页ppt《扩散模型》，Google DeepMind Sander Dieleman

144页ppt《扩散模型》，Google DeepMind Sander Dieleman

专知会员服务

51+阅读 · 2025年11月21日

扩散模型中的 Transformer：图像生成及其延展应用询问 ChatGPT

扩散模型中的 Transformer：图像生成及其延展应用询问 ChatGPT

专知会员服务

11+阅读 · 2025年7月5日

基于扩散模型和流模型的推理时引导生成技术

基于扩散模型和流模型的推理时引导生成技术

专知会员服务

16+阅读 · 2025年4月30日

【新书】《基于Transformers和扩散模型的生成式人工智能实战》

【新书】《基于Transformers和扩散模型的生成式人工智能实战》

专知会员服务

93+阅读 · 2024年12月16日

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

专知会员服务

29+阅读 · 2024年10月4日

Sora背后的技术，最新《可控生成与文本到图像扩散模型》综述

Sora背后的技术，最新《可控生成与文本到图像扩散模型》综述

专知会员服务

69+阅读 · 2024年3月9日

爆火Sora背后的技术，UC伯克利最新《扩散模型》课程视频，210页ppt

爆火Sora背后的技术，UC伯克利最新《扩散模型》课程视频，210页ppt

专知会员服务

103+阅读 · 2024年2月25日

《生成式模型: 变分自编码器与扩散模型》，75页ppt，Google DeepMind科学家Ruiqi Gao

《生成式模型: 变分自编码器与扩散模型》，75页ppt，Google DeepMind科学家Ruiqi Gao

专知会员服务

66+阅读 · 2023年6月10日

扩散模型综述又一弹！西湖大学李子青等最新《生成式扩散模型》综述，18页pdf详解扩散模型基础、方法体系和应用

扩散模型综述又一弹！西湖大学李子青等最新《生成式扩散模型》综述，18页pdf详解扩散模型基础、方法体系和应用

专知会员服务

121+阅读 · 2022年9月9日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

专知

20+阅读 · 2020年3月26日

绝对干货！NLP预训练模型：从transformer到albert

绝对干货！NLP预训练模型：从transformer到albert

新智元

13+阅读 · 2019年11月10日

让大卫雕塑跳舞、蒙娜丽莎说话，英伟达视频合成有如此多「骚操作」

让大卫雕塑跳舞、蒙娜丽莎说话，英伟达视频合成有如此多「骚操作」

机器之心

10+阅读 · 2019年10月28日

你跳宅舞的样子很专业：不，这都是AI合成的结果

你跳宅舞的样子很专业：不，这都是AI合成的结果

机器之心

11+阅读 · 2019年9月28日

多图带你读懂 Transformers 的工作原理

多图带你读懂 Transformers 的工作原理

AI研习社

10+阅读 · 2019年3月18日

BERT大火却不懂Transformer？读这一篇就够了

BERT大火却不懂Transformer？读这一篇就够了

大数据文摘

12+阅读 · 2019年1月8日

博客 | 总结+paper分享|对话系统中的自然语言生成技术（NLG）

博客 | 总结+paper分享|对话系统中的自然语言生成技术（NLG）

AI研习社

16+阅读 · 2018年12月4日

风格迁移原理及tensorflow实现-附代码

风格迁移原理及tensorflow实现-附代码

机器学习研究会

19+阅读 · 2018年3月25日

曲面上图像处理的非局部变分模型与算法

国家自然科学基金

0+阅读 · 2017年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于离散化Lyapunov-Krasovskii泛函方法的时滞Markov跳变系统分析与综合

国家自然科学基金

0+阅读 · 2015年12月31日

面向异构信息网络中实体归类的模糊聚类

国家自然科学基金

1+阅读 · 2015年12月31日

随机约束下非齐次Markov跳变系统控制器设计

国家自然科学基金

0+阅读 · 2015年12月31日

维吾尔语韵律结构的分析与预测模型的研究

国家自然科学基金

0+阅读 · 2014年12月31日

结构振动的非光滑控制方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

地震动非平稳特性对结构响应影响的定量关系模型及其建模方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

一类非线性发展方程的定性理论

国家自然科学基金

0+阅读 · 2014年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

MaDiS: Taming Masked Diffusion Language Models for Sign Language Generation

Arxiv

0+阅读 · 3月13日

Singing Syllabi with Virtual Avatars: Enhancing Student Engagement Through AI-Generated Music and Digital Embodiment

Arxiv

0+阅读 · 3月10日

MEGADance: Mixture-of-Experts Architecture for Genre-Aware 3D Dance Generation

Arxiv

0+阅读 · 2月23日

Skeleton2Stage: Reward-Guided Fine-Tuning for Physically Plausible Dance Generation

Arxiv

0+阅读 · 2月14日

Controllable Dance Generation with Style-Guided Motion Diffusion

Arxiv

0+阅读 · 2月10日

Generative modelling with jump-diffusions

Arxiv

0+阅读 · 2月6日

Generative Modeling via Drifting

Arxiv

0+阅读 · 2月6日

MambaVF: State Space Model for Efficient Video Fusion

Arxiv

0+阅读 · 2月5日

DiMo: Discrete Diffusion Modeling for Motion Generation and Understanding

Arxiv

0+阅读 · 2月4日

MIRRORTALK: Forging Personalized Avatars Via Disentangled Style and Hierarchical Motion Control

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

最新内容

2025年大语言模型进展报告

2025年大语言模型进展报告

专知会员服务

1+阅读 · 今天13:30

多智能体协作机制

多智能体协作机制

专知会员服务

1+阅读 · 今天13:26

非对称优势：美海军开发低成本反无人机技术

非对称优势：美海军开发低成本反无人机技术

专知会员服务

4+阅读 · 今天4:39

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

专知会员服务

14+阅读 · 今天2:52

《美战争部小企业创新研究（SBIR）计划》

《美战争部小企业创新研究（SBIR）计划》

专知会员服务

6+阅读 · 今天2:48

《军事模拟：将军事条令与目标融入AI智能体》

《军事模拟：将军事条令与目标融入AI智能体》

专知会员服务

9+阅读 · 今天2:43

【NTU博士论文】3D人体动作生成

【NTU博士论文】3D人体动作生成

专知会员服务

7+阅读 · 4月24日

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

DeepSeek-V4：百万 Token 上下文背后，大模型正在进入“长程智能”时代（附中英文pdf版）

专知会员服务

8+阅读 · 4月24日

以色列军事技术对美国军力发展的持续性赋能

以色列军事技术对美国军力发展的持续性赋能

专知会员服务

8+阅读 · 4月24日

战场之外的较量：美伊冲突中的认知战与心理博弈

战场之外的较量：美伊冲突中的认知战与心理博弈

专知会员服务

6+阅读 · 4月24日

俄乌战争中乌克兰防空能力演变与见解（中文版）

俄乌战争中乌克兰防空能力演变与见解（中文版）

专知会员服务

7+阅读 · 4月24日

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

《面向巡飞弹药系统的情境感知深度强化学习自主非线性机动控制》

专知会员服务

10+阅读 · 4月24日

《深度强化学习在兵棋推演中的应用》40页报告

《深度强化学习在兵棋推演中的应用》40页报告

专知会员服务

14+阅读 · 4月24日

《多域作战面临复杂现实》

《多域作战面临复杂现实》

专知会员服务

10+阅读 · 4月24日

《印度的多域作战：条令与能力发展》报告

《印度的多域作战：条令与能力发展》报告

专知会员服务

5+阅读 · 4月24日

相关VIP内容

【书籍】从零开始构建文本生成图像生成器：基于 Transformers 与扩散模型

【书籍】从零开始构建文本生成图像生成器：基于 Transformers 与扩散模型

专知会员服务

25+阅读 · 2025年12月27日

144页ppt《扩散模型》，Google DeepMind Sander Dieleman

144页ppt《扩散模型》，Google DeepMind Sander Dieleman

专知会员服务

51+阅读 · 2025年11月21日

扩散模型中的 Transformer：图像生成及其延展应用询问 ChatGPT

扩散模型中的 Transformer：图像生成及其延展应用询问 ChatGPT

专知会员服务

11+阅读 · 2025年7月5日

基于扩散模型和流模型的推理时引导生成技术

基于扩散模型和流模型的推理时引导生成技术

专知会员服务

16+阅读 · 2025年4月30日

【新书】《基于Transformers和扩散模型的生成式人工智能实战》

【新书】《基于Transformers和扩散模型的生成式人工智能实战》

专知会员服务

93+阅读 · 2024年12月16日

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

Mamba 架构在医学图像分析中的全面综述：分类、分割、重建及其他应用

专知会员服务

29+阅读 · 2024年10月4日

Sora背后的技术，最新《可控生成与文本到图像扩散模型》综述

Sora背后的技术，最新《可控生成与文本到图像扩散模型》综述

专知会员服务

69+阅读 · 2024年3月9日

爆火Sora背后的技术，UC伯克利最新《扩散模型》课程视频，210页ppt

爆火Sora背后的技术，UC伯克利最新《扩散模型》课程视频，210页ppt

专知会员服务

103+阅读 · 2024年2月25日

《生成式模型: 变分自编码器与扩散模型》，75页ppt，Google DeepMind科学家Ruiqi Gao

《生成式模型: 变分自编码器与扩散模型》，75页ppt，Google DeepMind科学家Ruiqi Gao

专知会员服务

66+阅读 · 2023年6月10日

扩散模型综述又一弹！西湖大学李子青等最新《生成式扩散模型》综述，18页pdf详解扩散模型基础、方法体系和应用

扩散模型综述又一弹！西湖大学李子青等最新《生成式扩散模型》综述，18页pdf详解扩散模型基础、方法体系和应用

专知会员服务

121+阅读 · 2022年9月9日

热门VIP内容

开通专知VIP会员享更多权益服务

多智能体协作机制

《反无人机技术领域的技术发展综述：C-UAS探测、跟踪与识别技术》80页报告

2025年大语言模型进展报告

非对称优势：美海军开发低成本反无人机技术

相关资讯

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

专知

20+阅读 · 2020年3月26日

绝对干货！NLP预训练模型：从transformer到albert

绝对干货！NLP预训练模型：从transformer到albert

新智元

13+阅读 · 2019年11月10日

让大卫雕塑跳舞、蒙娜丽莎说话，英伟达视频合成有如此多「骚操作」

让大卫雕塑跳舞、蒙娜丽莎说话，英伟达视频合成有如此多「骚操作」

机器之心

10+阅读 · 2019年10月28日

你跳宅舞的样子很专业：不，这都是AI合成的结果

你跳宅舞的样子很专业：不，这都是AI合成的结果

机器之心

11+阅读 · 2019年9月28日

多图带你读懂 Transformers 的工作原理

多图带你读懂 Transformers 的工作原理

AI研习社

10+阅读 · 2019年3月18日

BERT大火却不懂Transformer？读这一篇就够了

BERT大火却不懂Transformer？读这一篇就够了

大数据文摘

12+阅读 · 2019年1月8日

博客 | 总结+paper分享|对话系统中的自然语言生成技术（NLG）

博客 | 总结+paper分享|对话系统中的自然语言生成技术（NLG）

AI研习社

16+阅读 · 2018年12月4日

风格迁移原理及tensorflow实现-附代码

风格迁移原理及tensorflow实现-附代码

机器学习研究会

19+阅读 · 2018年3月25日

相关论文

MaDiS: Taming Masked Diffusion Language Models for Sign Language Generation

Arxiv

0+阅读 · 3月13日

Singing Syllabi with Virtual Avatars: Enhancing Student Engagement Through AI-Generated Music and Digital Embodiment

Arxiv

0+阅读 · 3月10日

MEGADance: Mixture-of-Experts Architecture for Genre-Aware 3D Dance Generation

Arxiv

0+阅读 · 2月23日

Skeleton2Stage: Reward-Guided Fine-Tuning for Physically Plausible Dance Generation

Arxiv

0+阅读 · 2月14日

Controllable Dance Generation with Style-Guided Motion Diffusion

Arxiv

0+阅读 · 2月10日

Generative modelling with jump-diffusions

Arxiv

0+阅读 · 2月6日

Generative Modeling via Drifting

Arxiv

0+阅读 · 2月6日

MambaVF: State Space Model for Efficient Video Fusion

Arxiv

0+阅读 · 2月5日

DiMo: Discrete Diffusion Modeling for Motion Generation and Understanding

Arxiv

0+阅读 · 2月4日

MIRRORTALK: Forging Personalized Avatars Via Disentangled Style and Hierarchical Motion Control

Arxiv

0+阅读 · 1月30日

相关基金

曲面上图像处理的非局部变分模型与算法

国家自然科学基金

0+阅读 · 2017年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于离散化Lyapunov-Krasovskii泛函方法的时滞Markov跳变系统分析与综合

国家自然科学基金

0+阅读 · 2015年12月31日

面向异构信息网络中实体归类的模糊聚类

国家自然科学基金

1+阅读 · 2015年12月31日

随机约束下非齐次Markov跳变系统控制器设计

国家自然科学基金

0+阅读 · 2015年12月31日

维吾尔语韵律结构的分析与预测模型的研究

国家自然科学基金

0+阅读 · 2014年12月31日

结构振动的非光滑控制方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

地震动非平稳特性对结构响应影响的定量关系模型及其建模方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

一类非线性发展方程的定性理论

国家自然科学基金

0+阅读 · 2014年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员