VQ-Style: Disentangling Style and Content in Motion with Residual Quantized Representations - 专知论文

会员服务 ·

0

解耦 · 运动风格 · 风格迁移 · 运动数据 · 变分自编码 ·

VQ-Style: Disentangling Style and Content in Motion with Residual Quantized Representations

翻译：VQ-Style：基于残差量化表征的运动风格与内容解耦

Fatemeh Zargarbashi,Dhruv Agrawal,Jakob Buhmann,Martin Guay,Stelian Coros,Robert W. Sumner

Human motion data is inherently rich and complex, containing both semantic content and subtle stylistic features that are challenging to model. We propose a novel method for effective disentanglement of the style and content in human motion data to facilitate style transfer. Our approach is guided by the insight that content corresponds to coarse motion attributes while style captures the finer, expressive details. To model this hierarchy, we employ Residual Vector Quantized Variational Autoencoders (RVQ-VAEs) to learn a coarse-to-fine representation of motion. We further enhance the disentanglement by integrating contrastive learning and a novel information leakage loss with codebook learning to organize the content and the style across different codebooks. We harness this disentangled representation using our simple and effective inference-time technique Quantized Code Swapping, which enables motion style transfer without requiring any fine-tuning for unseen styles. Our framework demonstrates strong versatility across multiple inference applications, including style transfer, style removal, and motion blending.

翻译：人体运动数据本质上是丰富且复杂的，同时包含语义内容和难以建模的微妙风格特征。本文提出一种新颖方法，用于有效解耦人体运动数据中的风格与内容，以促进风格迁移。我们的方法基于以下洞见：内容对应粗粒度的运动属性，而风格则捕捉更精细、更具表现力的细节。为建模此层次结构，我们采用残差向量量化变分自编码器（RVQ-VAE）来学习从粗到细的运动表征。我们进一步通过将对比学习、新颖的信息泄漏损失与码本学习相结合，以在不同码本间组织内容与风格，从而增强解耦效果。利用我们提出的简单高效的推理时技术——量化码交换，我们能够在不针对未见风格进行任何微调的情况下实现运动风格迁移。我们的框架在多种推理应用中展现出强大的通用性，包括风格迁移、风格移除和运动融合。

0

相关内容

基于神经网络的图像风格迁移算法综述

基于神经网络的图像风格迁移算法综述

专知会员服务

12+阅读 · 2025年5月29日

【CVPR2025】MixerMDM：可学习的人体运动扩散模型组合

【CVPR2025】MixerMDM：可学习的人体运动扩散模型组合

专知会员服务

10+阅读 · 2025年4月3日

【CVPR2025】《VideoMage：文本到视频扩散模型的多主体与运动定制》

【CVPR2025】《VideoMage：文本到视频扩散模型的多主体与运动定制》

专知会员服务

12+阅读 · 2025年3月28日

表格数据的语言建模：基础、技术与演变综述

表格数据的语言建模：基础、技术与演变综述

专知会员服务

39+阅读 · 2024年8月23日

【ICCV2023】StyleDiffusion:基于扩散模型的可控解缠风格迁移

【ICCV2023】StyleDiffusion:基于扩散模型的可控解缠风格迁移

专知会员服务

26+阅读 · 2023年8月20日

【CVPR 2022】基于Transformer的图象风格化，StyTr2: Image Style Transfer with Transformers

【CVPR 2022】基于Transformer的图象风格化，StyTr2: Image Style Transfer with Transformers

专知会员服务

11+阅读 · 2022年3月19日

文本风格迁移研究综述

文本风格迁移研究综述

专知会员服务

35+阅读 · 2022年1月1日

神经风格迁移模型综述

专知会员服务

34+阅读 · 2021年10月8日

【字节跳动&Adobe】图割多模态风格迁移，Multimodal Style Transfer via Graph Cuts

【字节跳动&Adobe】图割多模态风格迁移，Multimodal Style Transfer via Graph Cuts

专知会员服务

15+阅读 · 2020年1月9日

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

专知会员服务

29+阅读 · 2019年11月15日

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

【深度语义匹配模型】原理篇二：交互篇

【深度语义匹配模型】原理篇二：交互篇

AINLP

16+阅读 · 2020年5月18日

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

专知

20+阅读 · 2020年3月26日

【紫冬声音】基于人体骨架的行为识别

【紫冬声音】基于人体骨架的行为识别

中国自动化学会

17+阅读 · 2019年1月30日

【紫冬分享】基于人体骨架的行为识别

【紫冬分享】基于人体骨架的行为识别

中国科学院自动化研究所

20+阅读 · 2019年1月18日

基于人体骨架的行为识别【附PPT与视频资料】

基于人体骨架的行为识别【附PPT与视频资料】

人工智能前沿讲习班

31+阅读 · 2019年1月15日

风格迁移原理及tensorflow实现-附代码

风格迁移原理及tensorflow实现-附代码

机器学习研究会

19+阅读 · 2018年3月25日

【论文推荐】最新六篇用户建模精选论文推荐—深度多模态融合、跨平台、时序性RNN、ATRank、嵌入因子分解、异构信息网络

【论文推荐】最新六篇用户建模精选论文推荐—深度多模态融合、跨平台、时序性RNN、ATRank、嵌入因子分解、异构信息网络

专知

10+阅读 · 2018年3月10日

图像风格迁移(Neural Style)简史

图像风格迁移(Neural Style)简史

算法与数学之美

21+阅读 · 2018年2月4日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

融合稀疏层次模型的内容辨识研究

国家自然科学基金

2+阅读 · 2015年12月31日

三维空间中基于图结构的人体姿态估计算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

函数数据变换模型及降维方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于社会媒体异质关系挖掘的用户兴趣建模方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于集成流形学习的监控视频中人体行为识别研究

国家自然科学基金

3+阅读 · 2014年12月31日

关于面板(纵向）数据的动态统计分析

国家自然科学基金

0+阅读 · 2014年12月31日

运动目标间语义关系的时空建模及可视化研究

国家自然科学基金

1+阅读 · 2014年12月31日

InterEdit: Navigating Text-Guided Multi-Human 3D Motion Editing

Arxiv

0+阅读 · 3月13日

DiffWind: Physics-Informed Differentiable Modeling of Wind-Driven Object Dynamics

Arxiv

0+阅读 · 3月10日

TIMotion: Temporal and Interactive Framework for Efficient Human-Human Motion Generation

Arxiv

0+阅读 · 3月10日

StyleStream: Real-Time Zero-Shot Voice Style Conversion

Arxiv

0+阅读 · 2月23日

RegionRoute: Regional Style Transfer with Diffusion Model

Arxiv

0+阅读 · 2月22日

Text Style Transfer with Parameter-efficient LLM Finetuning and Round-trip Translation

Arxiv

0+阅读 · 2月16日

CoCoDiff: Correspondence-Consistent Diffusion Model for Fine-grained Style Transfer

Arxiv

0+阅读 · 2月16日

IM-Animation: An Implicit Motion Representation for Identity-decoupled Character Animation

Arxiv

0+阅读 · 2月7日

DiMo: Discrete Diffusion Modeling for Motion Generation and Understanding

Arxiv

0+阅读 · 2月4日

MIRRORTALK: Forging Personalized Avatars Via Disentangled Style and Hierarchical Motion Control

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

变分自编码

最新内容

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

10+阅读 · 4月21日

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

10+阅读 · 4月21日

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

7+阅读 · 4月21日

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

8+阅读 · 4月21日

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

11+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

10+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

6+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

4+阅读 · 4月20日

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

8+阅读 · 4月20日

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

5+阅读 · 4月20日

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

5+阅读 · 4月20日

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

8+阅读 · 4月20日

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

8+阅读 · 4月20日

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

12+阅读 · 4月20日

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

6+阅读 · 4月20日

相关VIP内容

基于神经网络的图像风格迁移算法综述

基于神经网络的图像风格迁移算法综述

专知会员服务

12+阅读 · 2025年5月29日

【CVPR2025】MixerMDM：可学习的人体运动扩散模型组合

【CVPR2025】MixerMDM：可学习的人体运动扩散模型组合

专知会员服务

10+阅读 · 2025年4月3日

【CVPR2025】《VideoMage：文本到视频扩散模型的多主体与运动定制》

【CVPR2025】《VideoMage：文本到视频扩散模型的多主体与运动定制》

专知会员服务

12+阅读 · 2025年3月28日

表格数据的语言建模：基础、技术与演变综述

表格数据的语言建模：基础、技术与演变综述

专知会员服务

39+阅读 · 2024年8月23日

【ICCV2023】StyleDiffusion:基于扩散模型的可控解缠风格迁移

【ICCV2023】StyleDiffusion:基于扩散模型的可控解缠风格迁移

专知会员服务

26+阅读 · 2023年8月20日

【CVPR 2022】基于Transformer的图象风格化，StyTr2: Image Style Transfer with Transformers

【CVPR 2022】基于Transformer的图象风格化，StyTr2: Image Style Transfer with Transformers

专知会员服务

11+阅读 · 2022年3月19日

文本风格迁移研究综述

文本风格迁移研究综述

专知会员服务

35+阅读 · 2022年1月1日

神经风格迁移模型综述

专知会员服务

34+阅读 · 2021年10月8日

【字节跳动&Adobe】图割多模态风格迁移，Multimodal Style Transfer via Graph Cuts

【字节跳动&Adobe】图割多模态风格迁移，Multimodal Style Transfer via Graph Cuts

专知会员服务

15+阅读 · 2020年1月9日

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

【AAAI2020论文-清华大学】基于人物稀疏数据的预训练个性化对话生成模型（A Pre-training Based Personalized Dialogue Generation Model with Persona-sparse Data）

专知会员服务

29+阅读 · 2019年11月15日

热门VIP内容

开通专知VIP会员享更多权益服务

《提升美军全域城市作战训练最佳实践的案例研究》366页

美海军数字作战负责人：如何利用数据快速生成战斗力

《美陆军条例：陆军指挥政策（2026版）》

《军用自主人工智能系统的治理与安全》

相关资讯

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

Transformer模型-深度学习自然语言处理，17页ppt

Transformer模型-深度学习自然语言处理，17页ppt

专知

14+阅读 · 2020年8月30日

【深度语义匹配模型】原理篇二：交互篇

【深度语义匹配模型】原理篇二：交互篇

AINLP

16+阅读 · 2020年5月18日

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

【芝加哥大学】可变形的风格转移，Deformable Style Transfer

专知

20+阅读 · 2020年3月26日

【紫冬声音】基于人体骨架的行为识别

【紫冬声音】基于人体骨架的行为识别

中国自动化学会

17+阅读 · 2019年1月30日

【紫冬分享】基于人体骨架的行为识别

【紫冬分享】基于人体骨架的行为识别

中国科学院自动化研究所

20+阅读 · 2019年1月18日

基于人体骨架的行为识别【附PPT与视频资料】

基于人体骨架的行为识别【附PPT与视频资料】

人工智能前沿讲习班

31+阅读 · 2019年1月15日

风格迁移原理及tensorflow实现-附代码

风格迁移原理及tensorflow实现-附代码

机器学习研究会

19+阅读 · 2018年3月25日

【论文推荐】最新六篇用户建模精选论文推荐—深度多模态融合、跨平台、时序性RNN、ATRank、嵌入因子分解、异构信息网络

【论文推荐】最新六篇用户建模精选论文推荐—深度多模态融合、跨平台、时序性RNN、ATRank、嵌入因子分解、异构信息网络

专知

10+阅读 · 2018年3月10日

图像风格迁移(Neural Style)简史

图像风格迁移(Neural Style)简史

算法与数学之美

21+阅读 · 2018年2月4日

相关论文

InterEdit: Navigating Text-Guided Multi-Human 3D Motion Editing

Arxiv

0+阅读 · 3月13日

DiffWind: Physics-Informed Differentiable Modeling of Wind-Driven Object Dynamics

Arxiv

0+阅读 · 3月10日

TIMotion: Temporal and Interactive Framework for Efficient Human-Human Motion Generation

Arxiv

0+阅读 · 3月10日

StyleStream: Real-Time Zero-Shot Voice Style Conversion

Arxiv

0+阅读 · 2月23日

RegionRoute: Regional Style Transfer with Diffusion Model

Arxiv

0+阅读 · 2月22日

Text Style Transfer with Parameter-efficient LLM Finetuning and Round-trip Translation

Arxiv

0+阅读 · 2月16日

CoCoDiff: Correspondence-Consistent Diffusion Model for Fine-grained Style Transfer

Arxiv

0+阅读 · 2月16日

IM-Animation: An Implicit Motion Representation for Identity-decoupled Character Animation

Arxiv

0+阅读 · 2月7日

DiMo: Discrete Diffusion Modeling for Motion Generation and Understanding

Arxiv

0+阅读 · 2月4日

MIRRORTALK: Forging Personalized Avatars Via Disentangled Style and Hierarchical Motion Control

Arxiv

0+阅读 · 1月30日

相关基金

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

融合稀疏层次模型的内容辨识研究

国家自然科学基金

2+阅读 · 2015年12月31日

三维空间中基于图结构的人体姿态估计算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

函数数据变换模型及降维方法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于社会媒体异质关系挖掘的用户兴趣建模方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

5+阅读 · 2014年12月31日

基于集成流形学习的监控视频中人体行为识别研究

国家自然科学基金

3+阅读 · 2014年12月31日

关于面板(纵向）数据的动态统计分析

国家自然科学基金

0+阅读 · 2014年12月31日

运动目标间语义关系的时空建模及可视化研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员