Neural Clothing Tryer: Customized Virtual Try-On via Semantic Enhancement and Controlling Diffusion Model - 专知论文

会员服务 ·

0

服装 · 虚拟试穿 · 模型实现 · 属性 · 语义描述 ·

Neural Clothing Tryer: Customized Virtual Try-On via Semantic Enhancement and Controlling Diffusion Model

翻译：神经服装试穿器：通过语义增强与控制扩散模型实现定制化虚拟试穿

Zhijing Yang,Weiwei Zhang,Mingliang Yang,Siyuan Peng,Yukai Shi,Junpeng Tan,Tianshui Chen,Liruo Zhong

from arxiv, Accepted by Expert Systems with Applications. 16 pages, 10 figures

This work aims to address a novel Customized Virtual Try-ON (Cu-VTON) task, enabling the superimposition of a specified garment onto a model that can be customized in terms of appearance, posture, and additional attributes. Compared with traditional VTON task, it enables users to tailor digital avatars to their individual preferences, thereby enhancing the virtual fitting experience with greater flexibility and engagement. To address this task, we introduce a Neural Clothing Tryer (NCT) framework, which exploits the advanced diffusion models equipped with semantic enhancement and controlling modules to better preserve semantic characterization and textural details of the garment and meanwhile facilitating the flexible editing of the model's postures and appearances. Specifically, NCT introduces a semantic-enhanced module to take semantic descriptions of garments and utilizes a visual-language encoder to learn aligned features across modalities. The aligned features are served as condition input to the diffusion model to enhance the preservation of the garment's semantics. Then, a semantic controlling module is designed to take the garment image, tailored posture image, and semantic description as input to maintain garment details while simultaneously editing model postures, expressions, and various attributes. Extensive experiments on the open available benchmark demonstrate the superior performance of the proposed NCT framework.

翻译：本研究旨在解决一种新颖的定制化虚拟试穿任务，能够将指定服装叠加到可在外观、姿态及附加属性上进行自定义的模特模型上。与传统虚拟试穿任务相比，该方法使用户能根据个人偏好定制数字形象，从而以更高的灵活性和参与度提升虚拟试穿体验。为此，我们提出了神经服装试穿器框架，该框架利用配备语义增强与控制模块的先进扩散模型，在更好地保持服装语义特征与纹理细节的同时，实现对模特姿态与外观的灵活编辑。具体而言，NCT引入语义增强模块来获取服装的语义描述，并利用视觉-语言编码器学习跨模态的对齐特征。这些对齐特征作为扩散模型的条件输入，以增强服装语义的保持效果。随后，设计的语义控制模块以服装图像、定制姿态图像及语义描述作为输入，在保持服装细节的同时实现对模特姿态、表情及多种属性的编辑。在公开可用基准上的大量实验证明了所提NCT框架的卓越性能。

0

相关内容

【CVPR2026】SwiftTailor：利用几何图像表示实现高效的 3D 服装生成。

【CVPR2026】SwiftTailor：利用几何图像表示实现高效的 3D 服装生成。

专知会员服务

6+阅读 · 3月22日

NeurIPS 2024 | GarmentLab衣物与柔体操作的物理仿真环境与基准测试

NeurIPS 2024 | GarmentLab衣物与柔体操作的物理仿真环境与基准测试

专知会员服务

13+阅读 · 2024年12月8日

《信息技术客服型虚拟数字人基础能力技术要求》国家标准意见稿

《信息技术客服型虚拟数字人基础能力技术要求》国家标准意见稿

专知会员服务

23+阅读 · 2024年12月3日

【博士论文】机器学习中新型神经元模型的研究

【博士论文】机器学习中新型神经元模型的研究

专知会员服务

26+阅读 · 2024年11月20日

机器人中的神经场：综述

机器人中的神经场：综述

专知会员服务

36+阅读 · 2024年11月1日

【NeurIPS2024】面向视觉-语言模型测试时泛化的双原型演化

【NeurIPS2024】面向视觉-语言模型测试时泛化的双原型演化

专知会员服务

18+阅读 · 2024年10月17日

如何评估具身智能？斯坦福李飞飞等发布《BEHAVIOR-1K: 以人为中心、具身化AI基准测试，含1000种日常活动和真实模拟》

如何评估具身智能？斯坦福李飞飞等发布《BEHAVIOR-1K: 以人为中心、具身化AI基准测试，含1000种日常活动和真实模拟》

专知会员服务

62+阅读 · 2024年3月15日

《基于图像的虚拟试穿》综述

《基于图像的虚拟试穿》综述

专知会员服务

22+阅读 · 2023年11月10日

2022中国虚拟数字人商业应用前景展望研究报告（附报告），45页pdf

2022中国虚拟数字人商业应用前景展望研究报告（附报告），45页pdf

专知会员服务

53+阅读 · 2022年11月10日

《使用神经形态相机的无人机虚拟围栏》加拿大国防研究与发展部论文

《使用神经形态相机的无人机虚拟围栏》加拿大国防研究与发展部论文

专知会员服务

28+阅读 · 2022年5月31日

【干货书】《Transformers 机器学习:深度探究》，284页pdf

【干货书】《Transformers 机器学习:深度探究》，284页pdf

专知

72+阅读 · 2022年4月21日

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

谷歌NIPS论文Transformer模型解读：只要Attention就够了

谷歌NIPS论文Transformer模型解读：只要Attention就够了

AI100

14+阅读 · 2019年9月9日

一键脱衣AI原理解密：开源算法，英伟达伯克利研究，不高深也不神秘

一键脱衣AI原理解密：开源算法，英伟达伯克利研究，不高深也不神秘

量子位

19+阅读 · 2019年7月2日

Attention！注意力机制模型最新综述

Attention！注意力机制模型最新综述

专知

65+阅读 · 2019年4月8日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

特定目标情感分析——神经网络这是要逆天么

特定目标情感分析——神经网络这是要逆天么

计算机研究与发展

14+阅读 · 2017年9月5日

新视觉模型下非完整移动机器人同时镇定和跟踪控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

多级可控组装模拟生物体系的功能

国家自然科学基金

0+阅读 · 2015年12月31日

面向高性能运动服数字化设计中的热功能量化计算与舒适性评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向策略消费者的时尚产品定制服务运营管理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于代数规约的Web服务在线测试理论和技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于社会网络的大型在线社区中虚拟商品购买行为研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动与可穿戴计算中Eyes-Free交互界面研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向三维服装建模的形状分析与处理方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

Gaussian Wardrobe: Compositional 3D Gaussian Avatars for Free-Form Virtual Try-On

Arxiv

0+阅读 · 3月5日

Gaussian Wardrobe: Compositional 3D Gaussian Avatars for Free-Form Virtual Try-On

Arxiv

1+阅读 · 3月4日

Neural Embeddings for Web Testing

Arxiv

0+阅读 · 2月22日

CORAL: Correspondence Alignment for Improved Virtual Try-On

Arxiv

0+阅读 · 2月19日

OmniVTON++: Training-Free Universal Virtual Try-On with Principal Pose Guidance

Arxiv

0+阅读 · 2月16日

High-Fidelity, Customizable Force Sensing for the Wearable Human-Robot Interface

Arxiv

0+阅读 · 2月13日

Real-time processing of analog signals on accelerated neuromorphic hardware

Arxiv

0+阅读 · 2月13日

Interactive Virtual Games: Winners for Deep Cognitive Assessment

Arxiv

0+阅读 · 2月11日

Neural-Augmented Kelvinlet for Real-Time Soft Tissue Deformation Modeling

Arxiv

0+阅读 · 2月11日

Automated Testing of Prevalent 3D User Interactions in Virtual Reality Applications

Arxiv

0+阅读 · 1月30日

VIP会员

文章信息

相关主题

最新内容

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

专知会员服务

4+阅读 · 7月23日

《基于强化学习的自动化红队测试》

《基于强化学习的自动化红队测试》

专知会员服务

3+阅读 · 7月23日

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

专知会员服务

6+阅读 · 7月23日

“天降毒雾”：无人机如何使化学战重返乌克兰战场

“天降毒雾”：无人机如何使化学战重返乌克兰战场

专知会员服务

2+阅读 · 7月23日

伊朗不对称防空战略的演进

伊朗不对称防空战略的演进

专知会员服务

4+阅读 · 7月23日

对抗环境下超视距目标打击的情报支援

对抗环境下超视距目标打击的情报支援

专知会员服务

10+阅读 · 7月22日

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

专知会员服务

4+阅读 · 7月22日

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

专知会员服务

8+阅读 · 7月22日

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

专知会员服务

10+阅读 · 7月22日

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

15+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

14+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

4+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

6+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

9+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

7+阅读 · 7月20日

相关VIP内容

【CVPR2026】SwiftTailor：利用几何图像表示实现高效的 3D 服装生成。

【CVPR2026】SwiftTailor：利用几何图像表示实现高效的 3D 服装生成。

专知会员服务

6+阅读 · 3月22日

NeurIPS 2024 | GarmentLab衣物与柔体操作的物理仿真环境与基准测试

NeurIPS 2024 | GarmentLab衣物与柔体操作的物理仿真环境与基准测试

专知会员服务

13+阅读 · 2024年12月8日

《信息技术客服型虚拟数字人基础能力技术要求》国家标准意见稿

《信息技术客服型虚拟数字人基础能力技术要求》国家标准意见稿

专知会员服务

23+阅读 · 2024年12月3日

【博士论文】机器学习中新型神经元模型的研究

【博士论文】机器学习中新型神经元模型的研究

专知会员服务

26+阅读 · 2024年11月20日

机器人中的神经场：综述

机器人中的神经场：综述

专知会员服务

36+阅读 · 2024年11月1日

【NeurIPS2024】面向视觉-语言模型测试时泛化的双原型演化

【NeurIPS2024】面向视觉-语言模型测试时泛化的双原型演化

专知会员服务

18+阅读 · 2024年10月17日

如何评估具身智能？斯坦福李飞飞等发布《BEHAVIOR-1K: 以人为中心、具身化AI基准测试，含1000种日常活动和真实模拟》

如何评估具身智能？斯坦福李飞飞等发布《BEHAVIOR-1K: 以人为中心、具身化AI基准测试，含1000种日常活动和真实模拟》

专知会员服务

62+阅读 · 2024年3月15日

《基于图像的虚拟试穿》综述

《基于图像的虚拟试穿》综述

专知会员服务

22+阅读 · 2023年11月10日

2022中国虚拟数字人商业应用前景展望研究报告（附报告），45页pdf

2022中国虚拟数字人商业应用前景展望研究报告（附报告），45页pdf

专知会员服务

53+阅读 · 2022年11月10日

《使用神经形态相机的无人机虚拟围栏》加拿大国防研究与发展部论文

《使用神经形态相机的无人机虚拟围栏》加拿大国防研究与发展部论文

专知会员服务

28+阅读 · 2022年5月31日

热门VIP内容

开通专知VIP会员享更多权益服务

《基于强化学习的自动化红队测试》

“天降毒雾”：无人机如何使化学战重返乌克兰战场

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

相关资讯

【干货书】《Transformers 机器学习:深度探究》，284页pdf

【干货书】《Transformers 机器学习:深度探究》，284页pdf

专知

72+阅读 · 2022年4月21日

3D Human相关研究总结：人体、姿态估计、人体重建等

3D Human相关研究总结：人体、姿态估计、人体重建等

PaperWeekly

27+阅读 · 2021年3月1日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

谷歌NIPS论文Transformer模型解读：只要Attention就够了

谷歌NIPS论文Transformer模型解读：只要Attention就够了

AI100

14+阅读 · 2019年9月9日

一键脱衣AI原理解密：开源算法，英伟达伯克利研究，不高深也不神秘

一键脱衣AI原理解密：开源算法，英伟达伯克利研究，不高深也不神秘

量子位

19+阅读 · 2019年7月2日

Attention！注意力机制模型最新综述

Attention！注意力机制模型最新综述

专知

65+阅读 · 2019年4月8日

图神经网络最近这么火，不妨看看我们精选的这七篇

图神经网络最近这么火，不妨看看我们精选的这七篇

人工智能前沿讲习班

37+阅读 · 2018年12月10日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

特定目标情感分析——神经网络这是要逆天么

特定目标情感分析——神经网络这是要逆天么

计算机研究与发展

14+阅读 · 2017年9月5日

相关论文

Gaussian Wardrobe: Compositional 3D Gaussian Avatars for Free-Form Virtual Try-On

Arxiv

0+阅读 · 3月5日

Gaussian Wardrobe: Compositional 3D Gaussian Avatars for Free-Form Virtual Try-On

Arxiv

1+阅读 · 3月4日

Neural Embeddings for Web Testing

Arxiv

0+阅读 · 2月22日

CORAL: Correspondence Alignment for Improved Virtual Try-On

Arxiv

0+阅读 · 2月19日

OmniVTON++: Training-Free Universal Virtual Try-On with Principal Pose Guidance

Arxiv

0+阅读 · 2月16日

High-Fidelity, Customizable Force Sensing for the Wearable Human-Robot Interface

Arxiv

0+阅读 · 2月13日

Real-time processing of analog signals on accelerated neuromorphic hardware

Arxiv

0+阅读 · 2月13日

Interactive Virtual Games: Winners for Deep Cognitive Assessment

Arxiv

0+阅读 · 2月11日

Neural-Augmented Kelvinlet for Real-Time Soft Tissue Deformation Modeling

Arxiv

0+阅读 · 2月11日

Automated Testing of Prevalent 3D User Interactions in Virtual Reality Applications

Arxiv

0+阅读 · 1月30日

相关基金

新视觉模型下非完整移动机器人同时镇定和跟踪控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

多级可控组装模拟生物体系的功能

国家自然科学基金

0+阅读 · 2015年12月31日

面向高性能运动服数字化设计中的热功能量化计算与舒适性评估研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向策略消费者的时尚产品定制服务运营管理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于代数规约的Web服务在线测试理论和技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于社会网络的大型在线社区中虚拟商品购买行为研究

国家自然科学基金

0+阅读 · 2015年12月31日

移动与可穿戴计算中Eyes-Free交互界面研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向三维服装建模的形状分析与处理方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

数据和模型混合驱动的虚拟人群行为仿真技术研究及其在军事中的应用

国家自然科学基金

10+阅读 · 2011年12月31日

微信扫码咨询专知VIP会员