逼真且高效的 3D 服装生成一直是计算机视觉和数字时尚领域的长期挑战。现有方法通常依赖大型视觉语言模型来生成 2D 缝制样板的序列化表示,然后使用 GarmentCode 等服装建模框架将其转换为可仿真的 3D 网格。虽然这些方法产出了高质量结果,但它们往往面临推理速度慢的问题,耗时在 30 秒到 1 分钟之间。在这项工作中,我们推出了 SwiftTailor,这是一个新颖的两阶段框架,通过紧凑的几何图像表示统一了缝制样板推理和基于几何的网格合成。SwiftTailor 包含两个轻量化模块:PatternMaker(一个能从多种输入模态预测缝制样板的高效视觉语言模型)和 GarmentSewer(一个高效的密集预测 Transformer,可将这些样板转换为新颖的服装几何图像,在统一的 UV 空间中编码所有服装裁片的 3D 表面)。最终的 3D 网格通过高效的逆映射过程重建,该过程结合了重网格化和动态缝合算法来直接组装服装,从而抵消了物理仿真的开销。在 Multimodal GarmentCodeData 上的广泛实验表明,SwiftTailor 在显著缩短推理时间的同时,实现了最先进的准确度和视觉逼真度。这项工作为下一代 3D 服装生成提供了一个可扩展、可解释且高性能的解决方案。

成为VIP会员查看完整内容
0

相关内容

CVPR是IEEE Conference on Computer Vision and Pattern Recognition的缩写,即IEEE国际计算机视觉与模式识别会议。该会议是由IEEE举办的计算机视觉和模式识别领域的顶级会议。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
微信扫码咨询专知VIP会员