We introduce a video diffusion model for high-fidelity, causal, and real-time video generation under ultra-low-bitrate semantic communication constraints. Our approach utilizes lossy semantic video coding to transmit the semantic scene structure, complemented by a stream of highly compressed, low-resolution frames that provide sufficient texture information to preserve fidelity. Building on these inputs, we introduce a modular video diffusion model that contains Semantic Control, Restoration Adapter, and Temporal Adapter. We further introduce an efficient temporal distillation procedure that enables extension to real-time and causal synthesis, reducing trainable parameters by 300x and training time by 2x, while adhering to communication constraints. Evaluated across diverse datasets, the framework achieves strong perceptual quality, semantic fidelity, and temporal consistency at ultra-low bitrates (< 0.0003 bpp), outperforming classical, neural, and generative baselines in extensive quantitative, qualitative, and subjective evaluations.


翻译:本文提出一种视频扩散模型,用于在超低码率语义通信约束下实现高保真、因果且实时的视频生成。该方法采用有损语义视频编码传输语义场景结构,辅以高度压缩的低分辨率帧流提供足够的纹理信息以保持保真度。基于这些输入,我们构建了包含语义控制模块、修复适配器和时序适配器的模块化视频扩散模型。进一步提出高效的时序蒸馏方法,使其能够扩展至实时因果合成,在满足通信约束的同时将可训练参数量降低300倍、训练时间缩短2倍。在多样化数据集上的评估表明,该框架在超低码率(< 0.0003 bpp)下实现了优异的感知质量、语义保真度和时序一致性,在大量定量、定性和主观评估中均超越传统方法、神经基线和生成式基线模型。

0
下载
关闭预览

相关内容

用于语言生成的离散扩散模型
专知会员服务
11+阅读 · 2025年7月10日
医学影像中的高效扩散模型:全面综述
专知会员服务
15+阅读 · 2025年5月26日
视频扩散模型综述:基础、实现与应用
专知会员服务
13+阅读 · 2025年4月24日
高效扩散模型综述
专知会员服务
34+阅读 · 2025年2月1日
【HKUST博士论文】基于生成模型的高保真图像与视频编辑
低层视觉中的扩散模型:综述
专知会员服务
22+阅读 · 2024年6月18日
视频扩散模型:综述
专知会员服务
38+阅读 · 2024年5月8日
扩散模型图像超分辨率等综述
专知会员服务
25+阅读 · 2024年1月2日
复旦等最新《视频扩散模型》综述
专知会员服务
38+阅读 · 2023年10月20日
谷歌EfficientNet缩放模型,PyTorch实现登热榜
机器学习算法与Python学习
11+阅读 · 2019年6月4日
CVPR 2019 | 神奇的超分辨率算法DPSR:应对图像模糊降质
计算机视觉life
16+阅读 · 2019年4月25日
低清视频也能快速转高清:超分辨率算法TecoGAN
机器之心
13+阅读 · 2019年4月16日
深度学习图像超分辨率最新综述:从模型到应用
炼数成金订阅号
65+阅读 · 2019年2月20日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
用于语言生成的离散扩散模型
专知会员服务
11+阅读 · 2025年7月10日
医学影像中的高效扩散模型:全面综述
专知会员服务
15+阅读 · 2025年5月26日
视频扩散模型综述:基础、实现与应用
专知会员服务
13+阅读 · 2025年4月24日
高效扩散模型综述
专知会员服务
34+阅读 · 2025年2月1日
【HKUST博士论文】基于生成模型的高保真图像与视频编辑
低层视觉中的扩散模型:综述
专知会员服务
22+阅读 · 2024年6月18日
视频扩散模型:综述
专知会员服务
38+阅读 · 2024年5月8日
扩散模型图像超分辨率等综述
专知会员服务
25+阅读 · 2024年1月2日
复旦等最新《视频扩散模型》综述
专知会员服务
38+阅读 · 2023年10月20日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员