We introduce a video diffusion model for high-fidelity, causal, and real-time video generation under ultra-low-bitrate semantic communication constraints. Our approach utilizes lossy semantic video coding to transmit the semantic scene structure, complemented by a stream of highly compressed, low-resolution frames that provide sufficient texture information to preserve fidelity. Building on these inputs, we introduce a modular video diffusion model that contains Semantic Control, Restoration Adapter, and Temporal Adapter. We further introduce an efficient temporal distillation procedure that enables extension to real-time and causal synthesis, reducing trainable parameters by 300x and training time by 2x, while adhering to communication constraints. Evaluated across diverse datasets, the framework achieves strong perceptual quality, semantic fidelity, and temporal consistency at ultra-low bitrates (< 0.0003 bpp), outperforming classical, neural, and generative baselines in extensive quantitative, qualitative, and subjective evaluations.


翻译:本文提出一种视频扩散模型,用于在超低码率语义通信约束下实现高保真、因果且实时的视频生成。该方法采用有损语义视频编码传输语义场景结构,辅以高度压缩的低分辨率帧流提供足够的纹理信息以保持保真度。基于这些输入,我们构建了包含语义控制模块、修复适配器和时序适配器的模块化视频扩散模型。进一步提出高效的时序蒸馏方法,使其能够扩展至实时因果合成,在满足通信约束的同时将可训练参数量降低300倍、训练时间缩短2倍。在多样化数据集上的评估表明,该框架在超低码率(< 0.0003 bpp)下实现了优异的感知质量、语义保真度和时序一致性,在大量定量、定性和主观评估中均超越传统方法、神经基线和生成式基线模型。

0
下载
关闭预览

相关内容

用于语言生成的离散扩散模型
专知会员服务
12+阅读 · 2025年7月10日
医学影像中的高效扩散模型:全面综述
专知会员服务
15+阅读 · 2025年5月26日
视频扩散模型综述:基础、实现与应用
专知会员服务
13+阅读 · 2025年4月24日
高效扩散模型综述
专知会员服务
34+阅读 · 2025年2月1日
【HKUST博士论文】基于生成模型的高保真图像与视频编辑
低层视觉中的扩散模型:综述
专知会员服务
22+阅读 · 2024年6月18日
视频扩散模型:综述
专知会员服务
38+阅读 · 2024年5月8日
扩散模型图像超分辨率等综述
专知会员服务
25+阅读 · 2024年1月2日
复旦等最新《视频扩散模型》综述
专知会员服务
38+阅读 · 2023年10月20日
谷歌EfficientNet缩放模型,PyTorch实现登热榜
机器学习算法与Python学习
11+阅读 · 2019年6月4日
CVPR 2019 | 神奇的超分辨率算法DPSR:应对图像模糊降质
计算机视觉life
16+阅读 · 2019年4月25日
低清视频也能快速转高清:超分辨率算法TecoGAN
机器之心
13+阅读 · 2019年4月16日
深度学习图像超分辨率最新综述:从模型到应用
炼数成金订阅号
65+阅读 · 2019年2月20日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
最新“指挥控制”领域出版物合集(简介)
专知会员服务
1+阅读 · 今天15:19
面向军事作战需求开发的人工智能(RAIMOND)
专知会员服务
3+阅读 · 今天15:13
软件定义多域战术网络:基础与未来方向(综述)
水下战战术决策中的气象与海洋预报(50页报告)
远程空中优势:新一代超视距导弹的兴起
专知会员服务
1+阅读 · 今天14:45
大语言模型溯因推理的统一分类学与综述
专知会员服务
0+阅读 · 今天12:07
相关VIP内容
用于语言生成的离散扩散模型
专知会员服务
12+阅读 · 2025年7月10日
医学影像中的高效扩散模型:全面综述
专知会员服务
15+阅读 · 2025年5月26日
视频扩散模型综述:基础、实现与应用
专知会员服务
13+阅读 · 2025年4月24日
高效扩散模型综述
专知会员服务
34+阅读 · 2025年2月1日
【HKUST博士论文】基于生成模型的高保真图像与视频编辑
低层视觉中的扩散模型:综述
专知会员服务
22+阅读 · 2024年6月18日
视频扩散模型:综述
专知会员服务
38+阅读 · 2024年5月8日
扩散模型图像超分辨率等综述
专知会员服务
25+阅读 · 2024年1月2日
复旦等最新《视频扩散模型》综述
专知会员服务
38+阅读 · 2023年10月20日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员