Semantic communication is a novel communication paradigm that focuses on conveying the user's intended meaning rather than the bit-wise transmission of source signals. One of the key challenges is to effectively represent and extract the semantic meaning of any given source signals. While deep learning (DL)-based solutions have shown promising results in extracting implicit semantic information from a wide range of sources, existing work often overlooks the high computational complexity inherent in both model training and inference for the DL-based encoder and decoder. To bridge this gap, this paper proposes a rate-distortion-complexity (RDC) framework which extends the classical rate-distortion theory by incorporating the constraints on semantic distance, including both the traditional bit-wise distortion metric and statistical difference-based divergence metric, and complexity measure, adopted from the theory of minimum description length and information bottleneck. We derive the closed-form theoretical results of the minimum achievable rate under given constraints on semantic distance and complexity for both Gaussian and binary semantic sources. Our theoretical results show a fundamental three-way tradeoff among achievable rate, semantic distance, and model complexity. Extensive experiments on real-world image and video datasets validate this tradeoff and further demonstrate that our information-theoretic complexity measure effectively correlates with practical computational costs, guiding efficient system design in resource-constrained scenarios.


翻译:语义通信是一种新型通信范式,其核心在于传递用户意图的含义,而非源信号的比特级传输。关键挑战之一在于如何有效表征和提取任意给定源信号的语义信息。尽管基于深度学习的方法在从广泛信源中提取隐式语义信息方面展现出良好前景,现有研究往往忽视深度学习编码器与解码器在模型训练和推理过程中固有的高计算复杂度。为弥补这一空白,本文提出速率-失真-复杂度理论框架,该框架通过引入语义距离约束(包含传统比特级失真度量与基于统计差异的散度度量)以及源自最小描述长度理论与信息瓶颈理论的复杂度度量,对经典率失真理论进行了拓展。我们推导出高斯与二进制语义信源在给定语义距离与复杂度约束下可实现最小速率的闭式理论解。理论结果表明,在可达速率、语义距离与模型复杂度之间存在根本性的三维权衡关系。在真实图像与视频数据集上的大量实验验证了该权衡关系,并进一步证明我们提出的信息论复杂度度量与实际计算成本有效关联,可为资源受限场景下的高效系统设计提供指导。

0
下载
关闭预览

相关内容

基于深度学习的实时语义分割综述
专知会员服务
32+阅读 · 2023年11月27日
机器音译研究综述
专知会员服务
17+阅读 · 2022年10月16日
【新书】自然语言处理表示学习技术,349页pdf,清华大学
专知会员服务
174+阅读 · 2020年7月11日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
【深度语义匹配模型】原理篇二:交互篇
AINLP
16+阅读 · 2020年5月18日
哈工大韩纪庆教授《语音信号处理(第3版)》出版
书单 | 语音研究进阶指南
微软研究院AI头条
12+阅读 · 2019年3月22日
DL | 语义分割综述
机器学习算法与Python学习
58+阅读 · 2019年3月13日
最新人机对话系统简略综述
专知
26+阅读 · 2018年3月10日
见微知著:语义分割中的弱监督学习
深度学习大讲堂
11+阅读 · 2017年12月6日
语义分割中的深度学习方法全解:从FCN、SegNet到DeepLab
炼数成金订阅号
26+阅读 · 2017年7月10日
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
VIP会员
相关资讯
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
【深度语义匹配模型】原理篇二:交互篇
AINLP
16+阅读 · 2020年5月18日
哈工大韩纪庆教授《语音信号处理(第3版)》出版
书单 | 语音研究进阶指南
微软研究院AI头条
12+阅读 · 2019年3月22日
DL | 语义分割综述
机器学习算法与Python学习
58+阅读 · 2019年3月13日
最新人机对话系统简略综述
专知
26+阅读 · 2018年3月10日
见微知著:语义分割中的弱监督学习
深度学习大讲堂
11+阅读 · 2017年12月6日
语义分割中的深度学习方法全解:从FCN、SegNet到DeepLab
炼数成金订阅号
26+阅读 · 2017年7月10日
相关基金
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
11+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员