A Survey of Advancing Audio Super-Resolution and Bandwidth Extension from Discriminative to Generative Models - 专知论文

会员服务 ·

0

带宽 · 超分 · SR · 超分辨率 · 综述 ·

A Survey of Advancing Audio Super-Resolution and Bandwidth Extension from Discriminative to Generative Models

翻译：音频超分辨率与带宽扩展从判别式到生成式模型的进展综述

Ningyuan Yang,Yize Li,Diego A. Cuji,Ryan M. Corey,Pu Zhao,Xue Lin,Andrew C. Singer

from arxiv, Under review

Audio super-resolution (SR), also referred to as bandwidth extension (BWE), aims to reconstruct high-fidelity signals from low-resolution (LR) or band-limited (BL) observations, an inherently ill-posed task due to the ambiguity of missing high-frequency (HF) content. This survey provides a comprehensive overview of the field, with a particular focus on the paradigm shift from discriminative mapping to modern generative modeling. We first review early discriminative deep neural network (DNN) models, which formulate BWE/SR as a deterministic mapping problem and are prone to regression-to-the-mean effects and spectral over-smoothing. We then systematically review generative approaches, including autoregressive (AR) models, variational autoencoders (VAEs), generative adversarial networks (GANs), diffusion and score-based models, flow-based methods, and Schrödinger bridges. Across these approaches, we examine key design aspects, including representation domain, architecture, conditioning mechanisms, and trade-offs among reconstruction fidelity, perceptual quality, robustness, and computational efficiency. Furthermore, we discuss emerging directions involving large language models (LLMs) and multimodal foundation models, and highlight open challenges in perceptual evaluation, phase modeling, and real-world generalization. By providing a structured taxonomy and unified perspective, this survey establishes a comprehensive foundation and offers a practical roadmap for advancing BWE/SR from deterministic point estimation toward distribution-aware generative modeling.

翻译：音频超分辨率（SR），亦称带宽扩展（BWE），旨在从低分辨率（LR）或带宽受限（BL）的观测中重建高保真信号。由于缺失高频（HF）内容固有的模糊性，该任务具有不适定性。本综述全面概述该领域，特别关注从判别式映射到现代生成式建模的范式转变。我们首先回顾早期判别式深度神经网络（DNN）模型，其将BWE/SR表述为确定性映射问题，且易出现回归至均值效应和频谱过度平滑。随后，我们系统梳理生成式方法，包括自回归（AR）模型、变分自编码器（VAE）、生成对抗网络（GAN）、扩散与基于分数的模型、基于流的方法以及薛定谔桥。针对这些方法，我们考察关键设计方面，包括表示域、架构、条件机制，以及重建保真度、感知质量、鲁棒性和计算效率之间的权衡。此外，我们讨论涉及大语言模型（LLM）和多模态基础模型的新兴方向，并强调感知评估、相位建模及真实世界泛化中的开放挑战。通过提供结构化分类法和统一视角，本综述为将BWE/SR从确定性点估计推进至分布感知式生成建模奠定了全面基础，并提供了实用路线图。

0

相关内容

深度学习视频超分辨率综述

深度学习视频超分辨率综述

专知会员服务

14+阅读 · 2025年6月5日

遥感图像超分辨率技术进展：综合综述

遥感图像超分辨率技术进展：综合综述

专知会员服务

12+阅读 · 2025年5月31日

【ETHZ博士论文】超越像素深度：通过深度学习增强超分辨率技术，198页pdf

【ETHZ博士论文】超越像素深度：通过深度学习增强超分辨率技术，198页pdf

专知会员服务

25+阅读 · 2024年11月21日

扩散模型图像超分辨率等综述

扩散模型图像超分辨率等综述

专知会员服务

25+阅读 · 2024年1月2日

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

专知会员服务

87+阅读 · 2022年9月13日

扩散模型综述又一弹！西湖大学李子青等最新《生成式扩散模型》综述，18页pdf详解扩散模型基础、方法体系和应用

扩散模型综述又一弹！西湖大学李子青等最新《生成式扩散模型》综述，18页pdf详解扩散模型基础、方法体系和应用

专知会员服务

121+阅读 · 2022年9月9日

基于深度学习的视频超分辨率重构进展综述

基于深度学习的视频超分辨率重构进展综述

专知会员服务

19+阅读 · 2022年3月7日

最新《深度学习视频超分》综述论文，30页pdf，Video Super Resolution Based on Deep Learning: A comprehensive survey

最新《深度学习视频超分》综述论文，30页pdf，Video Super Resolution Based on Deep Learning: A comprehensive survey

专知会员服务

25+阅读 · 2020年7月28日

【超分辨率| 2019最新综述】图像超分辨率的深度学习，附PDF（Deep Learning for Image Super-resolution: A Survey）

【超分辨率| 2019最新综述】图像超分辨率的深度学习，附PDF（Deep Learning for Image Super-resolution: A Survey）

专知会员服务

60+阅读 · 2019年11月16日

【超分辨率| 2019最新综述】进入超分辨率的深度旅程：一项调查，附PDF（A Deep Journey into Super-resolution: A survey）

【超分辨率| 2019最新综述】进入超分辨率的深度旅程：一项调查，附PDF（A Deep Journey into Super-resolution: A survey）

专知会员服务

37+阅读 · 2019年11月16日

推荐！《高超音速的影响：高超音速武器的作战影响和美国战略形势的变化》美国国防大学联合部队参谋学院120页报告

推荐！《高超音速的影响：高超音速武器的作战影响和美国战略形势的变化》美国国防大学联合部队参谋学院120页报告

专知

22+阅读 · 2022年10月23日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

CVPR 2019 | 神奇的超分辨率算法DPSR：应对图像模糊降质

CVPR 2019 | 神奇的超分辨率算法DPSR：应对图像模糊降质

计算机视觉life

16+阅读 · 2019年4月25日

基于深度学习的图像超分辨率最新进展与趋势【附PDF】

基于深度学习的图像超分辨率最新进展与趋势【附PDF】

人工智能前沿讲习班

15+阅读 · 2019年2月27日

从网络设计到实际应用，深度学习图像超分辨率综述

从网络设计到实际应用，深度学习图像超分辨率综述

机器之心

25+阅读 · 2019年2月24日

深度学习图像超分辨率最新综述：从模型到应用

深度学习图像超分辨率最新综述：从模型到应用

炼数成金订阅号

65+阅读 · 2019年2月20日

最新23页《深度学习图像超分辨率应用综述》论文，带你全面了解深度学习超分方法（附下载）

最新23页《深度学习图像超分辨率应用综述》论文，带你全面了解深度学习超分方法（附下载）

专知

43+阅读 · 2019年2月20日

深度学习之图像超分辨重建技术

深度学习之图像超分辨重建技术

机器学习研究会

12+阅读 · 2018年3月24日

一文概览基于深度学习的超分辨率重建架构

一文概览基于深度学习的超分辨率重建架构

论智

23+阅读 · 2018年3月24日

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

机器之心

12+阅读 · 2017年11月7日

全光无滤波可调可切换超宽带脉冲产生的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于硅光微环调制器的超宽带脉冲产生与调制技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

小快拍数下宽带信号超分辨测向性能的多元优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

斜模式高光谱成像的超分辨率重建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于波内频率调制的音色模型研究以及在单通道音源分离中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于混沌信号的超宽带收发机关键技术的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于超像素稀疏表示的图像超分辨率方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

智能视频监控中图像超分辨率重建关键技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

高亮度高平坦度超连续谱光源的宽带光纤腔衰荡传感方法及其应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于受激布里渊散射增强效应的超高分辨率光谱分析方法及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

Ultra Flash: Scaling Real-Time Streaming Video Generation to High Resolutions

Arxiv

0+阅读 · 6月15日

Sensitivity Analysis of Generative Spatial Audio Metrics: A Study on Responsiveness, Smoothness, and Symmetry

Arxiv

0+阅读 · 6月10日

One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation

Arxiv

0+阅读 · 6月9日

Assessing True Generalisability of Audio-Visual Speech Recognisers

Arxiv

0+阅读 · 6月5日

Model-agnostic super-resolution in high dimensions

Arxiv

0+阅读 · 5月20日

Taming Real-World Space-Time Video Super-Resolution with One-Step Diffusion

Arxiv

0+阅读 · 5月19日

A Survey of Large Audio Language Models: Generalization, Trustworthiness, and Outlook

Arxiv

0+阅读 · 5月18日

CIS-BWE: Chaos-Informed Speech Bandwidth Extension

Arxiv

0+阅读 · 5月15日

Fast Image Super-Resolution via Consistency Rectified Flow

Arxiv

0+阅读 · 5月12日

Stage-adaptive audio diffusion modeling

Arxiv

0+阅读 · 5月6日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

8+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

5+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

7+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

10+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

6+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

深度学习视频超分辨率综述

深度学习视频超分辨率综述

专知会员服务

14+阅读 · 2025年6月5日

遥感图像超分辨率技术进展：综合综述

遥感图像超分辨率技术进展：综合综述

专知会员服务

12+阅读 · 2025年5月31日

【ETHZ博士论文】超越像素深度：通过深度学习增强超分辨率技术，198页pdf

【ETHZ博士论文】超越像素深度：通过深度学习增强超分辨率技术，198页pdf

专知会员服务

25+阅读 · 2024年11月21日

扩散模型图像超分辨率等综述

扩散模型图像超分辨率等综述

专知会员服务

25+阅读 · 2024年1月2日

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

大“火”的扩散模型综述又一弹！UCF等《视觉扩散模型》综述，20页pdf详述三种通用的扩散建模框架

专知会员服务

87+阅读 · 2022年9月13日

扩散模型综述又一弹！西湖大学李子青等最新《生成式扩散模型》综述，18页pdf详解扩散模型基础、方法体系和应用

扩散模型综述又一弹！西湖大学李子青等最新《生成式扩散模型》综述，18页pdf详解扩散模型基础、方法体系和应用

专知会员服务

121+阅读 · 2022年9月9日

基于深度学习的视频超分辨率重构进展综述

基于深度学习的视频超分辨率重构进展综述

专知会员服务

19+阅读 · 2022年3月7日

最新《深度学习视频超分》综述论文，30页pdf，Video Super Resolution Based on Deep Learning: A comprehensive survey

最新《深度学习视频超分》综述论文，30页pdf，Video Super Resolution Based on Deep Learning: A comprehensive survey

专知会员服务

25+阅读 · 2020年7月28日

【超分辨率| 2019最新综述】图像超分辨率的深度学习，附PDF（Deep Learning for Image Super-resolution: A Survey）

【超分辨率| 2019最新综述】图像超分辨率的深度学习，附PDF（Deep Learning for Image Super-resolution: A Survey）

专知会员服务

60+阅读 · 2019年11月16日

【超分辨率| 2019最新综述】进入超分辨率的深度旅程：一项调查，附PDF（A Deep Journey into Super-resolution: A survey）

【超分辨率| 2019最新综述】进入超分辨率的深度旅程：一项调查，附PDF（A Deep Journey into Super-resolution: A survey）

专知会员服务

37+阅读 · 2019年11月16日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

推荐！《高超音速的影响：高超音速武器的作战影响和美国战略形势的变化》美国国防大学联合部队参谋学院120页报告

推荐！《高超音速的影响：高超音速武器的作战影响和美国战略形势的变化》美国国防大学联合部队参谋学院120页报告

专知

22+阅读 · 2022年10月23日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

CVPR 2019 | 神奇的超分辨率算法DPSR：应对图像模糊降质

CVPR 2019 | 神奇的超分辨率算法DPSR：应对图像模糊降质

计算机视觉life

16+阅读 · 2019年4月25日

基于深度学习的图像超分辨率最新进展与趋势【附PDF】

基于深度学习的图像超分辨率最新进展与趋势【附PDF】

人工智能前沿讲习班

15+阅读 · 2019年2月27日

从网络设计到实际应用，深度学习图像超分辨率综述

从网络设计到实际应用，深度学习图像超分辨率综述

机器之心

25+阅读 · 2019年2月24日

深度学习图像超分辨率最新综述：从模型到应用

深度学习图像超分辨率最新综述：从模型到应用

炼数成金订阅号

65+阅读 · 2019年2月20日

最新23页《深度学习图像超分辨率应用综述》论文，带你全面了解深度学习超分方法（附下载）

最新23页《深度学习图像超分辨率应用综述》论文，带你全面了解深度学习超分方法（附下载）

专知

43+阅读 · 2019年2月20日

深度学习之图像超分辨重建技术

深度学习之图像超分辨重建技术

机器学习研究会

12+阅读 · 2018年3月24日

一文概览基于深度学习的超分辨率重建架构

一文概览基于深度学习的超分辨率重建架构

论智

23+阅读 · 2018年3月24日

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

学界 | 深度学习在单图像超分辨率上的应用：SRCNN、Perceptual loss、SRResNet

机器之心

12+阅读 · 2017年11月7日

相关论文

Ultra Flash: Scaling Real-Time Streaming Video Generation to High Resolutions

Arxiv

0+阅读 · 6月15日

Sensitivity Analysis of Generative Spatial Audio Metrics: A Study on Responsiveness, Smoothness, and Symmetry

Arxiv

0+阅读 · 6月10日

One-Step Residual Shifting Diffusion for Image Super-Resolution via Distillation

Arxiv

0+阅读 · 6月9日

Assessing True Generalisability of Audio-Visual Speech Recognisers

Arxiv

0+阅读 · 6月5日

Model-agnostic super-resolution in high dimensions

Arxiv

0+阅读 · 5月20日

Taming Real-World Space-Time Video Super-Resolution with One-Step Diffusion

Arxiv

0+阅读 · 5月19日

A Survey of Large Audio Language Models: Generalization, Trustworthiness, and Outlook

Arxiv

0+阅读 · 5月18日

CIS-BWE: Chaos-Informed Speech Bandwidth Extension

Arxiv

0+阅读 · 5月15日

Fast Image Super-Resolution via Consistency Rectified Flow

Arxiv

0+阅读 · 5月12日

Stage-adaptive audio diffusion modeling

Arxiv

0+阅读 · 5月6日

相关基金

全光无滤波可调可切换超宽带脉冲产生的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于硅光微环调制器的超宽带脉冲产生与调制技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

小快拍数下宽带信号超分辨测向性能的多元优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

斜模式高光谱成像的超分辨率重建方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于波内频率调制的音色模型研究以及在单通道音源分离中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于混沌信号的超宽带收发机关键技术的研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于超像素稀疏表示的图像超分辨率方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

智能视频监控中图像超分辨率重建关键技术研究

国家自然科学基金

4+阅读 · 2014年12月31日

高亮度高平坦度超连续谱光源的宽带光纤腔衰荡传感方法及其应用研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于受激布里渊散射增强效应的超高分辨率光谱分析方法及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员