DPDFNet: Boosting DeepFilterNet2 via Dual-Path RNN - 专知论文

会员服务 ·

0

路径 · 因果性 · RNN · 语音增强 · 单通道 ·

DPDFNet: Boosting DeepFilterNet2 via Dual-Path RNN

翻译：DPDFNet：通过双路径RNN增强DeepFilterNet2

Daniel Rika,Nino Sapir,Ido Gus

We present DPDFNet, a causal single-channel speech enhancement model that extends DeepFilterNet2 architecture with dual-path blocks in the encoder, strengthening long-range temporal and cross-band modeling while preserving the original enhancement framework. In addition, we demonstrate that adding a loss component to mitigate over-attenuation in the enhanced speech, combined with a fine-tuning phase tailored for "always-on" applications, leads to substantial improvements in overall model performance. To compare our proposed architecture with a variety of causal open-source models, we created a new evaluation set comprising long, low-SNR recordings in 12 languages across everyday noise scenarios, better reflecting real-world conditions than commonly used benchmarks. On this evaluation set, DPDFNet delivers superior performance to other causal open-source models, including some that are substantially larger and more computationally demanding. We also propose an holistic metric named PRISM, a composite, scale-normalized aggregate of intrusive and non-intrusive metrics, which demonstrates clear scalability with the number of dual-path blocks. We further demonstrate on-device feasibility by deploying DPDFNet on Ceva-NeuPro-Nano edge NPUs. Results indicate that DPDFNet-4, our second-largest model, achieves real-time performance on NPN32 and runs even faster on NPN64, confirming that state-of-the-art quality can be sustained within strict embedded power and latency constraints.

翻译：本文提出DPDFNet，一种因果性单通道语音增强模型，该模型通过在编码器中引入双路径模块扩展了DeepFilterNet2架构，在保持原有增强框架的同时强化了长时程时序与跨频带建模能力。此外，我们证明在损失函数中增加抑制语音过衰减的分量，并结合针对"常时运行"应用场景的微调阶段，能显著提升模型整体性能。为将所提架构与多种因果性开源模型进行对比，我们构建了包含12种语言、低信噪比长时录音的新评估数据集，其覆盖日常噪声场景，比常用基准测试更能反映真实环境。在该评估集上，DPDFNet的性能优于其他因果性开源模型，包括某些参数量显著更大、计算需求更高的模型。我们还提出名为PRISM的综合性指标，该指标通过对侵入式与非侵入式度量进行尺度归一化复合得到，其数值随双路径模块数量增加呈现明确的可扩展性。通过在Ceva-NeuPro-Nano边缘NPU上部署DPDFNet，我们进一步验证了其端侧部署可行性。结果表明，我们的第二大模型DPDFNet-4在NPN32上达到实时性能，在NPN64上运行速度更快，这证实了在严格的嵌入式功耗与延迟约束下仍可保持前沿的语音增强质量。

0

相关内容

【普林斯顿博士论文】在多样化资源受限硬件环境中增强深度神经网络，314页pdf

【普林斯顿博士论文】在多样化资源受限硬件环境中增强深度神经网络，314页pdf

专知会员服务

28+阅读 · 2024年3月4日

DNN中的凸优化如何理解？斯坦福博士论文《神经网络凸优化》，265页pdf全面阐述

DNN中的凸优化如何理解？斯坦福博士论文《神经网络凸优化》，265页pdf全面阐述

专知会员服务

66+阅读 · 2023年5月29日

《利用强化学习对深度神经网络形成对抗性样本攻击》2023最新83页论文

《利用强化学习对深度神经网络形成对抗性样本攻击》2023最新83页论文

专知会员服务

78+阅读 · 2023年5月11日

深度学习如何解决数学方程？四川大学最新《深度神经网络偏微分方程》综述，19页pdf阐述如何用DNN有效地解决PDE

深度学习如何解决数学方程？四川大学最新《深度神经网络偏微分方程》综述，19页pdf阐述如何用DNN有效地解决PDE

专知会员服务

64+阅读 · 2022年11月13日

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

专知会员服务

16+阅读 · 2022年3月17日

CNN/MLP/Transformer, 究竟谁行？中科大&微软实证三大网络结构公平比较，各有可取之处

专知会员服务

34+阅读 · 2021年9月18日

最新《深度学习时代的低光图像增强》综述论文，

最新《深度学习时代的低光图像增强》综述论文，

专知会员服务

38+阅读 · 2021年4月30日

【ICLR2021】先增强后进行卷积：梯度提升遇到图神经网络

专知会员服务

23+阅读 · 2021年1月23日

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

专知会员服务

29+阅读 · 2020年7月10日

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

专知会员服务

17+阅读 · 2019年12月24日

【KDD2020】更深的图神经网络，Towards Deeper Graph Neural Networks

【KDD2020】更深的图神经网络，Towards Deeper Graph Neural Networks

专知

45+阅读 · 2020年7月22日

基于深度神经网络的关键词提取，Keywords extraction with DNN

基于深度神经网络的关键词提取，Keywords extraction with DNN

专知

10+阅读 · 2020年5月7日

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

专知

45+阅读 · 2019年10月28日

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

专知

43+阅读 · 2019年7月10日

结合符号主义和深度学习，DeepMind提出新型端到端神经网络架构 PrediNet

结合符号主义和深度学习，DeepMind提出新型端到端神经网络架构 PrediNet

机器之心

12+阅读 · 2019年5月29日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

AI研习社

14+阅读 · 2018年2月17日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

详述DeepMind wavenet原理及其TensorFlow实现

详述DeepMind wavenet原理及其TensorFlow实现

深度学习每日摘要

12+阅读 · 2017年6月26日

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于深度卷积神经网络的多源遥感图像时空融合方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于单向链路时延的SCPS-TP双端双向拥塞控制模型与算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

动态稀疏双扩展信道下的多用户通信研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于经验模式分解和跳步-广义回归神经网络的地球定向参数预报

国家自然科学基金

0+阅读 · 2015年12月31日

异构微蜂窝网络中的D2D通信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于跨层网络编码感知的无线传感器网络节能路由协议研究

国家自然科学基金

0+阅读 · 2015年12月31日

高阶图像去噪模型的快速数值算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

色素上皮衍生因子（PEDF）及其受体家族调控COPD肺结构细胞异常凋亡与炎性损伤的机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

Dual-View Predictive Diffusion: Lightweight Speech Enhancement via Spectrogram-Image Synergy

Arxiv

0+阅读 · 1月31日

Do We Need EMA for Diffusion-Based Speech Enhancement? Toward a Magnitude-Preserving Network Architecture

Arxiv

0+阅读 · 1月29日

DND: Boosting Large Language Models with Dynamic Nested Depth

Arxiv

0+阅读 · 1月27日

EDM2SE: A Magnitude-Preserving Network Architecture for Diffusion-Based Speech Enhancement

Arxiv

0+阅读 · 1月26日

Multigrade Neural Network Approximation

Arxiv

0+阅读 · 1月23日

A Lightweight Fourier-based Network for Binaural Speech Enhancement with Spatial Cue Preservation

Arxiv

0+阅读 · 1月23日

Fast-ULCNet: A fast and ultra low complexity network for single-channel speech enhancement

Arxiv

0+阅读 · 1月21日

Bone-conduction Guided Multimodal Speech Enhancement with Conditional Diffusion Models

Arxiv

0+阅读 · 1月18日

Diffusion-based Frameworks for Unsupervised Speech Enhancement

Arxiv

0+阅读 · 1月14日

Enhancing LUT-based Deep Neural Networks Inference through Architecture and Connectivity Optimization

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

最新内容

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

专知会员服务

4+阅读 · 7月23日

《基于强化学习的自动化红队测试》

《基于强化学习的自动化红队测试》

专知会员服务

3+阅读 · 7月23日

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

专知会员服务

6+阅读 · 7月23日

“天降毒雾”：无人机如何使化学战重返乌克兰战场

“天降毒雾”：无人机如何使化学战重返乌克兰战场

专知会员服务

2+阅读 · 7月23日

伊朗不对称防空战略的演进

伊朗不对称防空战略的演进

专知会员服务

4+阅读 · 7月23日

对抗环境下超视距目标打击的情报支援

对抗环境下超视距目标打击的情报支援

专知会员服务

10+阅读 · 7月22日

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

《面向复杂地形下无人机跟踪地面机器人（UAV–UGV）的自适应多滤波器扩展卡尔曼滤波框架》

专知会员服务

4+阅读 · 7月22日

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

纵深侦察：大规模作战行动中远程侦察与监视之迫切需求

专知会员服务

8+阅读 · 7月22日

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

共享认知，分布式研判：复杂行动中的美国空军指挥控制（万字长文）

专知会员服务

10+阅读 · 7月22日

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

15+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

15+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

4+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

6+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

9+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

7+阅读 · 7月20日

相关VIP内容

【普林斯顿博士论文】在多样化资源受限硬件环境中增强深度神经网络，314页pdf

【普林斯顿博士论文】在多样化资源受限硬件环境中增强深度神经网络，314页pdf

专知会员服务

28+阅读 · 2024年3月4日

DNN中的凸优化如何理解？斯坦福博士论文《神经网络凸优化》，265页pdf全面阐述

DNN中的凸优化如何理解？斯坦福博士论文《神经网络凸优化》，265页pdf全面阐述

专知会员服务

66+阅读 · 2023年5月29日

《利用强化学习对深度神经网络形成对抗性样本攻击》2023最新83页论文

《利用强化学习对深度神经网络形成对抗性样本攻击》2023最新83页论文

专知会员服务

78+阅读 · 2023年5月11日

深度学习如何解决数学方程？四川大学最新《深度神经网络偏微分方程》综述，19页pdf阐述如何用DNN有效地解决PDE

深度学习如何解决数学方程？四川大学最新《深度神经网络偏微分方程》综述，19页pdf阐述如何用DNN有效地解决PDE

专知会员服务

64+阅读 · 2022年11月13日

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

【深度神经网络加速器的硬件近似技术综述】Hardware Approximate Techniques for Deep Neural Network Accelerators: A Survey

专知会员服务

16+阅读 · 2022年3月17日

CNN/MLP/Transformer, 究竟谁行？中科大&微软实证三大网络结构公平比较，各有可取之处

专知会员服务

34+阅读 · 2021年9月18日

最新《深度学习时代的低光图像增强》综述论文，

最新《深度学习时代的低光图像增强》综述论文，

专知会员服务

38+阅读 · 2021年4月30日

【ICLR2021】先增强后进行卷积：梯度提升遇到图神经网络

专知会员服务

23+阅读 · 2021年1月23日

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

借助几何先验知识促进深度神经网络：综述 | Boosting Deep Neural Networks with Geometrical Prior Knowledge: A Survey

专知会员服务

29+阅读 · 2020年7月10日

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

专知会员服务

17+阅读 · 2019年12月24日

热门VIP内容

开通专知VIP会员享更多权益服务

《基于强化学习的自动化红队测试》

“天降毒雾”：无人机如何使化学战重返乌克兰战场

《远程自主系统可扩展态势感知的解决方案》32页2026最新报告

《下一代无人机-卫星通信：人工智能创新与未来展望》32页长综述

相关资讯

【KDD2020】更深的图神经网络，Towards Deeper Graph Neural Networks

【KDD2020】更深的图神经网络，Towards Deeper Graph Neural Networks

专知

45+阅读 · 2020年7月22日

基于深度神经网络的关键词提取，Keywords extraction with DNN

基于深度神经网络的关键词提取，Keywords extraction with DNN

专知

10+阅读 · 2020年5月7日

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

专知

45+阅读 · 2019年10月28日

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

【综述】基于深度学习的图像数据增强方法最新进展，48页论文带你快速了解领域进展

专知

43+阅读 · 2019年7月10日

结合符号主义和深度学习，DeepMind提出新型端到端神经网络架构 PrediNet

结合符号主义和深度学习，DeepMind提出新型端到端神经网络架构 PrediNet

机器之心

12+阅读 · 2019年5月29日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

代码+实战：TensorFlow Estimator of Deep CTR —— DeepFM/NFM/AFM/FNN/PNN

AI研习社

14+阅读 · 2018年2月17日

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

Deep Image Prior：使用随机初始化神经网络实现图片去噪、超分辨率和修补

全球人工智能

12+阅读 · 2017年12月3日

详述DeepMind wavenet原理及其TensorFlow实现

详述DeepMind wavenet原理及其TensorFlow实现

深度学习每日摘要

12+阅读 · 2017年6月26日

相关论文

Dual-View Predictive Diffusion: Lightweight Speech Enhancement via Spectrogram-Image Synergy

Arxiv

0+阅读 · 1月31日

Do We Need EMA for Diffusion-Based Speech Enhancement? Toward a Magnitude-Preserving Network Architecture

Arxiv

0+阅读 · 1月29日

DND: Boosting Large Language Models with Dynamic Nested Depth

Arxiv

0+阅读 · 1月27日

EDM2SE: A Magnitude-Preserving Network Architecture for Diffusion-Based Speech Enhancement

Arxiv

0+阅读 · 1月26日

Multigrade Neural Network Approximation

Arxiv

0+阅读 · 1月23日

A Lightweight Fourier-based Network for Binaural Speech Enhancement with Spatial Cue Preservation

Arxiv

0+阅读 · 1月23日

Fast-ULCNet: A fast and ultra low complexity network for single-channel speech enhancement

Arxiv

0+阅读 · 1月21日

Bone-conduction Guided Multimodal Speech Enhancement with Conditional Diffusion Models

Arxiv

0+阅读 · 1月18日

Diffusion-based Frameworks for Unsupervised Speech Enhancement

Arxiv

0+阅读 · 1月14日

Enhancing LUT-based Deep Neural Networks Inference through Architecture and Connectivity Optimization

Arxiv

0+阅读 · 1月14日

相关基金

软件定义网络（SDN）环境下基于机器学习的路由预规划研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于深度卷积神经网络的多源遥感图像时空融合方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于单向链路时延的SCPS-TP双端双向拥塞控制模型与算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

动态稀疏双扩展信道下的多用户通信研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于经验模式分解和跳步-广义回归神经网络的地球定向参数预报

国家自然科学基金

0+阅读 · 2015年12月31日

异构微蜂窝网络中的D2D通信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

基于跨层网络编码感知的无线传感器网络节能路由协议研究

国家自然科学基金

0+阅读 · 2015年12月31日

高阶图像去噪模型的快速数值算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

色素上皮衍生因子（PEDF）及其受体家族调控COPD肺结构细胞异常凋亡与炎性损伤的机制研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员