In audio signal processing, learnable front-ends have shown strong performance across diverse tasks by optimizing task-specific representation. However, their parameters remain fixed once trained, lacking flexibility during inference and limiting robustness under dynamic complex acoustic environments. In this paper, we introduce a novel adaptive paradigm for audio front-ends that replaces static parameterization with a closed-loop neural controller. Specifically, we simplify the learnable front-end LEAF architecture and integrate a neural controller for adaptive representation via dynamically tuning Per-Channel Energy Normalization. The neural controller leverages both the current and the buffered past subband energies to enable input-dependent adaptation during inference. Experimental results on multiple audio classification tasks demonstrate that the proposed adaptive front-end consistently outperforms prior fixed and learnable front-ends under both clean and complex acoustic conditions. These results highlight neural adaptability as a promising direction for the next generation of audio front-ends.


翻译:在音频信号处理中,可学习前端通过优化任务特定表征,已在多种任务中展现出卓越性能。然而,其参数一旦训练完成即保持固定,在推理过程中缺乏灵活性,限制了在动态复杂声学环境下的鲁棒性。本文提出一种新颖的自适应音频前端范式,通过闭环神经控制器替代静态参数化。具体而言,我们简化了可学习前端LEAF架构,并集成神经控制器,通过动态调节通道能量归一化实现自适应表征。该神经控制器同时利用当前及缓存的过往子带能量,在推理过程中实现输入依赖的自适应调整。在多个音频分类任务上的实验结果表明,所提出的自适应前端在纯净及复杂声学条件下均持续优于先前的固定式与可学习前端。这些成果凸显了神经自适应能力作为新一代音频前端发展的前景方向。

0
下载
关闭预览

相关内容

【博士论文】面向开放式世界的鲁棒智能体
专知会员服务
23+阅读 · 2025年12月10日
【NTU博士论文】端到端鲁棒自动语音识别的最新进展
专知会员服务
12+阅读 · 2025年10月15日
【CMU博士论文】鲁棒大规模音频/视觉学习,309页pdf
专知会员服务
26+阅读 · 2023年8月14日
专知会员服务
26+阅读 · 2021年6月9日
专知会员服务
144+阅读 · 2021年3月17日
鲁棒模式识别研究进展
专知会员服务
41+阅读 · 2020年8月9日
语音信号处理:基本方法与前沿技术
AINLP
10+阅读 · 2020年10月14日
哈工大韩纪庆教授《语音信号处理(第3版)》出版
近期声学领域前沿论文(No. 3)
深度学习每日摘要
24+阅读 · 2019年3月31日
语音识别的前沿论文,看我们推荐的这4篇
人工智能前沿讲习班
26+阅读 · 2019年1月14日
基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】
人工智能前沿讲习班
27+阅读 · 2018年12月13日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 1月29日
VIP会员
相关VIP内容
【博士论文】面向开放式世界的鲁棒智能体
专知会员服务
23+阅读 · 2025年12月10日
【NTU博士论文】端到端鲁棒自动语音识别的最新进展
专知会员服务
12+阅读 · 2025年10月15日
【CMU博士论文】鲁棒大规模音频/视觉学习,309页pdf
专知会员服务
26+阅读 · 2023年8月14日
专知会员服务
26+阅读 · 2021年6月9日
专知会员服务
144+阅读 · 2021年3月17日
鲁棒模式识别研究进展
专知会员服务
41+阅读 · 2020年8月9日
相关资讯
语音信号处理:基本方法与前沿技术
AINLP
10+阅读 · 2020年10月14日
哈工大韩纪庆教授《语音信号处理(第3版)》出版
近期声学领域前沿论文(No. 3)
深度学习每日摘要
24+阅读 · 2019年3月31日
语音识别的前沿论文,看我们推荐的这4篇
人工智能前沿讲习班
26+阅读 · 2019年1月14日
基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】
人工智能前沿讲习班
27+阅读 · 2018年12月13日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员