Sound Event Detection with Boundary-Aware Optimization and Inference - 专知论文

会员服务 ·

0

事件 · 事件检测 · 时序 · 标注 · 后处理 ·

Sound Event Detection with Boundary-Aware Optimization and Inference

翻译：基于边界感知优化与推理的声音事件检测

Florian Schmid,Chi Ian Tang,Sanjeel Parekh,Vamsi Krishna Ithapu,Juan Azcarreta Ortiz,Giacomo Ferroni,Yijun Qian,Arnoldas Jasonas,Cosmin Frateanu,Camilla Clark,Gerhard Widmer,Çağdaş Bilen

from arxiv, Submitted to IEEE Signal Processing Letters

Temporal detection problems appear in many fields including time-series estimation, activity recognition and sound event detection (SED). In this work, we propose a new approach to temporal event modeling by explicitly modeling event onsets and offsets, and by introducing boundary-aware optimization and inference strategies that substantially enhance temporal event detection. The presented methodology incorporates new temporal modeling layers - Recurrent Event Detection (RED) and Event Proposal Network (EPN) - which, together with tailored loss functions, enable more effective and precise temporal event detection. We evaluate the proposed method in the SED domain using a subset of the temporally-strongly annotated portion of AudioSet. Experimental results show that our approach not only outperforms traditional frame-wise SED models with state-of-the-art post-processing, but also removes the need for post-processing hyperparameter tuning, and scales to achieve new state-of-the-art performance across all AudioSet Strong classes.

翻译：时序检测问题广泛存在于时间序列估计、活动识别及声音事件检测等多个领域。本文提出一种新的时序事件建模方法，通过显式建模事件起始点与终止点，并引入边界感知的优化与推理策略，显著提升了时序事件检测性能。该方法整合了新型时序建模层——循环事件检测网络与事件提议网络，结合定制化的损失函数，实现了更高效、更精确的时序事件检测。我们在声音事件检测领域使用AudioSet数据集中具有强时序标注的子集对所提方法进行评估。实验结果表明，该方法不仅优于采用最先进后处理的传统逐帧声音事件检测模型，而且无需进行后处理超参数调优，并在所有AudioSet强标注类别上实现了新的最优性能。

0

相关内容

人工智能与战场态势感知：声音检测

人工智能与战场态势感知：声音检测

专知会员服务

28+阅读 · 2025年4月3日

ACL 2022 | 基于事理图谱增强的BERT模型的事件预测

ACL 2022 | 基于事理图谱增强的BERT模型的事件预测

专知会员服务

44+阅读 · 2022年5月30日

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知会员服务

36+阅读 · 2022年2月7日

TPAMI2022 || 基于图神经网络实现强化的、增量和跨语言社会事件检测

TPAMI2022 || 基于图神经网络实现强化的、增量和跨语言社会事件检测

专知会员服务

35+阅读 · 2022年2月7日

事件图谱的构建、推理与应用

专知会员服务

129+阅读 · 2021年6月12日

百度事件图谱技术与应用

百度事件图谱技术与应用

专知会员服务

59+阅读 · 2020年12月30日

事件知识图谱构建技术与应用综述

事件知识图谱构建技术与应用综述

专知会员服务

154+阅读 · 2020年8月6日

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

专知会员服务

68+阅读 · 2020年7月21日

【KDD2019|讲座推荐】假设检验与统计声音模式挖掘：Hypothesis Testing and Statistically-sound Pattern Mining

【KDD2019|讲座推荐】假设检验与统计声音模式挖掘：Hypothesis Testing and Statistically-sound Pattern Mining

专知会员服务

22+阅读 · 2019年12月6日

【元学习 | 论文】元学习与动态记忆为基础的原型网络的小样本突发事件检测，浙江大学，阿里巴巴

【元学习 | 论文】元学习与动态记忆为基础的原型网络的小样本突发事件检测，浙江大学，阿里巴巴

专知会员服务

57+阅读 · 2019年11月21日

事件知识图谱构建技术与应用综述

事件知识图谱构建技术与应用综述

专知

25+阅读 · 2020年8月6日

事件知识图谱构建研究进展与趋势

事件知识图谱构建研究进展与趋势

THU数据派

99+阅读 · 2019年12月11日

论文浅尝 | 基于事理图谱的脚本事件预测

论文浅尝 | 基于事理图谱的脚本事件预测

开放知识图谱

10+阅读 · 2019年12月10日

论文浅尝 | 采用多层注意力机制的事件检测

论文浅尝 | 采用多层注意力机制的事件检测

开放知识图谱

24+阅读 · 2019年8月24日

语音关键词检测方法综述【附PPT与视频资料】

语音关键词检测方法综述【附PPT与视频资料】

人工智能前沿讲习班

10+阅读 · 2019年2月2日

综述 | 事件抽取及推理 (下)

综述 | 事件抽取及推理 (下)

开放知识图谱

38+阅读 · 2019年1月14日

语音识别的前沿论文，看我们推荐的这4篇

语音识别的前沿论文，看我们推荐的这4篇

人工智能前沿讲习班

26+阅读 · 2019年1月14日

边缘计算应用：传感数据异常实时检测算法

边缘计算应用：传感数据异常实时检测算法

计算机研究与发展

11+阅读 · 2018年4月10日

【论文推荐】最新6篇目标检测相关论文—场景文本检测、显著对象、语义知识转移、混合监督目标检测、域自适应、车牌识别

【论文推荐】最新6篇目标检测相关论文—场景文本检测、显著对象、语义知识转移、混合监督目标检测、域自适应、车牌识别

专知

19+阅读 · 2018年3月16日

实战｜手把手教你实现图象边缘检测！

实战｜手把手教你实现图象边缘检测！

全球人工智能

10+阅读 · 2018年1月19日

水声信号检测与识别中信号处理和特征约简的新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂运动场景视频大数据中异常事件检测研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向事件检测的感知数据处理方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于时序相似性的机场噪声监测点交互预测

国家自然科学基金

1+阅读 · 2015年12月31日

基于声表面波编码器件激励的高精度事件计时测量方法的研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

融合目标感知与对比度的图像和视频显著性检测技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向微博数据的位置相关事件检测和时空异常聚类模式挖掘研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向事件分析的信息意图检测、建模与群体意图推理技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

Score-Based Change-Point Detection and Region Localization for Spatio-Temporal Point Processes

Arxiv

0+阅读 · 2月4日

Location-Oriented Sound Event Localization and Detection with Spatial Mapping and Regression Localization

Arxiv

0+阅读 · 1月30日

ToS: A Team of Specialists ensemble framework for Stereo Sound Event Localization and Detection with distance estimation in Video

Arxiv

0+阅读 · 1月24日

Sound event localization and classification using WASN in Outdoor Environment

Arxiv

0+阅读 · 1月24日

Event-based Heterogeneous Information Processing for Online Vision-based Obstacle Detection and Localization

Arxiv

0+阅读 · 1月19日

Prediction Intervals for Interim Events in Randomized Clinical Trials with Time-to-Event Endpoints

Arxiv

0+阅读 · 1月15日

Data-Driven Feature Tracking for Event Cameras With and Without Frames

Arxiv

0+阅读 · 1月15日

Lightweight Resolution-Aware Audio Deepfake Detection via Cross-Scale Attention and Consistency Learning

Arxiv

0+阅读 · 1月10日

Fast Mining and Dynamic Time-to-Event Prediction over Multi-sensor Data Streams

Arxiv

0+阅读 · 1月8日

LTLBench: Towards Benchmarks for Evaluating Temporal Reasoning in Large Language Models

Arxiv

0+阅读 · 1月5日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 21分钟前

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 23分钟前

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

2+阅读 · 35分钟前

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 46分钟前

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 55分钟前

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

2+阅读 · 59分钟前

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

6+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

人工智能与战场态势感知：声音检测

人工智能与战场态势感知：声音检测

专知会员服务

28+阅读 · 2025年4月3日

ACL 2022 | 基于事理图谱增强的BERT模型的事件预测

ACL 2022 | 基于事理图谱增强的BERT模型的事件预测

专知会员服务

44+阅读 · 2022年5月30日

多语言语音识别声学模型建模方法最新进展

多语言语音识别声学模型建模方法最新进展

专知会员服务

36+阅读 · 2022年2月7日

TPAMI2022 || 基于图神经网络实现强化的、增量和跨语言社会事件检测

TPAMI2022 || 基于图神经网络实现强化的、增量和跨语言社会事件检测

专知会员服务

35+阅读 · 2022年2月7日

事件图谱的构建、推理与应用

专知会员服务

129+阅读 · 2021年6月12日

百度事件图谱技术与应用

百度事件图谱技术与应用

专知会员服务

59+阅读 · 2020年12月30日

事件知识图谱构建技术与应用综述

事件知识图谱构建技术与应用综述

专知会员服务

154+阅读 · 2020年8月6日

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

最新《大数据时代事件预测》综述论文，40页pdf，Emory 大学

专知会员服务

68+阅读 · 2020年7月21日

【KDD2019|讲座推荐】假设检验与统计声音模式挖掘：Hypothesis Testing and Statistically-sound Pattern Mining

【KDD2019|讲座推荐】假设检验与统计声音模式挖掘：Hypothesis Testing and Statistically-sound Pattern Mining

专知会员服务

22+阅读 · 2019年12月6日

【元学习 | 论文】元学习与动态记忆为基础的原型网络的小样本突发事件检测，浙江大学，阿里巴巴

【元学习 | 论文】元学习与动态记忆为基础的原型网络的小样本突发事件检测，浙江大学，阿里巴巴

专知会员服务

57+阅读 · 2019年11月21日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

事件知识图谱构建技术与应用综述

事件知识图谱构建技术与应用综述

专知

25+阅读 · 2020年8月6日

事件知识图谱构建研究进展与趋势

事件知识图谱构建研究进展与趋势

THU数据派

99+阅读 · 2019年12月11日

论文浅尝 | 基于事理图谱的脚本事件预测

论文浅尝 | 基于事理图谱的脚本事件预测

开放知识图谱

10+阅读 · 2019年12月10日

论文浅尝 | 采用多层注意力机制的事件检测

论文浅尝 | 采用多层注意力机制的事件检测

开放知识图谱

24+阅读 · 2019年8月24日

语音关键词检测方法综述【附PPT与视频资料】

语音关键词检测方法综述【附PPT与视频资料】

人工智能前沿讲习班

10+阅读 · 2019年2月2日

综述 | 事件抽取及推理 (下)

综述 | 事件抽取及推理 (下)

开放知识图谱

38+阅读 · 2019年1月14日

语音识别的前沿论文，看我们推荐的这4篇

语音识别的前沿论文，看我们推荐的这4篇

人工智能前沿讲习班

26+阅读 · 2019年1月14日

边缘计算应用：传感数据异常实时检测算法

边缘计算应用：传感数据异常实时检测算法

计算机研究与发展

11+阅读 · 2018年4月10日

【论文推荐】最新6篇目标检测相关论文—场景文本检测、显著对象、语义知识转移、混合监督目标检测、域自适应、车牌识别

【论文推荐】最新6篇目标检测相关论文—场景文本检测、显著对象、语义知识转移、混合监督目标检测、域自适应、车牌识别

专知

19+阅读 · 2018年3月16日

实战｜手把手教你实现图象边缘检测！

实战｜手把手教你实现图象边缘检测！

全球人工智能

10+阅读 · 2018年1月19日

相关论文

Score-Based Change-Point Detection and Region Localization for Spatio-Temporal Point Processes

Arxiv

0+阅读 · 2月4日

Location-Oriented Sound Event Localization and Detection with Spatial Mapping and Regression Localization

Arxiv

0+阅读 · 1月30日

ToS: A Team of Specialists ensemble framework for Stereo Sound Event Localization and Detection with distance estimation in Video

Arxiv

0+阅读 · 1月24日

Sound event localization and classification using WASN in Outdoor Environment

Arxiv

0+阅读 · 1月24日

Event-based Heterogeneous Information Processing for Online Vision-based Obstacle Detection and Localization

Arxiv

0+阅读 · 1月19日

Prediction Intervals for Interim Events in Randomized Clinical Trials with Time-to-Event Endpoints

Arxiv

0+阅读 · 1月15日

Data-Driven Feature Tracking for Event Cameras With and Without Frames

Arxiv

0+阅读 · 1月15日

Lightweight Resolution-Aware Audio Deepfake Detection via Cross-Scale Attention and Consistency Learning

Arxiv

0+阅读 · 1月10日

Fast Mining and Dynamic Time-to-Event Prediction over Multi-sensor Data Streams

Arxiv

0+阅读 · 1月8日

LTLBench: Towards Benchmarks for Evaluating Temporal Reasoning in Large Language Models

Arxiv

0+阅读 · 1月5日

相关基金

水声信号检测与识别中信号处理和特征约简的新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂运动场景视频大数据中异常事件检测研究

国家自然科学基金

2+阅读 · 2015年12月31日

面向事件检测的感知数据处理方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于时序相似性的机场噪声监测点交互预测

国家自然科学基金

1+阅读 · 2015年12月31日

基于声表面波编码器件激励的高精度事件计时测量方法的研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

融合目标感知与对比度的图像和视频显著性检测技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向微博数据的位置相关事件检测和时空异常聚类模式挖掘研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向事件分析的信息意图检测、建模与群体意图推理技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员