Physics-Informed Neural Engine Sound Modeling with Differentiable Pulse-Train Synthesis - 专知论文

会员服务 ·

0

引擎 · 脉冲 · 合成 · 谐波 · 谐振 ·

Physics-Informed Neural Engine Sound Modeling with Differentiable Pulse-Train Synthesis

翻译：物理信息引导的神经引擎声音建模与可微分脉冲串合成

Robin Doerfler,Lonce Wyse

from arxiv, Revised version; to appear in the Proceedings of the 34th European Signal Processing Conference (EUSIPCO 2026)

Engine sounds originate from sequential exhaust pressure pulses rather than sustained harmonic oscillations. While neural synthesis methods typically aim to approximate the resulting spectral characteristics, we propose directly modeling the underlying pulse shapes and temporal structure. We present the Pulse-Train-Resonator (PTR) model, a differentiable synthesis architecture that generates engine audio as parameterized pulse trains aligned to engine firing patterns and propagates them through recursive Karplus-Strong resonators simulating exhaust acoustics. The architecture integrates physics-informed inductive biases including harmonic decay, thermodynamic pitch modulation, valve-dynamics envelopes, exhaust system resonances and derived engine operating modes such as throttle operation and Deceleration Fuel Cutoff (DFCO). Validated on three diverse engine types totaling 7.5 hours of audio, PTR achieves a 21% improvement in harmonic reconstruction and a 5.7% reduction in total loss over a harmonic-plus-noise baseline model, while providing interpretable parameters corresponding to physical phenomena. Complete code, model weights, and audio examples are openly available.

翻译：引擎声音源于连续的排气压力脉冲，而非持续的谐波振荡。虽然神经合成方法通常旨在近似最终的光谱特征，但我们提出直接对底层脉冲形状和时间结构进行建模。我们提出了脉冲串-谐振器（PTR）模型，这是一种可微分合成架构，可生成与引擎点火模式对齐的参数化脉冲串形式的引擎音频，并将这些脉冲通过模拟排气声学特性的递归Karplus-Strong谐振器传播。该架构集成了物理信息引导的归纳偏置，包括谐波衰减、热力学音调调制、气门动力学包络、排气系统共振以及派生的引擎运行模式，如节气门操作和减速断油（DFCO）。在三种不同类型引擎（总计7.5小时音频）上的验证表明，与谐波加噪声基线模型相比，PTR在谐波重建方面提升了21%，总损失降低了5.7%，同时提供了与物理现象相对应的可解释参数。完整代码、模型权重和音频示例均已公开提供。

0

相关内容

《量子隧穿认知神经网络在军民车辆识别与情感分析中的应用》最新论文

《量子隧穿认知神经网络在军民车辆识别与情感分析中的应用》最新论文

专知会员服务

21+阅读 · 2025年7月29日

基于脉冲神经网络的机器人智能控制研究进展

基于脉冲神经网络的机器人智能控制研究进展

专知会员服务

25+阅读 · 2024年9月15日

英伟达斯坦福CVPR2023等最新《去噪扩散模型：生成学习的大爆炸》教程，附300多页ppt

英伟达斯坦福CVPR2023等最新《去噪扩散模型：生成学习的大爆炸》教程，附300多页ppt

专知会员服务

54+阅读 · 2023年6月27日

《高压缩分支信道极化合成孔径雷达的理论与设计》2022最新180页博士论文，美国空军技术学院

《高压缩分支信道极化合成孔径雷达的理论与设计》2022最新180页博士论文，美国空军技术学院

专知会员服务

18+阅读 · 2022年10月22日

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

专知会员服务

41+阅读 · 2022年9月19日

【超越消息传递:图神经网络的物理启发范式】Beyond Message Passing: a Physics-Inspired Paradigm for Graph Neural Networks

【超越消息传递:图神经网络的物理启发范式】Beyond Message Passing: a Physics-Inspired Paradigm for Graph Neural Networks

专知会员服务

17+阅读 · 2022年5月10日

Nature. Mach. Intell. |军事科学院<基于图神经网络技术的转录因子调控网络建模>

Nature. Mach. Intell. |军事科学院<基于图神经网络技术的转录因子调控网络建模>

专知会员服务

12+阅读 · 2022年4月21日

微软《神经语音合成》综述论文，63页pdf530篇文献

微软《神经语音合成》综述论文，63页pdf530篇文献

专知会员服务

30+阅读 · 2021年7月3日

【Science论文】基于波的物理现象作为一种模拟递归神经网络（Wave physics as an analog recurrent neural network）

【Science论文】基于波的物理现象作为一种模拟递归神经网络（Wave physics as an analog recurrent neural network）

专知会员服务

12+阅读 · 2020年1月3日

【博士论文】音乐结构的人工神经网络建模：Modeling Musical Structure with Artificial Neural Networks

【博士论文】音乐结构的人工神经网络建模：Modeling Musical Structure with Artificial Neural Networks

专知会员服务

28+阅读 · 2019年11月26日

使用RNN-Transducer进行语音识别建模【附PPT与视频资料】

使用RNN-Transducer进行语音识别建模【附PPT与视频资料】

人工智能前沿讲习班

74+阅读 · 2019年1月29日

基于Tacotron模型的语音合成实践

基于Tacotron模型的语音合成实践

深度学习每日摘要

15+阅读 · 2018年12月25日

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

专知

11+阅读 · 2018年6月4日

ICASSP最佳学生论文：深度对抗声学模型训练框架

ICASSP最佳学生论文：深度对抗声学模型训练框架

专知

14+阅读 · 2018年4月28日

【好文解析】ICASSP最佳学生论文：深度对抗声学模型训练框架

【好文解析】ICASSP最佳学生论文：深度对抗声学模型训练框架

中国科学院自动化研究所

13+阅读 · 2018年4月28日

【论文推荐】最新5篇语音识别（ASR）相关论文—音频对抗样本、对抗性语音识别系统、声学模型、序列到序列、口语可理解性矫正

【论文推荐】最新5篇语音识别（ASR）相关论文—音频对抗样本、对抗性语音识别系统、声学模型、序列到序列、口语可理解性矫正

专知

14+阅读 · 2018年2月4日

【AAAI专题】论文分享：以生物可塑性为核心的类脑脉冲神经网络

【AAAI专题】论文分享：以生物可塑性为核心的类脑脉冲神经网络

中国科学院自动化研究所

15+阅读 · 2018年1月23日

脉冲神经网络，下一代机器学习？

脉冲神经网络，下一代机器学习？

专知

13+阅读 · 2018年1月13日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

一文看懂深度学习在语音合成&增强上的应用

一文看懂深度学习在语音合成&增强上的应用

数盟

11+阅读 · 2017年9月13日

基于仿生学的汽车后缘尾翼噪声机理及其控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多普勒调制复合字典匹配分解与重构的列车轴承声信号调理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于机械声场时空全息诊断模型的弱故障特征提取研究

国家自然科学基金

0+阅读 · 2015年12月31日

利用超导人工电磁微结构的非线性产生可调谐窄带太赫兹信号的研究

国家自然科学基金

0+阅读 · 2015年12月31日

脉冲式干扰下高超声速飞行器的有限时间状态受限控制

国家自然科学基金

0+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

8+阅读 · 2015年12月31日

脉冲星计时阵列中连续引力波探测和估计的研究

国家自然科学基金

0+阅读 · 2015年12月31日

精神压力下基于物理模型的变异语音生成机理探索及检测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于波导微环谐振腔的光控波束形成网络芯片的理论及制备研究

国家自然科学基金

0+阅读 · 2014年12月31日

信息物理系统动力学演化融合机制与行为建模研究

国家自然科学基金

0+阅读 · 2014年12月31日

Explicit Context-Driven Neural Acoustic Modeling for High-Fidelity RIR Generation

Arxiv

0+阅读 · 6月16日

Compressed Qubit Noise Spectroscopy: Piecewise-Linear Modeling and Rademacher Measurements

Arxiv

0+阅读 · 6月15日

Accelerating physics-informed neural networks for full waveform inversion using a hybrid quantum-classical finite-basis architecture

Arxiv

0+阅读 · 6月15日

A fully GPU-based workflow for building physics emulators of hypersonic flows

Arxiv

0+阅读 · 6月11日

From Physics to Representation: Audio Learning with Synthetic Pre-training via Procedural Generation

Arxiv

0+阅读 · 6月11日

Analysis-Driven Procedural Generation of an Engine Sound Dataset with Embedded Control Annotations

Arxiv

0+阅读 · 6月2日

Scalable neuromorphic computing from autonomous spiking dynamics in a clockless reconfigurable chip

Arxiv

0+阅读 · 5月15日

Aliasing-Free Neural Audio Synthesis

Arxiv

0+阅读 · 5月13日

Physics-Modeled Neural Networks

Arxiv

0+阅读 · 5月5日

PAVAS: Physics-Aware Video-to-Audio Synthesis

Arxiv

0+阅读 · 3月30日

VIP会员

文章信息

相关主题

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

1+阅读 · 今天15:03

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

0+阅读 · 今天14:31

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

0+阅读 · 今天14:29

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

12+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

7+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

8+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

12+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

21+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

10+阅读 · 6月17日

相关VIP内容

《量子隧穿认知神经网络在军民车辆识别与情感分析中的应用》最新论文

《量子隧穿认知神经网络在军民车辆识别与情感分析中的应用》最新论文

专知会员服务

21+阅读 · 2025年7月29日

基于脉冲神经网络的机器人智能控制研究进展

基于脉冲神经网络的机器人智能控制研究进展

专知会员服务

25+阅读 · 2024年9月15日

英伟达斯坦福CVPR2023等最新《去噪扩散模型：生成学习的大爆炸》教程，附300多页ppt

英伟达斯坦福CVPR2023等最新《去噪扩散模型：生成学习的大爆炸》教程，附300多页ppt

专知会员服务

54+阅读 · 2023年6月27日

《高压缩分支信道极化合成孔径雷达的理论与设计》2022最新180页博士论文，美国空军技术学院

《高压缩分支信道极化合成孔径雷达的理论与设计》2022最新180页博士论文，美国空军技术学院

专知会员服务

18+阅读 · 2022年10月22日

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

《神经语音合成》最新报告，微软亚研谭旭和台大李宏毅老师INTERSPEECH最新教程！96页ppt

专知会员服务

41+阅读 · 2022年9月19日

【超越消息传递:图神经网络的物理启发范式】Beyond Message Passing: a Physics-Inspired Paradigm for Graph Neural Networks

【超越消息传递:图神经网络的物理启发范式】Beyond Message Passing: a Physics-Inspired Paradigm for Graph Neural Networks

专知会员服务

17+阅读 · 2022年5月10日

Nature. Mach. Intell. |军事科学院<基于图神经网络技术的转录因子调控网络建模>

Nature. Mach. Intell. |军事科学院<基于图神经网络技术的转录因子调控网络建模>

专知会员服务

12+阅读 · 2022年4月21日

微软《神经语音合成》综述论文，63页pdf530篇文献

微软《神经语音合成》综述论文，63页pdf530篇文献

专知会员服务

30+阅读 · 2021年7月3日

【Science论文】基于波的物理现象作为一种模拟递归神经网络（Wave physics as an analog recurrent neural network）

【Science论文】基于波的物理现象作为一种模拟递归神经网络（Wave physics as an analog recurrent neural network）

专知会员服务

12+阅读 · 2020年1月3日

【博士论文】音乐结构的人工神经网络建模：Modeling Musical Structure with Artificial Neural Networks

【博士论文】音乐结构的人工神经网络建模：Modeling Musical Structure with Artificial Neural Networks

专知会员服务

28+阅读 · 2019年11月26日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

使用RNN-Transducer进行语音识别建模【附PPT与视频资料】

使用RNN-Transducer进行语音识别建模【附PPT与视频资料】

人工智能前沿讲习班

74+阅读 · 2019年1月29日

基于Tacotron模型的语音合成实践

基于Tacotron模型的语音合成实践

深度学习每日摘要

15+阅读 · 2018年12月25日

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

专知

11+阅读 · 2018年6月4日

ICASSP最佳学生论文：深度对抗声学模型训练框架

ICASSP最佳学生论文：深度对抗声学模型训练框架

专知

14+阅读 · 2018年4月28日

【好文解析】ICASSP最佳学生论文：深度对抗声学模型训练框架

【好文解析】ICASSP最佳学生论文：深度对抗声学模型训练框架

中国科学院自动化研究所

13+阅读 · 2018年4月28日

【论文推荐】最新5篇语音识别（ASR）相关论文—音频对抗样本、对抗性语音识别系统、声学模型、序列到序列、口语可理解性矫正

【论文推荐】最新5篇语音识别（ASR）相关论文—音频对抗样本、对抗性语音识别系统、声学模型、序列到序列、口语可理解性矫正

专知

14+阅读 · 2018年2月4日

【AAAI专题】论文分享：以生物可塑性为核心的类脑脉冲神经网络

【AAAI专题】论文分享：以生物可塑性为核心的类脑脉冲神经网络

中国科学院自动化研究所

15+阅读 · 2018年1月23日

脉冲神经网络，下一代机器学习？

脉冲神经网络，下一代机器学习？

专知

13+阅读 · 2018年1月13日

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

纵览轻量化卷积神经网络：SqueezeNet、MobileNet、ShuffleNet、Xception

机器之心

11+阅读 · 2018年1月8日

一文看懂深度学习在语音合成&增强上的应用

一文看懂深度学习在语音合成&增强上的应用

数盟

11+阅读 · 2017年9月13日

相关论文

Explicit Context-Driven Neural Acoustic Modeling for High-Fidelity RIR Generation

Arxiv

0+阅读 · 6月16日

Compressed Qubit Noise Spectroscopy: Piecewise-Linear Modeling and Rademacher Measurements

Arxiv

0+阅读 · 6月15日

Accelerating physics-informed neural networks for full waveform inversion using a hybrid quantum-classical finite-basis architecture

Arxiv

0+阅读 · 6月15日

A fully GPU-based workflow for building physics emulators of hypersonic flows

Arxiv

0+阅读 · 6月11日

From Physics to Representation: Audio Learning with Synthetic Pre-training via Procedural Generation

Arxiv

0+阅读 · 6月11日

Analysis-Driven Procedural Generation of an Engine Sound Dataset with Embedded Control Annotations

Arxiv

0+阅读 · 6月2日

Scalable neuromorphic computing from autonomous spiking dynamics in a clockless reconfigurable chip

Arxiv

0+阅读 · 5月15日

Aliasing-Free Neural Audio Synthesis

Arxiv

0+阅读 · 5月13日

Physics-Modeled Neural Networks

Arxiv

0+阅读 · 5月5日

PAVAS: Physics-Aware Video-to-Audio Synthesis

Arxiv

0+阅读 · 3月30日

相关基金

基于仿生学的汽车后缘尾翼噪声机理及其控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于多普勒调制复合字典匹配分解与重构的列车轴承声信号调理研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于机械声场时空全息诊断模型的弱故障特征提取研究

国家自然科学基金

0+阅读 · 2015年12月31日

利用超导人工电磁微结构的非线性产生可调谐窄带太赫兹信号的研究

国家自然科学基金

0+阅读 · 2015年12月31日

脉冲式干扰下高超声速飞行器的有限时间状态受限控制

国家自然科学基金

0+阅读 · 2015年12月31日

基于虚拟原型的信息物理融合系统高效可信构造研究

国家自然科学基金

8+阅读 · 2015年12月31日

脉冲星计时阵列中连续引力波探测和估计的研究

国家自然科学基金

0+阅读 · 2015年12月31日

精神压力下基于物理模型的变异语音生成机理探索及检测方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于波导微环谐振腔的光控波束形成网络芯片的理论及制备研究

国家自然科学基金

0+阅读 · 2014年12月31日

信息物理系统动力学演化融合机制与行为建模研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员