Learning Vocal-Tract Area and Radiation with a Physics-Informed Webster Model - 专知论文

会员服务 ·

0

基于物理 · 辐射 · 合成 · 时域 · 数学 ·

Learning Vocal-Tract Area and Radiation with a Physics-Informed Webster Model

翻译：基于物理信息Webster模型的声道面积与辐射系数学习

Minhui Lu,Joshua D. Reiss

from arxiv, Accepted at IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP) 2026

We present a physics-informed voiced backend renderer for singing-voice synthesis. Given synthetic single-channel audio and a fund-amental--frequency trajectory, we train a time-domain Webster model as a physics-informed neural network to estimate an interpretable vocal-tract area function and an open-end radiation coefficient. Training enforces partial differential equation and boundary consistency; a lightweight DDSP path is used only to stabilize learning, while inference is purely physics-based. On sustained vowels (/a/, /i/, /u/), parameters rendered by an independent finite-difference time-domain Webster solver reproduce spectral envelopes competitively with a compact DDSP baseline and remain stable under changes in discretization, moderate source variations, and about ten percent pitch shifts. The in-graph waveform remains breathier than the reference, motivating periodicity-aware objectives and explicit glottal priors in future work.

翻译：本文提出了一种基于物理信息的歌唱合成有声后端渲染器。给定合成单通道音频与基频轨迹，我们将时域Webster模型作为物理信息神经网络进行训练，以估计可解释的声道面积函数与开口端辐射系数。训练过程强制满足偏微分方程与边界一致性；轻量级DDSP路径仅用于稳定学习过程，而推理则完全基于物理原理。在持续元音（/a/、/i/、/u/）测试中，通过独立有限差分时域Webster求解器渲染的参数所重构的频谱包络，在性能上可与紧凑型DDSP基线相竞争，且在离散化方式改变、适度声源变化及约百分之十音高偏移条件下仍保持稳定。计算图内波形相较于参考音频仍存在更多气声成分，这为未来研究提出了周期性感知目标与显式声门先验的改进方向。

0

相关内容

基于物理

【博士论文】拓扑空间上的信号处理与学习

【博士论文】拓扑空间上的信号处理与学习

专知会员服务

31+阅读 · 2024年3月12日

【博士论文】从噪声数据中深度学习的信息特征和示例的优先排序，94页pdf

【博士论文】从噪声数据中深度学习的信息特征和示例的优先排序，94页pdf

专知会员服务

32+阅读 · 2024年3月11日

基于物理信息的机器学习

专知会员服务

141+阅读 · 2021年11月21日

机器学习在信道建模中的应用综述

机器学习在信道建模中的应用综述

专知会员服务

29+阅读 · 2021年3月16日

【上海交通大学-张拳石】可解释CNN，Interpretable CNNs for Object Classification

【上海交通大学-张拳石】可解释CNN，Interpretable CNNs for Object Classification

专知会员服务

46+阅读 · 2020年3月13日

【Science论文】基于波的物理现象作为一种模拟递归神经网络（Wave physics as an analog recurrent neural network）

【Science论文】基于波的物理现象作为一种模拟递归神经网络（Wave physics as an analog recurrent neural network）

专知会员服务

12+阅读 · 2020年1月3日

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

专知会员服务

17+阅读 · 2019年12月24日

【NeurlPS2019论文强烈推荐】vGraph:联合社区检测和节点表示学习的生成模型，vGraph: A Generative Model for Joint Community Detection and Node Representational Learning

【NeurlPS2019论文强烈推荐】vGraph:联合社区检测和节点表示学习的生成模型，vGraph: A Generative Model for Joint Community Detection and Node Representational Learning

专知会员服务

30+阅读 · 2019年12月17日

【博士论文】音乐结构的人工神经网络建模：Modeling Musical Structure with Artificial Neural Networks

【博士论文】音乐结构的人工神经网络建模：Modeling Musical Structure with Artificial Neural Networks

专知会员服务

28+阅读 · 2019年11月26日

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

19+阅读 · 2019年10月22日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知

41+阅读 · 2020年3月25日

南京大学吴建鑫教授「卷积神经网络CNN」笔记，35页pdf初学者学习指南理解CNN数学原理

南京大学吴建鑫教授「卷积神经网络CNN」笔记，35页pdf初学者学习指南理解CNN数学原理

专知

11+阅读 · 2020年2月23日

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

专知

174+阅读 · 2019年10月28日

谷歌EfficientNet缩放模型，PyTorch实现登热榜

谷歌EfficientNet缩放模型，PyTorch实现登热榜

机器学习算法与Python学习

11+阅读 · 2019年6月4日

【ICASSP教程】深度生成模型在信号处理领域的应用（附116页PPT全文下载）

【ICASSP教程】深度生成模型在信号处理领域的应用（附116页PPT全文下载）

专知

16+阅读 · 2019年5月29日

【泡泡点云空间】基于八叉树的CNN与球形卷积核用于处理3D点云数据

【泡泡点云空间】基于八叉树的CNN与球形卷积核用于处理3D点云数据

泡泡机器人SLAM

10+阅读 · 2019年5月5日

使用RNN-Transducer进行语音识别建模【附PPT与视频资料】

使用RNN-Transducer进行语音识别建模【附PPT与视频资料】

人工智能前沿讲习班

74+阅读 · 2019年1月29日

【泡泡点云时空】SpiderCNN：利用参数化卷积滤波进行点集深度学习（ECCV2018-13）

【泡泡点云时空】SpiderCNN：利用参数化卷积滤波进行点集深度学习（ECCV2018-13）

泡泡机器人SLAM

10+阅读 · 2018年11月8日

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

论智

11+阅读 · 2018年10月9日

基于注意力机制的图卷积网络

基于注意力机制的图卷积网络

科技创新与创业

74+阅读 · 2017年11月8日

Underlay频谱共享方式下信号参数估计和调制识别的方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

有理小波理论在多途信号解析与水声网络设计中的应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于矩量法与渐近波形估计技术的动态海面宽带电磁散射特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于信道差异的物理层安全编码技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

使用GPU加速银道面尘埃辐射图像的高分辨率模拟与多参数反演

国家自然科学基金

0+阅读 · 2015年12月31日

面向光谱-空间特征集合的高光谱遥感影像度量学习与分类研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于广域多通道量测信号的低频振荡模态参数辨识与安全预警方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

波动方程全波形速度反演数值方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

信号时频分析与包络的数学模型

国家自然科学基金

1+阅读 · 2014年12月31日

辐射热传导问题的非重叠型区域分解并行算法

国家自然科学基金

0+阅读 · 2014年12月31日

Improving Channel Estimation via Multimodal Diffusion Models with Flow Matching

Arxiv

0+阅读 · 3月13日

Learning from Radio using Variational Quantum RF Sensing

Arxiv

0+阅读 · 3月10日

Scalable physics-informed deep generative model for solving forward and inverse stochastic differential equations

Arxiv

0+阅读 · 3月4日

Enhancing Physics-Informed Neural Networks with Domain-aware Fourier Features: Towards Improved Performance and Interpretable Results

Arxiv

0+阅读 · 3月3日

Evaluating CNN with Stacked Feature Representations and Audio Spectrogram Transformer Models for Sound Classification

Arxiv

0+阅读 · 2月23日

Towards reconstructing experimental sparse-view X-ray CT data with diffusion models

Arxiv

0+阅读 · 2月13日

BioME: A Resource-Efficient Bioacoustic Foundational Model for IoT Applications

Arxiv

0+阅读 · 2月10日

Physics-informed diffusion models in spectral space

Arxiv

0+阅读 · 2月10日

Performance Comparison of CNN and AST Models with Stacked Features for Environmental Sound Classification

Arxiv

0+阅读 · 2月10日

Physics-Informed Diffusion Models for Vehicle Speed Trajectory Generation

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

最新内容

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

专知会员服务

7+阅读 · 5月31日

比利时发布用于实时战场军事装备识别的离线人工智能系统

比利时发布用于实时战场军事装备识别的离线人工智能系统

专知会员服务

5+阅读 · 5月31日

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

专知会员服务

4+阅读 · 5月31日

超越网格：作战环境对炮兵的影响

超越网格：作战环境对炮兵的影响

专知会员服务

2+阅读 · 5月31日

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

专知会员服务

8+阅读 · 5月31日

综述 | 推理时控制：可信大语言模型的运行时治理全景

综述 | 推理时控制：可信大语言模型的运行时治理全景

专知会员服务

4+阅读 · 5月31日

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

6+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

7+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

7+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

7+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

19+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

10+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

11+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

10+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

14+阅读 · 5月29日

相关VIP内容

【博士论文】拓扑空间上的信号处理与学习

【博士论文】拓扑空间上的信号处理与学习

专知会员服务

31+阅读 · 2024年3月12日

【博士论文】从噪声数据中深度学习的信息特征和示例的优先排序，94页pdf

【博士论文】从噪声数据中深度学习的信息特征和示例的优先排序，94页pdf

专知会员服务

32+阅读 · 2024年3月11日

基于物理信息的机器学习

专知会员服务

141+阅读 · 2021年11月21日

机器学习在信道建模中的应用综述

机器学习在信道建模中的应用综述

专知会员服务

29+阅读 · 2021年3月16日

【上海交通大学-张拳石】可解释CNN，Interpretable CNNs for Object Classification

【上海交通大学-张拳石】可解释CNN，Interpretable CNNs for Object Classification

专知会员服务

46+阅读 · 2020年3月13日

【Science论文】基于波的物理现象作为一种模拟递归神经网络（Wave physics as an analog recurrent neural network）

【Science论文】基于波的物理现象作为一种模拟递归神经网络（Wave physics as an analog recurrent neural network）

专知会员服务

12+阅读 · 2020年1月3日

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

【机器学习论文推荐】EfficientNet:卷积神经网络的再思考模型缩放（EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks）

专知会员服务

17+阅读 · 2019年12月24日

【NeurlPS2019论文强烈推荐】vGraph:联合社区检测和节点表示学习的生成模型，vGraph: A Generative Model for Joint Community Detection and Node Representational Learning

【NeurlPS2019论文强烈推荐】vGraph:联合社区检测和节点表示学习的生成模型，vGraph: A Generative Model for Joint Community Detection and Node Representational Learning

专知会员服务

30+阅读 · 2019年12月17日

【博士论文】音乐结构的人工神经网络建模：Modeling Musical Structure with Artificial Neural Networks

【博士论文】音乐结构的人工神经网络建模：Modeling Musical Structure with Artificial Neural Networks

专知会员服务

28+阅读 · 2019年11月26日

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

Aspect-Oriented Syntax Network for Aspect-Based Sentiment Analysis，中山大学数据科学与计算机学院权小军教授，第八届全国社会媒体处理大会SMP2019

专知会员服务

19+阅读 · 2019年10月22日

热门VIP内容

开通专知VIP会员享更多权益服务

比利时发布用于实时战场军事装备识别的离线人工智能系统

超越网格：作战环境对炮兵的影响

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

相关资讯

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知

41+阅读 · 2020年3月25日

南京大学吴建鑫教授「卷积神经网络CNN」笔记，35页pdf初学者学习指南理解CNN数学原理

南京大学吴建鑫教授「卷积神经网络CNN」笔记，35页pdf初学者学习指南理解CNN数学原理

专知

11+阅读 · 2020年2月23日

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

【论文笔记】用于数据驱动交通预测的扩散卷积循环神经网络（DCRNN）

专知

174+阅读 · 2019年10月28日

谷歌EfficientNet缩放模型，PyTorch实现登热榜

谷歌EfficientNet缩放模型，PyTorch实现登热榜

机器学习算法与Python学习

11+阅读 · 2019年6月4日

【ICASSP教程】深度生成模型在信号处理领域的应用（附116页PPT全文下载）

【ICASSP教程】深度生成模型在信号处理领域的应用（附116页PPT全文下载）

专知

16+阅读 · 2019年5月29日

【泡泡点云空间】基于八叉树的CNN与球形卷积核用于处理3D点云数据

【泡泡点云空间】基于八叉树的CNN与球形卷积核用于处理3D点云数据

泡泡机器人SLAM

10+阅读 · 2019年5月5日

使用RNN-Transducer进行语音识别建模【附PPT与视频资料】

使用RNN-Transducer进行语音识别建模【附PPT与视频资料】

人工智能前沿讲习班

74+阅读 · 2019年1月29日

【泡泡点云时空】SpiderCNN：利用参数化卷积滤波进行点集深度学习（ECCV2018-13）

【泡泡点云时空】SpiderCNN：利用参数化卷积滤波进行点集深度学习（ECCV2018-13）

泡泡机器人SLAM

10+阅读 · 2018年11月8日

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

每日论文 | CV中深度学习涉及到的几何和不确定性；用深度学习分析气象；可自动调整模拟器参数的模型

论智

11+阅读 · 2018年10月9日

基于注意力机制的图卷积网络

基于注意力机制的图卷积网络

科技创新与创业

74+阅读 · 2017年11月8日

相关论文

Improving Channel Estimation via Multimodal Diffusion Models with Flow Matching

Arxiv

0+阅读 · 3月13日

Learning from Radio using Variational Quantum RF Sensing

Arxiv

0+阅读 · 3月10日

Scalable physics-informed deep generative model for solving forward and inverse stochastic differential equations

Arxiv

0+阅读 · 3月4日

Enhancing Physics-Informed Neural Networks with Domain-aware Fourier Features: Towards Improved Performance and Interpretable Results

Arxiv

0+阅读 · 3月3日

Evaluating CNN with Stacked Feature Representations and Audio Spectrogram Transformer Models for Sound Classification

Arxiv

0+阅读 · 2月23日

Towards reconstructing experimental sparse-view X-ray CT data with diffusion models

Arxiv

0+阅读 · 2月13日

BioME: A Resource-Efficient Bioacoustic Foundational Model for IoT Applications

Arxiv

0+阅读 · 2月10日

Physics-informed diffusion models in spectral space

Arxiv

0+阅读 · 2月10日

Performance Comparison of CNN and AST Models with Stacked Features for Environmental Sound Classification

Arxiv

0+阅读 · 2月10日

Physics-Informed Diffusion Models for Vehicle Speed Trajectory Generation

Arxiv

0+阅读 · 2月4日

相关基金

Underlay频谱共享方式下信号参数估计和调制识别的方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

有理小波理论在多途信号解析与水声网络设计中的应用研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于矩量法与渐近波形估计技术的动态海面宽带电磁散射特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于信道差异的物理层安全编码技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

使用GPU加速银道面尘埃辐射图像的高分辨率模拟与多参数反演

国家自然科学基金

0+阅读 · 2015年12月31日

面向光谱-空间特征集合的高光谱遥感影像度量学习与分类研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于广域多通道量测信号的低频振荡模态参数辨识与安全预警方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

波动方程全波形速度反演数值方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

信号时频分析与包络的数学模型

国家自然科学基金

1+阅读 · 2014年12月31日

辐射热传导问题的非重叠型区域分解并行算法

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员