音素论文 - 专知

会员服务 ·

A Fusion-Aware Two-Stage Framework for Mispronunciation Detection and Diagnosis in Low-Resource Modern Standard Arabic

Arxiv

0+阅读 · 6月23日

Phonemes to the Rescue: Multilingual Tokenization Based on International Phonetic Alphabet

Arxiv

0+阅读 · 6月18日

Harf-Speech: A Clinically Aligned Framework for Arabic Phoneme-Level Speech Assessment

Arxiv

0+阅读 · 6月19日

Exploring Pre-training Benefits on Phoneme Addition through Fine-tuning in Speech Synthesis

Arxiv

0+阅读 · 6月18日

Time-Frequency Weighted Losses for Phoneme Reconstruction in DNN-Based Speech Enhancement

Arxiv

0+阅读 · 6月19日

ReNikud: Audio-Supervised Hebrew Grapheme-to-Phoneme Conversion

Arxiv

0+阅读 · 6月18日

CraBERT: Efficient Phoneme Encoder Pre-Training via Cascade Fusion of Subword Representations for Text-to-Speech

Arxiv

0+阅读 · 6月15日

Joycent: Diffusion-based Accent TTS without Accented Phone Prediction

Arxiv

0+阅读 · 6月15日

Probing Low Frame Rate Degradation in Neural Audio Codecs

Arxiv

0+阅读 · 6月15日

Stabilizing Short Duration Speaker Verification through Neural Re-scoring with Hybrid Enrollment

Arxiv

0+阅读 · 6月15日

AP-GRPO: Anchor-Gated Phonetic Alignment with Policy Optimization for Pathological Speech Reconstruction

Arxiv

0+阅读 · 6月14日

ArtNet: A JEPA-Like Articulatory Predictive Framework for Robust Zero-Shot Phoneme Recognition

Arxiv

0+阅读 · 6月15日

Phonetically Explainable Speech Deepfake Detection

Arxiv

0+阅读 · 6月13日

Scaling Human and G2P Supervision for Robust Phonetic Transcription

Arxiv

0+阅读 · 6月14日

OLaPh: Optimal Language Phonemizer

Arxiv

0+阅读 · 6月12日

参考链接

微信扫码咨询专知VIP会员