成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
音素
关注
0
综合
百科
VIP
热门
动态
论文
精华
VALLR: Visual ASR Language Model for Lip Reading
Arxiv
0+阅读 · 1月5日
Do Language Models Associate Sound with Meaning? A Multimodal Study of Sound Symbolism
Arxiv
0+阅读 · 2025年12月31日
ManchuTTS: Towards High-Quality Manchu Speech Synthesis via Flow Matching and Hierarchical Text Representation
Arxiv
0+阅读 · 2025年12月27日
ControlAudio: Tackling Text-Guided, Timing-Indicated and Intelligible Audio Generation via Progressive Diffusion Modeling
Arxiv
0+阅读 · 2025年12月25日
Phoneme-based speech recognition driven by large language models and sampling marginalization
Arxiv
0+阅读 · 2025年12月20日
MEGState: Phoneme Decoding from Magnetoencephalography Signals
Arxiv
0+阅读 · 2025年12月19日
DiTSinger: Scaling Singing Voice Synthesis with Diffusion Transformer and Implicit Alignment
Arxiv
0+阅读 · 2025年12月24日
Building Robust and Scalable Multilingual ASR for Indian Languages
Arxiv
0+阅读 · 2025年11月19日
Enhancing Quranic Learning: A Multimodal Deep Learning Approach for Arabic Phoneme Recognition
Arxiv
0+阅读 · 2025年11月21日
VSpeechLM: A Visual Speech Language Model for Visual Text-to-Speech Task
Arxiv
0+阅读 · 2025年11月27日
Why Isn't Relational Learning Taking Over the World?
Arxiv
0+阅读 · 2025年11月5日
MEGConformer: Conformer-Based MEG Decoder for Robust Speech and Phoneme Classification
Arxiv
0+阅读 · 2025年12月1日
Do Language Models Associate Sound with Meaning? A Multimodal Study of Sound Symbolism
Arxiv
0+阅读 · 2025年11月16日
Do Language Models Associate Sound with Meaning? A Multimodal Study of Sound Symbolism
Arxiv
0+阅读 · 2025年12月9日
Do Language Models Associate Sound with Meaning? A Multimodal Study of Sound Symbolism
Arxiv
0+阅读 · 2025年11月13日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top