成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
语音生成
关注
0
综合
百科
VIP
热门
动态
论文
精华
CLARITY: Contextual Linguistic Adaptation and Accent Retrieval for Dual-Bias Mitigation in Text-to-Speech Generation
Arxiv
0+阅读 · 2月17日
GSRM: Generative Speech Reward Model for Speech RLHF
Arxiv
0+阅读 · 2月14日
TriniMark: A Robust Generative Speech Watermarking Method for Trinity-Level Traceability
Arxiv
0+阅读 · 2月15日
A Scalable Pipeline for Enabling Non-Verbal Speech Generation and Understanding
Arxiv
0+阅读 · 1月13日
Frame-Stacked Local Transformers For Efficient Multi-Codebook Speech Generation
Arxiv
0+阅读 · 1月22日
ParaMETA: Towards Learning Disentangled Paralinguistic Speaking Styles Representations from Speech
Arxiv
0+阅读 · 1月18日
Rethinking Discrete Speech Representation Tokens for Accent Generation
Arxiv
0+阅读 · 1月27日
F-Actor: Controllable Conversational Behaviour in Full-Duplex Models
Arxiv
0+阅读 · 1月16日
Principled Coarse-Grained Acceptance for Speculative Decoding in Speech
Arxiv
0+阅读 · 1月22日
Principled Coarse-Grained Acceptance for Speculative Decoding in Speech
Arxiv
0+阅读 · 1月21日
SingMOS-Pro: An Comprehensive Benchmark for Singing Quality Assessment
Arxiv
0+阅读 · 1月27日
What Makes a Good Speech Tokenizer for LLM-Centric Speech Generation? A Systematic Study
Arxiv
0+阅读 · 1月16日
DeepASMR: LLM-Based Zero-Shot ASMR Speech Generation for Anyone of Any Voice
Arxiv
0+阅读 · 1月22日
AI-based System for Transforming text and sound to Educational Videos
Arxiv
0+阅读 · 1月16日
SpeakerSleuth: Evaluating Large Audio-Language Models as Judges for Multi-turn Speaker Consistency
Arxiv
0+阅读 · 1月7日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top