成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
语音识别
关注
753
语音识别是计算机科学和计算语言学的一个跨学科子领域,它发展了一些方法和技术,使计算机可以将口语识别和翻译成文本。 它也被称为自动语音识别(ASR),计算机语音识别或语音转文本(STT)。它整合了计算机科学,语言学和计算机工程领域的知识和研究。
综合
百科
VIP
热门
动态
论文
精华
The Cascade Equivalence Hypothesis: When Do Speech LLMs Behave Like ASR$\rightarrow$LLM Pipelines?
Arxiv
0+阅读 · 2月19日
Windowed SummaryMixing: An Efficient Fine-Tuning of Self-Supervised Learning Models for Low-resource Speech Recognition
Arxiv
0+阅读 · 2月4日
Beyond the Utterance: An Empirical Study of Very Long Context Speech Recognition
Arxiv
0+阅读 · 2月4日
Decoder-only Conformer with Modality-aware Sparse Mixtures of Experts for ASR
Arxiv
0+阅读 · 2月13日
Where Are We At with Automatic Speech Recognition for the Bambara Language?
Arxiv
0+阅读 · 2月10日
From Scarcity to Scale: A Release-Level Analysis of the Pashto Common Voice Dataset
Arxiv
0+阅读 · 2月15日
ViSpeechFormer: A Phonemic Approach for Vietnamese Automatic Speech Recognition
Arxiv
0+阅读 · 2月10日
Benchmarking Automatic Speech Recognition for Indian Languages in Agricultural Contexts
Arxiv
0+阅读 · 2月6日
RedTeamCUA: Realistic Adversarial Testing of Computer-Use Agents in Hybrid Web-OS Environments
Arxiv
0+阅读 · 2月16日
Moonshine v2: Ergodic Streaming Encoder ASR for Latency-Critical Speech Applications
Arxiv
0+阅读 · 2月12日
Dialect Matters: Cross-Lingual ASR Transfer for Low-Resource Indic Language Varieties
Arxiv
0+阅读 · 2月11日
Eureka-Audio: Triggering Audio Intelligence in Compact Language Models
Arxiv
0+阅读 · 2月15日
Bengali-Loop: Community Benchmarks for Long-Form Bangla ASR and Speaker Diarization
Arxiv
0+阅读 · 2月15日
Evaluating Kubernetes Performance for GenAI Inference: From Automatic Speech Recognition to LLM Summarization
Arxiv
0+阅读 · 2月9日
Evaluating Kubernetes Performance for GenAI Inference: From Automatic Speech Recognition to LLM Summarization
Arxiv
0+阅读 · 2月11日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top