成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
语音识别
关注
753
语音识别是计算机科学和计算语言学的一个跨学科子领域,它发展了一些方法和技术,使计算机可以将口语识别和翻译成文本。 它也被称为自动语音识别(ASR),计算机语音识别或语音转文本(STT)。它整合了计算机科学,语言学和计算机工程领域的知识和研究。
综合
百科
VIP
热门
动态
论文
精华
RECOVER: Robust Entity Correction via agentic Orchestration of hypothesis Variants for Evidence-based Recovery
Arxiv
0+阅读 · 3月17日
SloPal: A 60-Million-Word Slovak Parliamentary Corpus with Aligned Speech and Fine-Tuned ASR Models
Arxiv
0+阅读 · 3月16日
When Scanners Lie: Evaluator Instability in LLM Red-Teaming
Arxiv
0+阅读 · 3月15日
A Language-Agnostic Hierarchical LoRA-MoE Architecture for CTC-based Multilingual ASR
Arxiv
0+阅读 · 3月16日
Training-Free Intelligibility-Guided Observation Addition for Noisy ASR
Arxiv
0+阅读 · 2月24日
823-OLT @ BUET DL Sprint 4.0: Context-Aware Windowing for ASR and Fine-Tuned Speaker Diarization in Bengali Long Form Audio
Arxiv
0+阅读 · 2月24日
Efficient Dialect-Aware Modeling and Conditioning for Low-Resource Taiwanese Hakka Speech Processing
Arxiv
0+阅读 · 2月26日
Speech recognition assisted by large language models to command software orally -- Application to an augmented and virtual reality web app for immersive molecular graphics
Arxiv
0+阅读 · 3月3日
Connecting Voices: LoReSpeech as a Low-Resource Speech Parallel Corpus
Arxiv
0+阅读 · 3月10日
The Universal Personalizer: Few-Shot Dysarthric Speech Recognition via Meta-Learning
Arxiv
0+阅读 · 2月23日
Ramsa: A Large Sociolinguistically Rich Emirati Arabic Speech Corpus for ASR and TTS
Arxiv
0+阅读 · 3月9日
Speak in Context: Multilingual ASR with Speech Context Alignment via Contrastive Learning
Arxiv
0+阅读 · 3月6日
Pay Attention to CTC: Fast and Robust Pseudo-Labelling for Unified Speech Recognition
Arxiv
0+阅读 · 2月22日
Discourse-Aware Dual-Track Streaming Response for Low-Latency Spoken Dialogue Systems
Arxiv
0+阅读 · 2月26日
Exploring the potential and limitations of Model Merging for Multi-Domain Adaptation in ASR
Arxiv
0+阅读 · 3月5日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top