成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
OCR
关注
1
综合
百科
VIP
热门
动态
论文
精华
Harpocrates: A Statically Typed Privacy Conscious Programming Framework
Arxiv
0+阅读 · 2月19日
DODO: Discrete OCR Diffusion Models
Arxiv
0+阅读 · 2月18日
Optimizing Nepali PDF Extraction: A Comparative Study of Parser and OCR Technologies
Arxiv
0+阅读 · 2月18日
Designing Production-Scale OCR for India: Multilingual and Domain-Specific Systems
Arxiv
0+阅读 · 2月18日
Investigating Redundancy in Multimodal Large Language Models with Multiple Vision Encoders
Arxiv
0+阅读 · 2月13日
Error Patterns in Historical OCR: A Comparative Analysis of TrOCR and a Vision-Language Model
Arxiv
0+阅读 · 2月16日
MeDocVL: A Visual Language Model for Medical Document Understanding and Parsing
Arxiv
0+阅读 · 2月6日
ViTextVQA: A Large-Scale Visual Question Answering Dataset for Evaluating Vietnamese Text Comprehension in Images
Arxiv
0+阅读 · 2月16日
OCRVerse: Towards Holistic OCR in End-to-End Vision-Language Models
Arxiv
0+阅读 · 2月4日
Text is All You Need for Vision-Language Model Jailbreaking
Arxiv
0+阅读 · 1月31日
Generalization or Hallucination? Understanding Out-of-Context Reasoning in Transformers
Arxiv
0+阅读 · 2月2日
OCRTurk: A Comprehensive OCR Benchmark for Turkish
Arxiv
0+阅读 · 2月3日
Evaluating OCR Performance for Assistive Technology: Effects of Walking Speed, Camera Placement, and Camera Type
Arxiv
0+阅读 · 2月2日
Rethinking Genomic Modeling Through Optical Character Recognition
Arxiv
0+阅读 · 2月2日
GutenOCR: A Grounded Vision-Language Front-End for Documents
Arxiv
0+阅读 · 1月22日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top