成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
OCR
关注
1
综合
百科
VIP
热门
动态
论文
精华
Beyond Patch Aggregation: 3-Pass Pyramid Indexing for Vision-Enhanced Document Retrieval
Arxiv
0+阅读 · 1月6日
Spatially-Grounded Document Retrieval via Patch-to-Region Relevance Propagation
Arxiv
0+阅读 · 1月1日
Timed text extraction from Taiwanese Kua-á-hì TV series
Arxiv
0+阅读 · 1月1日
Document Data Matching for Blockchain-Supported Real Estate
Arxiv
0+阅读 · 2025年12月30日
Towards Signboard-Oriented Visual Question Answering: ViSignVQA Dataset, Method and Benchmark
Arxiv
0+阅读 · 2025年12月22日
VTCBench: Can Vision-Language Models Understand Long Context with Vision-Text Compression?
Arxiv
0+阅读 · 2025年12月23日
Seeing Justice Clearly: Handwritten Legal Document Translation with OCR and Vision-Language Models
Arxiv
0+阅读 · 2025年12月19日
Vision Token Masking Alone Cannot Prevent PHI Leakage in Medical Document OCR: A Systematic Evaluation
Arxiv
0+阅读 · 2025年11月23日
RubricRL: Simple Generalizable Rewards for Text-to-Image Generation
Arxiv
0+阅读 · 2025年11月25日
VTCBench: Can Vision-Language Models Understand Long Context with Vision-Text Compression?
Arxiv
0+阅读 · 2025年12月17日
Cascaded Robust Rectification for Arbitrary Document Images
Arxiv
0+阅读 · 2025年11月28日
Beyond Patch Aggregation: 3-Pass Pyramid Indexing for Vision-Enhanced Document Retrieval
Arxiv
0+阅读 · 2025年11月26日
DKDS: A Benchmark Dataset of Degraded Kuzushiji Documents with Seals for Detection and Binarization
Arxiv
0+阅读 · 2025年12月18日
GLYPH-SR: Can We Achieve Both High-Quality Image Super-Resolution and High-Fidelity Text Recovery via VLM-guided Latent Diffusion Model?
Arxiv
0+阅读 · 2025年10月30日
Multi-Stage Field Extraction of Financial Documents with OCR and Compact Vision-Language Models
Arxiv
0+阅读 · 2025年10月27日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top