成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
图像描述
关注
0
综合
百科
VIP
热门
动态
论文
精华
VLCE: A Knowledge-Enhanced Framework for Image Description in Disaster Assessment
Arxiv
0+阅读 · 2月17日
Top-Down Semantic Refinement for Image Captioning
Arxiv
0+阅读 · 2月16日
How University Disability Services Professionals Write Image Descriptions for HCI Figures Using Generative AI
Arxiv
0+阅读 · 2月9日
Contextualized Visual Personalization in Vision-Language Models
Arxiv
0+阅读 · 2月3日
Multi-Modal LLM based Image Captioning in ICT: Bridging the Gap Between General and Industry Domain
Arxiv
0+阅读 · 1月14日
Dual-Stream Collaborative Transformer for Image Captioning
Arxiv
0+阅读 · 1月19日
CPJ: Explainable Agricultural Pest Diagnosis via Caption-Prompt-Judge with LLM-Judged Refinement
Arxiv
0+阅读 · 2025年12月31日
Beyond Vision: Contextually Enriched Image Captioning with Multi-Modal Retrieva
Arxiv
0+阅读 · 2025年12月23日
From Pixels to Posts: Retrieval-Augmented Fashion Captioning and Hashtag Generation
Arxiv
0+阅读 · 2025年11月24日
DISCODE: Distribution-Aware Score Decoder for Robust Automatic Evaluation of Image Captioning
Arxiv
0+阅读 · 2025年12月16日
Discovering Meaningful Units with Visually Grounded Semantics from Image Captions
Arxiv
0+阅读 · 2025年11月14日
Siamese-Driven Optimization for Low-Resolution Image Latent Embedding in Image Captioning
Arxiv
0+阅读 · 2025年12月9日
MM-SeR: Multimodal Self-Refinement for Lightweight Image Captioning
Arxiv
0+阅读 · 2025年12月7日
Visual Semantic Relatedness Dataset for Image Captioning
Arxiv
1+阅读 · 2023年4月30日
FM-Loc: Using Foundation Models for Improved Vision-based Localization
Arxiv
0+阅读 · 2023年4月14日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top