成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
多模
关注
2
综合
百科
VIP
热门
动态
论文
精华
FCMBench: A Comprehensive Financial Credit Multimodal Benchmark for Real-world Applications
Arxiv
0+阅读 · 1月6日
Multi-Modal Data-Enhanced Foundation Models for Prediction and Control in Wireless Networks: A Survey
Arxiv
0+阅读 · 1月6日
RoboMIND 2.0: A Multimodal, Bimanual Mobile Manipulation Dataset for Generalizable Embodied Intelligence
Arxiv
0+阅读 · 1月6日
UniCorn: Towards Self-Improving Unified Multimodal Models through Self-Generated Supervision
Arxiv
0+阅读 · 1月6日
Multimodal oscillator networks learn to solve a classification problem
Arxiv
0+阅读 · 1月6日
MemeMind: A Large-Scale Multimodal Dataset with Chain-of-Thought Reasoning for Harmful Meme Detection
Arxiv
0+阅读 · 1月6日
Protecting multimodal large language models against misleading visualizations
Arxiv
0+阅读 · 1月6日
Decentralized Autoregressive Generation
Arxiv
0+阅读 · 1月6日
Beyond Patch Aggregation: 3-Pass Pyramid Indexing for Vision-Enhanced Document Retrieval
Arxiv
0+阅读 · 1月6日
Revisiting Data Compression with Language Modeling
Arxiv
0+阅读 · 1月6日
Focus on What Matters: Fisher-Guided Adaptive Multimodal Fusion for Vulnerability Detection
Arxiv
0+阅读 · 1月5日
Advancing Assistive Robotics: Multi-Modal Navigation and Biophysical Monitoring for Next-Generation Wheelchairs
Arxiv
0+阅读 · 1月6日
MMFormalizer: Multimodal Autoformalization in the Wild
Arxiv
0+阅读 · 1月6日
AnatomiX, an Anatomy-Aware Grounded Multimodal Large Language Model for Chest X-Ray Interpretation
Arxiv
0+阅读 · 1月6日
VLN-MME: Diagnosing MLLMs as Language-guided Visual Navigation agents
Arxiv
0+阅读 · 1月6日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top