Visualizations play a pivotal role in daily communication in an increasingly data-driven world. Research on multimodal large language models (MLLMs) for automated chart understanding has accelerated massively, with steady improvements on standard benchmarks. However, for MLLMs to be reliable, they must be robust to misleading visualizations, i.e., charts that distort the underlying data, leading readers to draw inaccurate conclusions. Here, we uncover an important vulnerability: MLLM question-answering (QA) accuracy on misleading visualizations drops on average to the level of the random baseline. To address this, we provide the first comparison of six inference-time methods to improve QA performance on misleading visualizations, without compromising accuracy on non-misleading ones. We find that two methods, table-based QA and redrawing the visualization, are effective, with improvements of up to 19.6 percentage points. We make our code and data available.


翻译:在日益数据驱动的世界中,可视化在日常沟通中扮演着关键角色。用于自动图表理解的多模态大语言模型(MLLMs)研究已大规模加速,在标准基准测试中持续取得进步。然而,要使MLLMs具备可靠性,它们必须对误导性可视化——即扭曲底层数据、导致读者得出错误结论的图表——具有鲁棒性。在此,我们揭示了一个重要漏洞:MLLM在误导性可视化上的问答(QA)准确率平均下降至随机基线水平。为解决此问题,我们首次比较了六种推理时方法,旨在提升模型在误导性可视化上的QA性能,同时不损害其在非误导性图表上的准确性。我们发现,基于表格的问答和可视化重绘这两种方法效果显著,最高可提升19.6个百分点。我们将公开代码与数据。

0
下载
关闭预览

相关内容

大语言模型机器遗忘综述
专知会员服务
17+阅读 · 2025年11月2日
领域特定文本分类中的预训练语言模型新进展:系统综述
专知会员服务
12+阅读 · 2025年10月24日
PEFT A2Z:大型语言与视觉模型的参数高效微调综述
专知会员服务
21+阅读 · 2025年4月22日
KnowledGPT:基于知识库的检索和存储访问增强大型语言模型
如何使用自然语言工具包(NLTK)在Python3中执行情感分析
Python程序员
21+阅读 · 2019年10月28日
基于PyTorch/TorchText的自然语言处理库
专知
28+阅读 · 2019年4月22日
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
VIP会员
相关VIP内容
大语言模型机器遗忘综述
专知会员服务
17+阅读 · 2025年11月2日
领域特定文本分类中的预训练语言模型新进展:系统综述
专知会员服务
12+阅读 · 2025年10月24日
PEFT A2Z:大型语言与视觉模型的参数高效微调综述
专知会员服务
21+阅读 · 2025年4月22日
KnowledGPT:基于知识库的检索和存储访问增强大型语言模型
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员