With advancements in deep learning (DL) and computer vision techniques, the field of chart understanding is evolving rapidly. In particular, multimodal large language models (MLLMs) are proving to be efficient and accurate in understanding charts. To accurately measure the performance of MLLMs, the research community has developed multiple datasets to serve as benchmarks. By examining these datasets, we found that they are all limited to a small set of chart types. To bridge this gap, we propose the ChartComplete dataset. The dataset is based on a chart taxonomy borrowed from the visualization community, and it covers thirty different chart types. The dataset is a collection of classified chart images and does not include a learning signal. We present the ChartComplete dataset as is to the community to build upon it.


翻译:随着深度学习(DL)和计算机视觉技术的进步,图表理解领域正在迅速发展。特别是,多模态大语言模型(MLLMs)在理解图表方面被证明是高效且准确的。为了准确衡量MLLMs的性能,研究界已开发了多个数据集作为基准。通过检视这些数据集,我们发现它们均局限于一小部分图表类型。为弥补这一空白,我们提出了ChartComplete数据集。该数据集基于可视化领域借鉴的图表分类学,涵盖了三十种不同的图表类型。该数据集是分类图表图像的集合,不包含学习信号。我们将ChartComplete数据集原样呈现给研究界,以供进一步构建。

0
下载
关闭预览

相关内容

数据集,又称为资料集、数据集合或资料集合,是一种由数据所组成的集合。
Data set(或dataset)是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量,如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数,该数据集的数据可能包括一个或多个成员。
表格数据表示学习综述
专知会员服务
18+阅读 · 2025年4月27日
当持续学习遇上多模态大型语言模型:综述
专知会员服务
32+阅读 · 2025年3月5日
多模态大规模语言模型基准的综述
专知会员服务
41+阅读 · 2024年8月25日
深度多模态表示学习综述论文,22页pdf
专知
33+阅读 · 2020年6月21日
Graph Neural Networks 综述
计算机视觉life
30+阅读 · 2019年8月13日
图数据表示学习综述论文
专知
52+阅读 · 2019年6月10日
论文浅尝 | 基于深度序列模型的知识图谱补全
开放知识图谱
29+阅读 · 2019年5月19日
AmpliGraph:知识图谱表示学习工具包
专知
40+阅读 · 2019年4月6日
深度学习时代的图模型,清华发文综述图网络
GAN生成式对抗网络
13+阅读 · 2018年12月23日
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
VIP会员
相关资讯
深度多模态表示学习综述论文,22页pdf
专知
33+阅读 · 2020年6月21日
Graph Neural Networks 综述
计算机视觉life
30+阅读 · 2019年8月13日
图数据表示学习综述论文
专知
52+阅读 · 2019年6月10日
论文浅尝 | 基于深度序列模型的知识图谱补全
开放知识图谱
29+阅读 · 2019年5月19日
AmpliGraph:知识图谱表示学习工具包
专知
40+阅读 · 2019年4月6日
深度学习时代的图模型,清华发文综述图网络
GAN生成式对抗网络
13+阅读 · 2018年12月23日
相关基金
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
18+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员