We present SciClaimEval, a new scientific dataset for the claim verification task. Unlike existing resources, SciClaimEval features authentic claims, including refuted ones, directly extracted from published papers. To create refuted claims, we introduce a novel approach that modifies the supporting evidence (figures and tables), rather than altering the claims or relying on large language models (LLMs) to fabricate contradictions. The dataset provides cross-modal evidence with diverse representations: figures are available as images, while tables are provided in multiple formats, including images, LaTeX source, HTML, and JSON. SciClaimEval contains 1,664 annotated samples from 180 papers across three domains, machine learning, natural language processing, and medicine, validated through expert annotation. We benchmark 11 multimodal foundation models, both open-source and proprietary, across the dataset. Results show that figure-based verification remains particularly challenging for all models, as a substantial performance gap remains between the best system and human baseline.


翻译:我们提出了SciClaimEval,一个用于声明验证任务的新型科学数据集。与现有资源不同,SciClaimEval包含直接从已发表论文中提取的真实声明,其中包括被反驳的声明。为了创建被反驳的声明,我们引入了一种新颖的方法,即修改支持性证据(图表),而不是改变声明本身或依赖大型语言模型来制造矛盾。该数据集提供了具有多样化表示的跨模态证据:图表以图像形式提供,而表格则以多种格式提供,包括图像、LaTeX源代码、HTML和JSON。SciClaimEval包含来自机器学习、自然语言处理和医学三个领域的180篇论文中的1,664个标注样本,并通过专家标注进行了验证。我们在该数据集上对11个开源和专有的多模态基础模型进行了基准测试。结果表明,基于图表的验证对所有模型来说仍然特别具有挑战性,因为最佳系统与人类基线之间仍存在显著的性能差距。

0
下载
关闭预览

相关内容

【AAAI2022】谣言粉碎机!可解释事实检验算法研究
专知会员服务
17+阅读 · 2022年1月30日
专知会员服务
53+阅读 · 2021年8月13日
专知会员服务
23+阅读 · 2021年4月20日
AI可解释性文献列表
专知
43+阅读 · 2019年10月7日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
牛!中国版Sci-Hub,还能下载中文文献!
材料科学与工程
26+阅读 · 2018年8月26日
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员