Span annotation - annotating specific text features at the span level - can be used to evaluate texts where single-score metrics fail to provide actionable feedback. Until recently, span annotation was done by human annotators or fine-tuned models. In this paper, we study whether large language models (LLMs) can serve as an alternative to human annotators. We compare the abilities of LLMs to skilled human annotators on three span annotation tasks: evaluating data-to-text generation, identifying translation errors, and detecting propaganda techniques. We show that overall, LLMs have only moderate inter-annotator agreement (IAA) with human annotators. However, we demonstrate that LLMs make errors at a similar rate as skilled crowdworkers. LLMs also produce annotations at a fraction of the cost per output annotation. We release the dataset of over 40k model and human span annotations for further research.


翻译:文本片段标注——在片段级别标注特定文本特征——可用于评估那些单一评分指标无法提供可操作反馈的文本。直到最近,文本片段标注仍由人类标注者或微调模型完成。本文研究大型语言模型(LLMs)能否作为人类标注者的替代方案。我们在三项文本片段标注任务上比较了LLMs与熟练人类标注者的能力:评估数据到文本生成、识别翻译错误以及检测宣传技巧。研究表明,总体而言,LLMs与人类标注者之间仅具有中等程度的标注者间一致性。然而,我们证明LLMs的错误率与熟练众包工作者相当。同时,LLMs生成每个标注结果的成本仅为人类标注的极小部分。我们发布了包含超过4万条模型与人类文本片段标注的数据集,以供进一步研究。

0
下载
关闭预览

相关内容

《以人为中心的大型语言模型(LLM)研究综述》
专知会员服务
41+阅读 · 2024年11月25日
揭示生成式人工智能 / 大型语言模型(LLMs)的军事潜力
专知会员服务
31+阅读 · 2024年9月26日
大型语言模型(LLMs),附Slides与视频
专知会员服务
70+阅读 · 2024年6月30日
【WWW2024】GNN能成为LLMs的良好适配器吗?
专知会员服务
35+阅读 · 2024年2月24日
面试题:文本摘要中的NLP技术
七月在线实验室
15+阅读 · 2019年5月13日
什么是语义角色标注?
人工智能头条
18+阅读 · 2019年4月28日
ML通用指南:文本分类详细教程(上)
论智
19+阅读 · 2018年7月29日
专栏 | NLP概述和文本自动分类算法详解
机器之心
12+阅读 · 2018年7月24日
深度学习文本分类方法综述(代码)
中国人工智能学会
28+阅读 · 2018年6月16日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
相关资讯
面试题:文本摘要中的NLP技术
七月在线实验室
15+阅读 · 2019年5月13日
什么是语义角色标注?
人工智能头条
18+阅读 · 2019年4月28日
ML通用指南:文本分类详细教程(上)
论智
19+阅读 · 2018年7月29日
专栏 | NLP概述和文本自动分类算法详解
机器之心
12+阅读 · 2018年7月24日
深度学习文本分类方法综述(代码)
中国人工智能学会
28+阅读 · 2018年6月16日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员