Millions of users across the globe turn to AI chatbots for their creative needs, inviting widespread interest in understanding how they represent diverse cultures. However, evaluating cultural representations in open-ended tasks remains challenging and underexplored. In this work, we present TALES, an evaluation of cultural misrepresentations in LLM-generated stories for diverse Indian cultural identities. First, we develop TALES-Tax, a taxonomy of cultural misrepresentations by collating insights from participants with lived experiences in India through focus groups (N=9) and individual surveys (N=15). Using TALES-Tax, we evaluate 6 models through a large-scale annotation study spanning 2925 annotations from 108 annotators with lived experience and native language proficiency from across 71 regions in India and 14 languages. Concerningly, we find that 88% of the generated stories contain misrepresentations, and such errors are more prevalent in mid- and low-resourced languages and stories based in peri-urban regions in India. We also transform the annotations into TALES-QA, a standalone question bank to evaluate the cultural knowledge of models.


翻译:全球数百万用户向AI聊天机器人寻求创意需求,引发了对其如何表征多元文化的广泛关注。然而,在开放式任务中评估文化表征仍具挑战性且研究不足。本研究提出TALES,针对多样印度文化身份,评估大语言模型生成故事中的文化误表征问题。首先,我们通过焦点小组(N=9)和个人问卷调查(N=15),汇集来自具有印度生活经验的参与者的见解,构建了文化误表征分类法TALES-Tax。基于TALES-Tax,我们通过一项大规模标注研究评估了6个模型,该研究涵盖来自印度71个地区和14种语言的108位具有生活经验和母语能力的标注者完成的2925条标注。令人担忧的是,我们发现88%的生成故事存在误表征,且此类错误在中等及低资源语言以及基于印度城乡结合地区的故事中更为普遍。我们还将标注结果转化为独立问题库TALES-QA,用于评估模型的文化知识。

0
下载
关闭预览

相关内容

LLMS4ALL:大语言模型在各学科科研与应用中的综述
专知会员服务
36+阅读 · 2025年10月4日
《大型语言模型归因》综述
专知会员服务
75+阅读 · 2023年11月8日
自然语言生成资源列表
专知
17+阅读 · 2020年1月4日
一文带你读懂自然语言处理 - 事件提取
AI研习社
10+阅读 · 2019年5月10日
自然语言处理基础:上下文词表征入门解读
机器之心
13+阅读 · 2019年3月2日
NLP - 15 分钟搭建中文文本分类模型
AINLP
79+阅读 · 2019年1月29日
语料库构建——自然语言理解的基础
计算机研究与发展
11+阅读 · 2017年8月21日
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
VIP会员
相关VIP内容
LLMS4ALL:大语言模型在各学科科研与应用中的综述
专知会员服务
36+阅读 · 2025年10月4日
《大型语言模型归因》综述
专知会员服务
75+阅读 · 2023年11月8日
相关资讯
自然语言生成资源列表
专知
17+阅读 · 2020年1月4日
一文带你读懂自然语言处理 - 事件提取
AI研习社
10+阅读 · 2019年5月10日
自然语言处理基础:上下文词表征入门解读
机器之心
13+阅读 · 2019年3月2日
NLP - 15 分钟搭建中文文本分类模型
AINLP
79+阅读 · 2019年1月29日
语料库构建——自然语言理解的基础
计算机研究与发展
11+阅读 · 2017年8月21日
相关基金
国家自然科学基金
4+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员