The use of Large Language Models (LLMs) for simulating human perspectives via persona prompting is gaining traction in computational social science. However, well-curated, empirically grounded persona collections remain scarce, limiting the accuracy and representativeness of such simulations. Here, we introduce the German General Social Survey Personas (GGSS Personas) collection, a comprehensive and representative persona prompt collection built from the German General Social Survey (ALLBUS). The GGSS Personas and their persona prompts are designed to be easily plugged into prompts for all types of LLMs and tasks, steering models to generate responses aligned with the underlying German population. We evaluate GGSS Personas by prompting various LLMs to simulate survey response distributions across diverse topics, demonstrating that GGSS Personas-guided LLMs outperform state-of-the-art classifiers, particularly under data scarcity. Furthermore, we analyze how the representativity and attribute selection within persona prompts affect alignment with population responses. Our findings suggest that GGSS Personas provide a potentially valuable resource for research on LLM-based social simulations that enables more systematic explorations of population-aligned persona prompting in NLP and social science research.


翻译:通过人物角色提示利用大语言模型模拟人类视角的做法,在计算社会科学领域日益受到关注。然而,经过精心策划、基于实证的人物角色集合仍然稀缺,限制了此类模拟的准确性和代表性。本文介绍德国综合社会调查人物角色集合,这是一个基于德国综合社会调查构建的全面且具有代表性的人物角色提示集合。GGSS人物角色及其提示设计旨在轻松嵌入各类大语言模型和任务的提示中,引导模型生成与德国基础人口特征对齐的响应。我们通过提示不同大语言模型模拟多主题调查响应分布来评估GGSS人物角色,结果表明GGSS人物角色引导的大语言模型优于最先进的分类器,尤其在数据稀缺条件下表现突出。此外,我们分析了人物角色提示中的代表性特征与属性选择如何影响与人口响应的对齐程度。研究结果表明,GGSS人物角色为基于大语言模型的社会模拟研究提供了潜在宝贵资源,使得在自然语言处理和社会科学研究中能够更系统地探索人口对齐的人物角色提示方法。

0
下载
关闭预览

相关内容

《以人为中心的大型语言模型(LLM)研究综述》
专知会员服务
41+阅读 · 2024年11月25日
大语言模型对齐研究综述
专知会员服务
56+阅读 · 2024年8月1日
大型语言模型中的人格综述
专知会员服务
42+阅读 · 2024年6月30日
大规模语言模型的人类偏好学习综述
专知会员服务
42+阅读 · 2024年6月19日
【博士论文】语言模型与人类偏好对齐,148页pdf
专知会员服务
32+阅读 · 2024年4月21日
哈工大秦兵教授 | 大语言模型之人类价值观对齐
专知会员服务
62+阅读 · 2023年8月4日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
用户画像基础
DataFunTalk
12+阅读 · 2020年8月1日
什么是语义角色标注?
人工智能头条
18+阅读 · 2019年4月28日
人脸相关算法、数据集、文献资源大列表
专知
16+阅读 · 2019年3月16日
德国情报工作浅析
计算机与网络安全
30+阅读 · 2018年8月11日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
人工智能在战场行动中的演进及伊朗案例
专知会员服务
4+阅读 · 4月18日
美AI公司Anthropic推出网络安全模型“Mythos”
专知会员服务
2+阅读 · 4月18日
【博士论文】面向城市环境的可解释计算机视觉
大语言模型的自改进机制:技术综述与未来展望
《第四代军事特种作战部队选拔与评估》
专知会员服务
1+阅读 · 4月18日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员