Prior work has explored multi-turn interaction and feedback for LLM writing, but evaluations still largely center on prompts and localized feedback, leaving persistent public reception in online communities underexamined. We test whether broadcast community discussion improves stand-up comedy writing in a controlled multi-agent sandbox: in the discussion condition, critic and audience threads are recorded, filtered, stored as social memory, and later retrieved to condition subsequent generations, whereas the baseline omits discussion. Across 50 rounds (250 paired monologues) judged by five expert annotators using A/B preference and a 15-item rubric, discussion wins 75.6% of instances and improves Craft/Clarity (Δ = 0.440) and Social Response (Δ = 0.422), with occasional increases in aggressive humor.


翻译:先前的研究已探索过多轮交互与反馈对大型语言模型写作的影响,但评估仍主要集中于提示词和局部反馈,对在线社区中持续性的公众反响关注不足。本研究通过一个受控的多智能体沙箱环境,检验广播式社区讨论是否能提升单口喜剧创作水平:在讨论条件下,评论家和观众线程被记录、筛选、存储为社交记忆,并在后续生成时被检索以指导模型;而基线条件则省略讨论环节。经过50轮实验(共250组成对独白),由五位专家标注者采用A/B偏好测试和包含15项指标的评分量表进行评估,结果显示讨论条件在75.6%的案例中胜出,并在技巧/清晰度(Δ = 0.440)与社会反响(Δ = 0.422)维度上显著提升,同时偶现攻击性幽默的增强。

0
下载
关闭预览

相关内容

大模型驱动的社交网络多智能体仿真综述
专知会员服务
14+阅读 · 2月22日
《多智能体大语言模型系统的可靠决策研究》
专知会员服务
31+阅读 · 2月2日
基于大语言模型的智能体优化研究综述
专知会员服务
59+阅读 · 2025年3月25日
利用多个大型语言模型:关于LLM集成的调研
专知会员服务
35+阅读 · 2025年2月27日
关于大语言模型驱动的推荐系统智能体的综述
专知会员服务
28+阅读 · 2025年2月17日
多智能体协作机制:大语言模型综述
专知会员服务
84+阅读 · 2025年1月14日
大语言模型智能体
专知会员服务
97+阅读 · 2024年12月25日
《大型语言模型情感认知》最新进展
专知会员服务
43+阅读 · 2024年10月3日
基于大型语言模型的多智能体:进展与挑战综述
专知会员服务
138+阅读 · 2024年2月6日
LLM in Medical Domain: 大语言模型在医学领域的应用
专知会员服务
103+阅读 · 2023年6月17日
【深度语义匹配模型】原理篇二:交互篇
AINLP
16+阅读 · 2020年5月18日
对话系统近期进展
专知
37+阅读 · 2019年3月23日
NLP通用模型诞生?一个模型搞定十大自然语言常见任务
人工智能头条
10+阅读 · 2018年6月29日
多轮对话之对话管理:Dialog Management
PaperWeekly
18+阅读 · 2018年1月15日
赛尔原创 | 教聊天机器人进行多轮对话
哈工大SCIR
18+阅读 · 2017年9月18日
群体智能:新一代人工智能的重要方向
走向智能论坛
12+阅读 · 2017年8月16日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Arxiv
0+阅读 · 1月31日
VIP会员
相关VIP内容
大模型驱动的社交网络多智能体仿真综述
专知会员服务
14+阅读 · 2月22日
《多智能体大语言模型系统的可靠决策研究》
专知会员服务
31+阅读 · 2月2日
基于大语言模型的智能体优化研究综述
专知会员服务
59+阅读 · 2025年3月25日
利用多个大型语言模型:关于LLM集成的调研
专知会员服务
35+阅读 · 2025年2月27日
关于大语言模型驱动的推荐系统智能体的综述
专知会员服务
28+阅读 · 2025年2月17日
多智能体协作机制:大语言模型综述
专知会员服务
84+阅读 · 2025年1月14日
大语言模型智能体
专知会员服务
97+阅读 · 2024年12月25日
《大型语言模型情感认知》最新进展
专知会员服务
43+阅读 · 2024年10月3日
基于大型语言模型的多智能体:进展与挑战综述
专知会员服务
138+阅读 · 2024年2月6日
LLM in Medical Domain: 大语言模型在医学领域的应用
专知会员服务
103+阅读 · 2023年6月17日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员