Game balancing is a longstanding challenge requiring repeated playtesting, expert intuition, and extensive manual tuning. We introduce RuleSmith, the first framework that achieves automated game balancing by leveraging the reasoning capabilities of multi-agent LLMs. It couples a game engine, multi-agent LLMs self-play, and Bayesian optimization operating over a multi-dimensional rule space. As a proof of concept, we instantiate RuleSmith on CivMini, a simplified civilization-style game containing heterogeneous factions, economy systems, production rules, and combat mechanics, all governed by tunable parameters. LLM agents interpret textual rulebooks and game states to generate actions, to conduct fast evaluation of balance metrics such as win-rate disparities. To search the parameter landscape efficiently, we integrate Bayesian optimization with acquisition-based adaptive sampling and discrete projection: promising candidates receive more evaluation games for accurate assessment, while exploratory candidates receive fewer games for efficient exploration. Experiments show that RuleSmith converges to highly balanced configurations and provides interpretable rule adjustments that can be directly applied to downstream game systems. Our results illustrate that LLM simulation can serve as a powerful surrogate for automating design and balancing in complex multi-agent environments.


翻译:游戏平衡是一项长期存在的挑战,需要反复进行游戏测试、依赖专家直觉并进行大量手动调整。我们提出了RuleSmith,这是首个通过利用多智能体大语言模型的推理能力实现自动化游戏平衡的框架。该框架耦合了游戏引擎、多智能体大语言模型自博弈,以及在多维规则空间上运行的贝叶斯优化。作为概念验证,我们在CivMini上实例化了RuleSmith——这是一个简化的文明风格游戏,包含异质阵营、经济系统、生产规则和战斗机制,所有这些都由可调参数控制。大语言模型智能体通过解读文本规则手册和游戏状态来生成行动,从而快速评估如胜率差异等平衡性指标。为了高效搜索参数空间,我们将贝叶斯优化与基于采集函数的自适应采样及离散投影相结合:有潜力的候选配置会获得更多评估对局以实现精确评估,而探索性候选配置则获得较少对局以实现高效探索。实验表明,RuleSmith能够收敛到高度平衡的配置,并提供可直接应用于下游游戏系统的可解释规则调整。我们的研究结果证明,大语言模型仿真可以作为自动化复杂多智能体环境设计与平衡的强大替代方案。

0
下载
关闭预览

相关内容

《多智能体大语言模型系统的可靠决策研究》
专知会员服务
31+阅读 · 2月2日
多智能体协作机制:大语言模型综述
专知会员服务
67+阅读 · 2025年3月4日
面向兵棋游戏的多层级智能体架构
专知会员服务
34+阅读 · 2025年1月23日
基于大型语言模型的游戏智能体综述
专知会员服务
66+阅读 · 2024年4月3日
面向多智能体博弈对抗的对手建模框架
专知会员服务
162+阅读 · 2022年9月28日
面向多智能体博弈对抗的对手建模框架
专知
18+阅读 · 2022年9月28日
兵棋推演的智能决策技术与挑战
专知
28+阅读 · 2022年7月5日
经典书《斯坦福大学-多智能体系统》532页pdf
CALDERA 一款对手自动模拟工具
黑白之道
20+阅读 · 2019年9月17日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
20+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
10+阅读 · 2013年12月31日
国家自然科学基金
20+阅读 · 2013年12月31日
国家自然科学基金
18+阅读 · 2009年12月31日
国家自然科学基金
17+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员