Chess engines passed human strength years ago, but they still don't play like humans. A grandmaster under clock pressure blunders in ways a club player on a hot streak never would. Conventional engines capture none of this. This paper proposes a personality x psyche decomposition to produce behavioral variability in chess play, drawing on patterns observed in human games. Personality is static -- a preset that pins down the engine's character. Psyche is dynamic -- a bounded scalar ψ_t \in [-100, +100], recomputed from five positional factors after every move. These two components feed into an audio-inspired signal chain (noise gate, compressor/expander, five-band equalizer, saturation limiter) that reshapes move probability distributions on the fly. The chain doesn't care what engine sits behind it: any system that outputs move probabilities will do. It needs no search and carries no state beyond ψ_t. I test the framework across 12,414 games against Maia2-1100, feeding it two probability sources that differ by ~2,800x in training data. Both show the same monotonic gradient in top-move agreement (~20-25 pp spread from stress to overconfidence), which tells us the behavioral variation comes from the signal chain, not from the model underneath. When the psyche runs overconfident, the chain mostly gets out of the way (66% agreement with vanilla Maia2). Under stress, the competitive score falls from 50.8% to 30.1%. The patterns are reminiscent of tilt and overconfidence as described in human play, but I should be upfront: this study includes no human-subject validation.


翻译:国际象棋引擎多年前就已超越人类棋力,但其对弈方式仍与人类迥异。特级大师在时间压力下的失误方式,是状态正佳的俱乐部棋手绝不会出现的。传统引擎完全无法捕捉此类特征。本文提出一种"性格×心理"的分解框架,借鉴人类对弈中观察到的行为模式,为国际象棋引擎生成行为变异性。性格是静态的——作为预设参数确定引擎的固有特质。心理是动态的——以有界标量ψ_t ∈ [-100, +100]表示,每步棋后根据五个局面因素重新计算。这两个组件输入受音频处理启发的信号链(噪声门、压缩器/扩展器、五段均衡器、饱和限幅器),实时重塑行棋概率分布。该信号链不依赖后端引擎类型:任何能输出行棋概率的系统均可适配。它无需搜索过程,除ψ_t外不保留任何状态。我在12,414局与Maia2-1100的对弈中测试该框架,为其提供训练数据量相差约2,800倍的两种概率源。两者在最佳行棋选择一致性上呈现相同的单调梯度变化(从紧张到过度自信状态约产生20-25个百分点的波动),这表明行为变异源于信号链而非底层模型。当心理状态处于过度自信时,信号链基本保持中立(与原始Maia2的一致性达66%)。在紧张状态下,竞技胜率从50.8%降至30.1%。这些模式令人联想到人类对弈中描述的"情绪失控"与"过度自信"现象,但需明确指出:本研究未包含人类受试者验证环节。

0
下载
关闭预览

相关内容

认知优势:人工智能在国家安全决策中的核心作用
专知会员服务
14+阅读 · 2025年8月16日
利用人工智能提升战术级目标定位能力
专知会员服务
34+阅读 · 2024年12月4日
赛尔笔记 | Attention!注意力机制可解释吗?
哈工大SCIR
23+阅读 · 2019年9月27日
综述AI未来:神经科学启发的类脑计算
人工智能学家
11+阅读 · 2018年4月24日
深度学习中的注意力机制
CSDN大数据
24+阅读 · 2017年11月2日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
VIP会员
最新内容
最新“指挥控制”领域出版物合集(简介)
专知会员服务
1+阅读 · 今天15:19
面向军事作战需求开发的人工智能(RAIMOND)
专知会员服务
3+阅读 · 今天15:13
软件定义多域战术网络:基础与未来方向(综述)
水下战战术决策中的气象与海洋预报(50页报告)
远程空中优势:新一代超视距导弹的兴起
专知会员服务
1+阅读 · 今天14:45
大语言模型溯因推理的统一分类学与综述
专知会员服务
0+阅读 · 今天12:07
相关VIP内容
认知优势:人工智能在国家安全决策中的核心作用
专知会员服务
14+阅读 · 2025年8月16日
利用人工智能提升战术级目标定位能力
专知会员服务
34+阅读 · 2024年12月4日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员