Simulating group-level user behavior enables scalable counterfactual evaluation of merchant strategies without costly online experiments. However, building a trustworthy simulator faces two structural challenges. First, information incompleteness causes reasoning-based simulators to over-rationalize when unobserved factors such as offline context and implicit habits are missing. Second, mechanism duality requires capturing both interpretable preferences and implicit statistical regularities, which no single paradigm achieves alone. We propose Policy-Guided Hybrid Simulation (PGHS), a dual-process framework that mines transferable decision policies from behavioral trajectories and uses them as a shared alignment layer. This layer anchors an LLM-based reasoning branch that prevents over-rationalization and an ML-based fitting branch that absorbs implicit regularities. Group-level predictions from both branches are fused for complementary correction. We deploy PGHS on Meituan with 101 merchants and over 26,000 trajectories. PGHS achieves a group simulation error of 8.80%, improving over the best reasoning-based and fitting-based baselines by 45.8% and 40.9% respectively.


翻译:模拟群体用户行为能够实现在无需昂贵在线实验的情况下,对商家策略进行可扩展的反事实评估。然而,构建可信的模拟器面临两大结构性挑战。首先,信息不完整性会导致基于推理的模拟器在缺失线下背景、隐性习惯等未观测因素时过度理性化。其次,机制二元性要求同时捕捉可解释的偏好和隐性的统计规律,单一范式无法独立实现。我们提出策略引导混合模拟(Policy-Guided Hybrid Simulation, PGHS),这是一种双流程框架,可从行为轨迹中挖掘可迁移的决策策略,并将其作为共享对齐层。该层锚定了基于大语言模型的推理分支(防止过度理性化)和基于机器学习的拟合分支(吸收隐性规律)。两个分支的群体预测结果通过互补校正实现融合。我们在美团平台部署了PGHS,涉及101个商家和超过26,000条轨迹。PGHS实现了8.80%的群体模拟误差,相较于最优的纯推理基线和纯拟合基线分别提升了45.8%和40.9%。

0
下载
关闭预览

相关内容

【综述】 基于大语言模型的对话用户模拟综述
知识图谱在美团推荐场景中的应用
专知会员服务
67+阅读 · 2022年5月21日
用户画像基础
DataFunTalk
12+阅读 · 2020年8月1日
用户画像技术及方法论
DataFunTalk
13+阅读 · 2020年5月27日
用户研究:如何做用户画像分析
产品100干货速递
46+阅读 · 2019年5月9日
《美团机器学习实践》—— 思维导图
图灵教育
22+阅读 · 2019年1月17日
【知识图谱】基于知识图谱的用户画像技术
产业智能官
103+阅读 · 2019年1月9日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
VIP会员
相关主题
最新内容
重新思考无人机时代的生存能力
专知会员服务
2+阅读 · 今天7:44
装甲突击旅:现代战争思考、战斗与组织
专知会员服务
2+阅读 · 今天7:28
在人工智能加速决策环境中拓展OODA循环
专知会员服务
3+阅读 · 今天7:18
军事欺骗:供作战战术指挥官使用的工具
专知会员服务
3+阅读 · 今天7:03
综述 | 世界动作模型:少做梦,多行动
专知会员服务
5+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
10+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
5+阅读 · 6月23日
相关资讯
用户画像基础
DataFunTalk
12+阅读 · 2020年8月1日
用户画像技术及方法论
DataFunTalk
13+阅读 · 2020年5月27日
用户研究:如何做用户画像分析
产品100干货速递
46+阅读 · 2019年5月9日
《美团机器学习实践》—— 思维导图
图灵教育
22+阅读 · 2019年1月17日
【知识图谱】基于知识图谱的用户画像技术
产业智能官
103+阅读 · 2019年1月9日
相关基金
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员