We present RecoWorld, a blueprint for building simulated environments tailored to agentic recommender systems. Such environments give agents a proper training space where they can learn from errors without impacting real users. RecoWorld distinguishes itself with a dual-view architecture: a simulated user and an agentic recommender engage in multi-turn interactions aimed at maximizing user retention. The user simulator reviews recommended items, updates its mindset, and when sensing potential user disengagement, generates reflective instructions. The agentic recommender adapts its recommendations by incorporating these user instructions and reasoning traces, creating a dynamic feedback loop that actively engages users. This process leverages the exceptional reasoning capabilities of modern LLMs. We explore diverse content representations within the simulator, including text-based, multimodal, and semantic ID modeling, and discuss how multi-turn RL enables the recommender to refine its strategies through iterative interactions. RecoWorld also supports multi-agent simulations, allowing creators to simulate the responses of targeted user populations. It marks an important first step toward recommender systems where users and agents collaboratively shape personalized information streams. We envision new interaction paradigms where "user instructs, recommender responds," jointly optimizing user retention and engagement.


翻译:本文提出RecoWorld——一种专为智能推荐系统构建模拟环境的蓝图框架。此类环境为智能体提供了恰当的训练空间,使其能够在学习过程中试错而不影响真实用户。RecoWorld采用双视图架构:模拟用户与智能推荐系统进行多轮交互,以最大化用户留存为目标。用户模拟器对推荐项目进行评价、更新其心智状态,并在感知到用户可能流失时生成反思性指令。智能推荐系统则通过融合这些用户指令与推理轨迹来调整推荐策略,形成动态反馈循环以持续吸引用户。该过程充分利用了现代大语言模型卓越的推理能力。我们在模拟器中探索了多样化的内容表征方式,包括基于文本、多模态及语义ID建模,并讨论了多轮强化学习如何使推荐系统通过迭代交互优化策略。RecoWorld同时支持多智能体仿真,使构建者能够模拟目标用户群体的响应行为。这标志着向用户与智能体协同塑造个性化信息流的推荐系统迈出了重要的第一步。我们展望“用户指令、推荐响应”的新型交互范式,共同优化用户留存与参与度。

0
下载
关闭预览

相关内容

AI 智能体系统:体系架构、应用场景及评估范式
【新书】深度学习推荐系统
专知会员服务
28+阅读 · 2025年5月9日
关于大语言模型驱动的推荐系统智能体的综述
专知会员服务
28+阅读 · 2025年2月17日
【新书】用Python和JAX构建推荐系统
专知会员服务
29+阅读 · 2022年12月26日
南洋理工大学,深度学习推荐系统综述
专知会员服务
177+阅读 · 2019年10月14日
推荐系统(一):推荐系统基础
菜鸟的机器学习
25+阅读 · 2019年9月2日
Python推荐系统框架:RecQ
专知
12+阅读 · 2019年1月21日
推荐系统
炼数成金订阅号
28+阅读 · 2019年1月17日
推荐系统概述
Python开发者
11+阅读 · 2018年9月27日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2月19日
VIP会员
相关基金
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员