We present an approach for enhancing non-playable characters (NPCs) in games by combining large language models (LLMs) with computer vision to provide contextual awareness of their surroundings. Conventional NPCs typically rely on pre-scripted dialogue and lack spatial understanding, which limits their responsiveness to player actions and reduces overall immersion. Our method addresses these limitations by capturing panoramic images of an NPC's environment and applying semantic segmentation to identify objects and their spatial positions. The extracted information is used to generate a structured JSON representation of the environment, combining object locations derived from segmentation with additional scene graph data within the NPC's bounding sphere, encoded as directional vectors. This representation is provided as input to the LLM, enabling NPCs to incorporate spatial knowledge into player interactions. As a result, NPCs can dynamically reference nearby objects, landmarks, and environmental features, leading to more believable and engaging gameplay. We describe the technical implementation of the system and evaluate it in two stages. First, an expert interview was conducted to gather feedback and identify areas for improvement. After integrating these refinements, a user study was performed, showing that participants preferred the context-aware NPCs over a non-context-aware baseline, confirming the effectiveness of the proposed approach.


翻译:我们提出了一种方法,通过结合大语言模型(LLMs)与计算机视觉技术,增强游戏中非玩家角色(NPC)对周围环境的上下文感知能力。传统NPC通常依赖预编写对话且缺乏空间理解,这限制了其对玩家行为的响应能力并降低了整体沉浸感。我们的方法通过采集NPC环境的全景图像,应用语义分割识别物体及其空间位置来突破这些限制。提取的信息用于生成环境的结构化JSON表示,将分割得到的物体位置与NPC包围球内编码为方向向量的额外场景图数据相结合。将该表示作为输入提供给LLM,使NPC能够将空间知识融入玩家交互。由此,NPC可动态引用附近物体、地标及环境特征,从而实现更可信且更具吸引力的游戏体验。我们描述了该系统的技术实现,并通过两个阶段进行评估:首先开展专家访谈以收集反馈并确定改进方向;在集成这些优化后,进行用户研究,结果表明参与者更偏好具备上下文感知能力的NPC(相对于无上下文感知的基线方案),从而验证了所提方法的有效性。

0
下载
关闭预览

相关内容

NPC:IFIP International Conference on Network and Parallel Computing。 Explanation:网络与并行计算国际会议。 Publisher:Springer。 SIT: http://dblp.uni-trier.de/db/conf/npc/
LLMS4ALL:大语言模型在各学科科研与应用中的综述
专知会员服务
36+阅读 · 2025年10月4日
大型语言模型推理增强外部知识:综述
专知会员服务
38+阅读 · 2025年6月2日
《多模态大语言模型视觉提示》综述
专知会员服务
36+阅读 · 2024年9月25日
《多模态大语言模型评估综述》
专知会员服务
41+阅读 · 2024年8月29日
从数据中心视角看多模态大型语言模型的综述
专知会员服务
58+阅读 · 2024年5月28日
「知识增强预训练语言模型」最新研究综述
专知
18+阅读 · 2022年11月18日
【论文笔记】基于强化学习的人机对话
专知
20+阅读 · 2019年9月21日
NLP通用模型诞生?一个模型搞定十大自然语言常见任务
人工智能头条
10+阅读 · 2018年6月29日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
最新内容
美以伊冲突:无人机与人工智能的运用
专知会员服务
1+阅读 · 13分钟前
《特种部队在透明战场中的生存力》最新报告
专知会员服务
1+阅读 · 33分钟前
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
7+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员