In virtual reality (VR) educational scenarios, Pedagogical agents (PAs) enhance immersive learning through realistic appearances and interactive behaviors. However, most existing PAs rely on static speech and simple gestures. This limitation reduces their ability to dynamically adapt to the semantic context of instructional content. As a result, interactions often lack naturalness and effectiveness in the teaching process. To address this challenge, this study proposes a large language model (LLM)-driven multimodal expression generation method that constructs semantically sensitive prompts to generate coordinated speech and gesture instructions, enabling dynamic alignment between instructional semantics and multimodal expressive behaviors. A VR-based PA prototype was developed and evaluated through user experience-oriented subjective experiments. Results indicate that dynamically generated multimodal expressions significantly enhance learners' perceived learning effectiveness, engagement, and intention to use, while effectively alleviating feelings of fatigue and boredom during the learning process. Furthermore, the combined dynamic expression of speech and gestures notably enhances learners' perceptions of human-likeness and social presence. The findings provide new insights and design guidelines for building more immersive and naturally expressive intelligent PAs.


翻译:在虚拟现实(VR)教育场景中,教学代理(PAs)通过逼真的外观与交互行为增强了沉浸式学习体验。然而,现有教学代理大多依赖静态语音与简单手势,这一局限削弱了其根据教学内容语义情境进行动态适应的能力,导致教学过程中的交互往往缺乏自然性与有效性。为应对这一挑战,本研究提出一种基于大语言模型(LLM)驱动的多模态表达生成方法,通过构建语义敏感的提示来生成协调的语音与手势指令,实现教学语义与多模态表达行为的动态对齐。研究开发了基于VR的教学代理原型,并通过以用户体验为导向的主观实验进行评估。结果表明,动态生成的多模态表达显著提升了学习者感知的学习效果、参与度与使用意愿,同时有效缓解了学习过程中的疲劳感与厌倦情绪。此外,语音与手势相结合的动态表达显著增强了学习者对代理拟人化程度与社会临场感的感知。本研究为构建更具沉浸感与自然表现力的智能教学代理提供了新的见解与设计指导。

0
下载
关闭预览

相关内容

数据驱动的具身学习探索
专知会员服务
16+阅读 · 2025年2月26日
【博士论文】学习视觉-语言表示以实现多模态理解
专知会员服务
28+阅读 · 2025年2月8日
《利用深度强化学习实现作战训练场景自动生成》
专知会员服务
38+阅读 · 2025年1月14日
多模态数字人建模、合成与驱动综述
专知会员服务
30+阅读 · 2024年9月19日
LLM in Medical Domain: 大语言模型在医学领域的应用
专知会员服务
103+阅读 · 2023年6月17日
多模态人机交互综述
专知会员服务
150+阅读 · 2022年7月3日
【Paul Liang】多模态深度学习,Multimodal Deep Learning
专知会员服务
185+阅读 · 2022年4月12日
专知会员服务
34+阅读 · 2021年10月11日
多模态预训练模型简述
专知会员服务
115+阅读 · 2021年4月27日
数据驱动的态势认知技术及发展思考
专知
18+阅读 · 2022年7月12日
浅谈主动学习(Active Learning)
凡人机器学习
32+阅读 · 2020年6月18日
网络表示学习概述
机器学习与推荐算法
19+阅读 · 2020年3月27日
人工智能在教育领域的应用探析
MOOC
14+阅读 · 2019年3月16日
NLP中自动生产文摘(auto text summarization)
机器学习研究会
14+阅读 · 2017年10月10日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关VIP内容
数据驱动的具身学习探索
专知会员服务
16+阅读 · 2025年2月26日
【博士论文】学习视觉-语言表示以实现多模态理解
专知会员服务
28+阅读 · 2025年2月8日
《利用深度强化学习实现作战训练场景自动生成》
专知会员服务
38+阅读 · 2025年1月14日
多模态数字人建模、合成与驱动综述
专知会员服务
30+阅读 · 2024年9月19日
LLM in Medical Domain: 大语言模型在医学领域的应用
专知会员服务
103+阅读 · 2023年6月17日
多模态人机交互综述
专知会员服务
150+阅读 · 2022年7月3日
【Paul Liang】多模态深度学习,Multimodal Deep Learning
专知会员服务
185+阅读 · 2022年4月12日
专知会员服务
34+阅读 · 2021年10月11日
多模态预训练模型简述
专知会员服务
115+阅读 · 2021年4月27日
相关资讯
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员