Online education platforms have experienced explosive growth over the past decade, generating massive volumes of user-generated content in the form of reviews, ratings, and behavioral logs. These heterogeneous signals provide unprecedented opportunities for understanding learner satisfaction, which is a critical determinant of course retention, engagement, and long-term learning outcomes. However, accurately predicting satisfaction remains challenging due to the short length, noise, contextual dependency, and multi-dimensional nature of online reviews. In this paper, we propose a unified \textbf{Large Language Model (LLM)-based multi-modal framework} for predicting both platform-level and course-level learner satisfaction. The proposed framework integrates three complementary information sources: (1) short-text topic distributions that capture latent thematic structures, (2) contextualized sentiment representations learned from pretrained Transformer-based language models, and (3) behavioral interaction features derived from learner activity logs. These heterogeneous representations are fused within a hybrid regression architecture to produce accurate satisfaction predictions. We conduct extensive experiments on large-scale MOOC review datasets collected from multiple public platforms. The experimental results demonstrate that the proposed LLM-based multi-modal framework consistently outperforms traditional text-only models, shallow sentiment baselines, and single-modality regression approaches. Comprehensive ablation studies further validate the necessity of jointly modeling topic semantics, deep sentiment representations, and behavioral analytics. Our findings highlight the critical role of large-scale contextual language representations in advancing learning analytics and provide actionable insights for platform design, course improvement, and personalized recommendation.


翻译:过去十年间,在线教育平台经历了爆发式增长,产生了海量用户生成内容,涵盖评论文本、评分数据及行为日志等形式。这些异质信号为理解学习者满意度——这一决定课程留存率、参与度及长期学习成效的关键因素——提供了前所未有的机遇。然而,由于在线评论文本具有短文本性、噪声干扰、语境依赖及多维度特征,准确预测满意度仍面临严峻挑战。本文提出一种统一的**基于大语言模型的**多模态框架,用于同时预测平台级与课程级学习者满意度。该框架整合三类互补信息源:(1) 捕捉潜在主题结构的短文本主题分布;(2) 基于预训练Transformer语言模型习得的语境化情感表征;(3) 从学习者行为日志中提取的交互特征。这些异质表征在混合回归架构中融合,以生成精准的满意度预测。我们在多个公开平台收集的大规模MOOC评价数据集上开展广泛实验,结果表明所提出的基于大语言模型的多模态框架在性能上持续优于传统纯文本模型、浅层情感基线及单模态回归方法。全面的消融研究进一步验证了联合建模主题语义、深层情感表征与行为分析的必要性。研究结论凸显了大规模语境化语言表征在学习分析领域的关键作用,并为平台设计、课程优化及个性化推荐提供了可实践洞见。

0
下载
关闭预览

相关内容

【综述】 基于大语言模型的对话用户模拟综述
【斯坦福博士论文】大语言模型的AI辅助评估
专知会员服务
31+阅读 · 2025年3月30日
【IJCAI2024教程】大语言模型(LLMs)时代的推荐系统
专知会员服务
51+阅读 · 2024年8月5日
大语言模型评估技术研究进展
专知会员服务
49+阅读 · 2024年7月9日
【WWW2023】面向结构化知识的预训练语言大模型
专知会员服务
60+阅读 · 2023年8月4日
人工智能在教育领域的应用探析
MOOC
14+阅读 · 2019年3月16日
【知识图谱】基于知识图谱的用户画像技术
产业智能官
103+阅读 · 2019年1月9日
教你用Python爬虫股票评论,简单分析股民用户情绪
数据派THU
10+阅读 · 2017年12月12日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关主题
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
6+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
2+阅读 · 6月21日
学习数据的几何:形状空间分析数学综述
专知会员服务
10+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
12+阅读 · 6月17日
相关基金
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员