语言瓶颈模型：面向定性知识状态建模 (Language Bottleneck Models for Qualitative Knowledge State Modeling) - 专知论文

会员服务 ·

0

知识 · 知识追踪 · 认知诊断 · 解码 · 诊断模型 ·

Language Bottleneck Models for Qualitative Knowledge State Modeling

翻译：语言瓶颈模型：面向定性知识状态建模

Antonin Berthon,Mihaela van der Schaar

Accurately assessing student knowledge is central to education. Cognitive Diagnosis (CD) models estimate student proficiency at a fixed point in time, while Knowledge Tracing (KT) methods model evolving knowledge states to predict future performance. However, existing approaches either provide quantitative concept mastery estimates with limited expressivity (CD, probabilistic KT) or prioritize predictive accuracy at the cost of interpretability (deep learning KT). We propose Language Bottleneck Models (LBMs), where an encoder LLM produces textual knowledge state summaries, which a decoder LLM uses to predict future performance. This produces interpretable summaries that can express nuanced insights--such as misconceptions--that CD and KT models cannot capture. Extensive validation across synthetic and real-world datasets shows LBMs reveal qualitative insights beyond what CD and KT models can capture, while achieving competitive accuracy with improved sample efficiency. We demonstrate that the encoder and decoder can be fine-tuned with reinforcement learning and supervised fine-tuning respectively to improve both summary quality and predictive performance.

翻译：准确评估学生知识水平是教育的核心任务。认知诊断模型旨在估计学生在特定时间点的知识掌握程度，而知识追踪方法则通过建模动态演化的知识状态来预测未来表现。然而，现有方法要么提供表达能力受限的定量概念掌握度估计（如认知诊断模型和概率型知识追踪方法），要么以牺牲可解释性为代价优先考虑预测准确性（如深度学习知识追踪方法）。本文提出语言瓶颈模型，其核心架构包含编码器大语言模型与解码器大语言模型：编码器生成文本形式的知识状态摘要，解码器则基于该摘要预测未来表现。该方法生成的摘要具有可解释性，能够表达认知诊断与知识追踪模型无法捕捉的细微洞察（例如学习误区）。在合成数据集与真实数据集上的广泛验证表明，语言瓶颈模型不仅能揭示超越传统模型的定性洞察，还能在保持样本效率优势的同时获得具有竞争力的预测精度。我们进一步论证了通过强化学习微调编码器与监督式微调解码器，可同步提升摘要质量与预测性能。

0

相关内容

如何将领域知识注入大模型？最新《将领域特定知识注入大语言模型》综述

如何将领域知识注入大模型？最新《将领域特定知识注入大语言模型》综述

专知会员服务

79+阅读 · 2025年2月24日

【阿姆斯特丹博士论文】在语言模型中寻找结构

【阿姆斯特丹博士论文】在语言模型中寻找结构

专知会员服务

26+阅读 · 2024年11月27日

大型语言模型与知识图谱：机遇与挑战

大型语言模型与知识图谱：机遇与挑战

专知会员服务

136+阅读 · 2023年8月23日

【WWW2023】面向结构化知识的预训练语言大模型

【WWW2023】面向结构化知识的预训练语言大模型

专知会员服务

60+阅读 · 2023年8月4日

大模型时代: 知识图谱过时了吗？Griffith大学等最新《统一大型语言模型和知识图谱:路线图》，29页pdf详述最全指南

大模型时代: 知识图谱过时了吗？Griffith大学等最新《统一大型语言模型和知识图谱:路线图》，29页pdf详述最全指南

专知会员服务

193+阅读 · 2023年6月19日

知识在大模型中如何用？中科院软件所最新《大型语言模型知识生命周期》综述，27页pdf阐述知识获取、表示、探测、编辑与应用

知识在大模型中如何用？中科院软件所最新《大型语言模型知识生命周期》综述，27页pdf阐述知识获取、表示、探测、编辑与应用

专知会员服务

88+阅读 · 2023年3月17日

【谷歌Kelvin Guu】语言模型可以是知识库吗？，46页ppt

专知会员服务

27+阅读 · 2021年10月12日

知识感知的预训练语言模型综述

专知会员服务

51+阅读 · 2021年9月25日

Knowledge In PLM: 语言模型可以作为一种知识库吗？

专知会员服务

30+阅读 · 2021年6月15日

【NLPCC2020】多模态知识图谱构建、推理与挑战，东南大学王萌博士

专知会员服务

148+阅读 · 2020年10月21日

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

专知

23+阅读 · 2023年4月8日

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知

18+阅读 · 2022年11月18日

居家学习！南京大学吴建鑫教授《模式识别》2020课程，附课件下载

居家学习！南京大学吴建鑫教授《模式识别》2020课程，附课件下载

专知

67+阅读 · 2020年2月24日

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

数据派THU

14+阅读 · 2019年6月15日

如何独立实现一个基于知识图谱的问答系统

如何独立实现一个基于知识图谱的问答系统

PaperWeekly

11+阅读 · 2019年6月13日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

从Seq2seq到Attention模型到Self Attention（一）

从Seq2seq到Attention模型到Self Attention（一）

量化投资与机器学习

76+阅读 · 2018年10月8日

基于面部表情的学习困惑自动识别法

基于面部表情的学习困惑自动识别法

MOOC

10+阅读 · 2018年9月17日

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

人工智能头条

10+阅读 · 2018年6月29日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

知识不确定性度量的粒计算模型及其应用研究

国家自然科学基金

1+阅读 · 2017年12月31日

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

基于知识库构建的图像和视频角色语义关系的研究

国家自然科学基金

1+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

Language Modeling and Understanding Through Paraphrase Generation and Detection

Arxiv

0+阅读 · 2月15日

Know More, Know Clearer: A Meta-Cognitive Framework for Knowledge Augmentation in Large Language Models

Arxiv

0+阅读 · 2月13日

Predictive Query Language: A Domain-Specific Language for Predictive Modeling on Relational Databases

Arxiv

0+阅读 · 2月10日

Benchmarking Large Language Models for Diagnosing Students' Cognitive Skills from Handwritten Math Work

Arxiv

0+阅读 · 2月4日

Uncertainty-Aware Knowledge Tracing Models

Arxiv

0+阅读 · 2月2日

Fine-Tuning Language Models to Know What They Know

Arxiv

0+阅读 · 2月2日

Clarity: The Flexibility-Interpretability Trade-Off in Sparsity-aware Concept Bottleneck Models

Arxiv

0+阅读 · 1月29日

A Context-Aware Dual-Metric Framework for Confidence Estimation in Large Language Models

Arxiv

0+阅读 · 1月27日

Next Token Knowledge Tracing: Exploiting Pretrained LLM Representations to Decode Student Behaviour

Arxiv

0+阅读 · 1月26日

Simulated Ignorance Fails: A Systematic Study of LLM Behaviors on Forecasting Problems Before Model Knowledge Cutoff

Arxiv

0+阅读 · 1月20日

VIP会员

文章信息

相关主题

相关VIP内容

如何将领域知识注入大模型？最新《将领域特定知识注入大语言模型》综述

如何将领域知识注入大模型？最新《将领域特定知识注入大语言模型》综述

专知会员服务

79+阅读 · 2025年2月24日

【阿姆斯特丹博士论文】在语言模型中寻找结构

【阿姆斯特丹博士论文】在语言模型中寻找结构

专知会员服务

26+阅读 · 2024年11月27日

大型语言模型与知识图谱：机遇与挑战

大型语言模型与知识图谱：机遇与挑战

专知会员服务

136+阅读 · 2023年8月23日

【WWW2023】面向结构化知识的预训练语言大模型

【WWW2023】面向结构化知识的预训练语言大模型

专知会员服务

60+阅读 · 2023年8月4日

大模型时代: 知识图谱过时了吗？Griffith大学等最新《统一大型语言模型和知识图谱:路线图》，29页pdf详述最全指南

大模型时代: 知识图谱过时了吗？Griffith大学等最新《统一大型语言模型和知识图谱:路线图》，29页pdf详述最全指南

专知会员服务

193+阅读 · 2023年6月19日

知识在大模型中如何用？中科院软件所最新《大型语言模型知识生命周期》综述，27页pdf阐述知识获取、表示、探测、编辑与应用

知识在大模型中如何用？中科院软件所最新《大型语言模型知识生命周期》综述，27页pdf阐述知识获取、表示、探测、编辑与应用

专知会员服务

88+阅读 · 2023年3月17日

【谷歌Kelvin Guu】语言模型可以是知识库吗？，46页ppt

专知会员服务

27+阅读 · 2021年10月12日

知识感知的预训练语言模型综述

专知会员服务

51+阅读 · 2021年9月25日

Knowledge In PLM: 语言模型可以作为一种知识库吗？

专知会员服务

30+阅读 · 2021年6月15日

【NLPCC2020】多模态知识图谱构建、推理与挑战，东南大学王萌博士

专知会员服务

148+阅读 · 2020年10月21日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

【ChatGPT系列报告】人工智能行业专题报告：多模态AI研究框架，17页ppt

专知

23+阅读 · 2023年4月8日

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知

18+阅读 · 2022年11月18日

居家学习！南京大学吴建鑫教授《模式识别》2020课程，附课件下载

居家学习！南京大学吴建鑫教授《模式识别》2020课程，附课件下载

专知

67+阅读 · 2020年2月24日

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

ACL 2019 | 基于知识增强的语言表示模型，多项NLP任务表现超越BERT（附论文解读）

数据派THU

14+阅读 · 2019年6月15日

如何独立实现一个基于知识图谱的问答系统

如何独立实现一个基于知识图谱的问答系统

PaperWeekly

11+阅读 · 2019年6月13日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

从Seq2seq到Attention模型到Self Attention（一）

从Seq2seq到Attention模型到Self Attention（一）

量化投资与机器学习

76+阅读 · 2018年10月8日

基于面部表情的学习困惑自动识别法

基于面部表情的学习困惑自动识别法

MOOC

10+阅读 · 2018年9月17日

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

NLP通用模型诞生？一个模型搞定十大自然语言常见任务

人工智能头条

10+阅读 · 2018年6月29日

自然语言处理中的Attention Model：是什么及为什么

自然语言处理中的Attention Model：是什么及为什么

新智元

11+阅读 · 2017年7月13日

相关论文

Language Modeling and Understanding Through Paraphrase Generation and Detection

Arxiv

0+阅读 · 2月15日

Know More, Know Clearer: A Meta-Cognitive Framework for Knowledge Augmentation in Large Language Models

Arxiv

0+阅读 · 2月13日

Predictive Query Language: A Domain-Specific Language for Predictive Modeling on Relational Databases

Arxiv

0+阅读 · 2月10日

Benchmarking Large Language Models for Diagnosing Students' Cognitive Skills from Handwritten Math Work

Arxiv

0+阅读 · 2月4日

Uncertainty-Aware Knowledge Tracing Models

Arxiv

0+阅读 · 2月2日

Fine-Tuning Language Models to Know What They Know

Arxiv

0+阅读 · 2月2日

Clarity: The Flexibility-Interpretability Trade-Off in Sparsity-aware Concept Bottleneck Models

Arxiv

0+阅读 · 1月29日

A Context-Aware Dual-Metric Framework for Confidence Estimation in Large Language Models

Arxiv

0+阅读 · 1月27日

Next Token Knowledge Tracing: Exploiting Pretrained LLM Representations to Decode Student Behaviour

Arxiv

0+阅读 · 1月26日

Simulated Ignorance Fails: A Systematic Study of LLM Behaviors on Forecasting Problems Before Model Knowledge Cutoff

Arxiv

0+阅读 · 1月20日

相关基金

知识不确定性度量的粒计算模型及其应用研究

国家自然科学基金

1+阅读 · 2017年12月31日

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

基于知识库构建的图像和视频角色语义关系的研究

国家自然科学基金

1+阅读 · 2015年12月31日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于人脸表情、身体姿态和语音的多模态情感识别方法研究

国家自然科学基金

10+阅读 · 2015年12月31日

考虑不确定性的结构动力学响应模型可信度确认方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向大规模知识图谱的查询处理关键技术研究

国家自然科学基金

18+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员