超强机器学习中LLM生成解释的局限性研究 (LLM-Generated Explanations Do Not Suffice for Ultra-Strong Machine Learning)

Ultra Strong Machine Learning (USML) refers to symbolic learning systems that not only improve their own performance but can also teach their acquired knowledge to quantifiably improve human performance. We introduce LENS (Logic Programming Explanation via Neural Summarisation), a neuro-symbolic framework that combines symbolic program synthesis with large language models (LLMs). This framework automatically generates natural language explanations of learned logic programs, replacing hand-crafted templates used in prior USML work. Using LLMs-as-judges evaluation and expert validation, we show that LENS produces higher-quality explanations than both direct LLM prompting and hand-crafted templates. We then examine whether LENS explanations suffice for achieving USML in a human trial teaching active learning strategies across three related domains. Our exploratory analysis suggests that concise, expert-written explanations may benefit learners with higher initial performance, while LLM-generated explanations provide no advantage over human self learning despite being rated as higher quality. This case study reveals that achieving USML requires methods grounded in human learning, where current LLM-generated explanations do not capture human cognitive constraints and LLMs-as-judges evaluations do not reflect what effectively supports human learning.

翻译：超强机器学习（USML）指不仅能提升自身性能，还能将其习得知识传授给人类以量化提升人类表现的一类符号学习系统。本文提出LENS（基于神经摘要的逻辑编程解释框架），这是一个将符号程序合成与大型语言模型（LLMs）相结合的神经符号框架。该框架能自动生成已习得逻辑程序的自然语言解释，取代了先前USML研究中手工设计的解释模板。通过LLM作为评判器的评估和专家验证，我们证明LENS生成的解释质量优于直接LLM提示和手工模板。随后，我们在三个相关领域开展人类教学实验，探究LENS生成的解释是否足以实现USML的教学目标——传授主动学习策略。探索性分析表明：对于初始表现较好的学习者，简洁的专家撰写解释可能更具益处；而尽管LLM生成解释在质量评分上更高，却未能展现出超越人类自主学习的效果。本案例研究揭示：实现USML需要以人类学习机制为基础的方法，当前LLM生成的解释未能捕捉人类认知约束，且LLM作为评判器的评估方式并不能反映对人类学习真正有效的支持要素。

相关内容

大语言模型

关注 65

大语言模型是基于海量文本数据训练的深度学习模型。它不仅能够生成自然语言文本，还能够深入理解文本含义，处理各种自然语言任务，如文本摘要、问答、翻译等。2023年，大语言模型及其在人工智能领域的应用已成为全球科技研究的热点，其在规模上的增长尤为引人注目，参数量已从最初的十几亿跃升到如今的一万亿。参数量的提升使得模型能够更加精细地捕捉人类语言微妙之处，更加深入地理解人类语言的复杂性。在过去的一年里，大语言模型在吸纳新知识、分解复杂任务以及图文对齐等多方面都有显著提升。随着技术的不断成熟，它将不断拓展其应用范围，为人类提供更加智能化和个性化的服务，进一步改善人们的生活和生产方式。

强化学习遇见大语言模型：贯穿 LLM 生命周期的进展与应用综述

专知会员服务

37+阅读 · 2025年9月23日

【EMNLP2025】ReCode：基于细粒度检索增强生成的LLM代码修复方法

专知会员服务

9+阅读 · 2025年9月3日

【ICML2025】用于图神经网络的LLM增强方法：因果机制识别视角下的分析

专知会员服务

15+阅读 · 2025年5月14日

《单智能体与多智能体深度强化学习方法的优化研究》219页

专知会员服务

50+阅读 · 2025年4月5日