Information-Theoretic Storage Cost in Sentence Comprehension - 专知论文

会员服务 ·

0

度量 · 存储 · 负荷 · 形式化 · 离散 ·

Information-Theoretic Storage Cost in Sentence Comprehension

翻译：信息论存储成本在句子理解中的作用

Kohei Kajikawa,Shinnosuke Isono,Ethan Gotlieb Wilcox

Real-time sentence comprehension imposes a significant load on working memory, as comprehenders must maintain contextual information to anticipate future input. While measures of such load have played an important role in psycholinguistic theories, they have been formalized, largely, using symbolic grammars, which assign discrete, uniform costs to syntactic predictions. This study proposes a measure of processing storage cost based on an information-theoretic formalization, as the amount of information previous words carry about future context, under uncertainty. Unlike previous discrete, grammar-based metrics, this measure is continuous, theory-neutral, and can be estimated from pre-trained neural language models. The validity of this approach is demonstrated through three analyses in English: our measure (i) recovers well-known processing asymmetries in center embeddings and relative clauses, (ii) correlates with a grammar-based storage cost in a syntactically-annotated corpus, and (iii) predicts reading-time variance in two large-scale naturalistic datasets over and above baseline models with traditional information-based predictors.

翻译：实时句子理解对工作记忆施加了显著负荷，因为理解者必须维持上下文信息以预测未来输入。虽然此类负荷的度量在心理语言学理论中发挥了重要作用，但其形式化主要依赖于符号语法体系，即对句法预测赋予离散且统一的成本。本研究基于信息论形式化提出了一种处理存储成本的度量方法，将其定义为在不确定性条件下，先前词汇对未来上下文所承载的信息量。与以往基于语法的离散度量不同，本度量是连续且理论中立的，并可通过预训练的神经语言模型进行估计。通过三项英语分析验证了该方法的有效性：我们的度量（i）重现了中心嵌套结构与关系从句中已知的处理不对称性，（ii）在句法标注语料库中与基于语法的存储成本存在相关性，且（iii）在两个大规模自然主义数据集中，相较于采用传统信息论预测因子的基线模型，能额外解释阅读时间的方差。

0

相关内容

【斯坦福博士论文】驾驭上下文内记忆与学习的质量—效率权衡

【斯坦福博士论文】驾驭上下文内记忆与学习的质量—效率权衡

专知会员服务

10+阅读 · 4月30日

【阿姆斯特丹博士论文】表示学习中的信息理论

【阿姆斯特丹博士论文】表示学习中的信息理论

专知会员服务

23+阅读 · 2025年7月18日

《决策成本：解读决策中记忆、强化学习和神经连接的相互作用》166页博士论文

《决策成本：解读决策中记忆、强化学习和神经连接的相互作用》166页博士论文

专知会员服务

54+阅读 · 2024年4月22日

【知识论概念】《理由论的进展》鲁汶大学2022最新220页博士论文

【知识论概念】《理由论的进展》鲁汶大学2022最新220页博士论文

专知会员服务

15+阅读 · 2022年8月9日

如何理解信息论？伯克利最新《信息论》图文导论，43页pdf概述信息论中的熵、不确定、熵、互信息、编解码等基础概念

如何理解信息论？伯克利最新《信息论》图文导论，43页pdf概述信息论中的熵、不确定、熵、互信息、编解码等基础概念

专知会员服务

173+阅读 · 2022年7月17日

【干货书】数据科学中的信息理论方法

【干货书】数据科学中的信息理论方法

专知会员服务

97+阅读 · 2022年6月27日

论深度学习的信息瓶颈理论（On the information bottleneck theory of deep learning）

论深度学习的信息瓶颈理论（On the information bottleneck theory of deep learning）

专知会员服务

66+阅读 · 2019年12月20日

腾讯信息流内容理解技术实践，A User-Centered Concept Mining System for Query and Document Understanding at Tencent

腾讯信息流内容理解技术实践，A User-Centered Concept Mining System for Query and Document Understanding at Tencent

专知会员服务

41+阅读 · 2019年12月15日

【EMNLP 2019 最佳论文】信息瓶颈专门化单词嵌入（用于解析）（Specializing Word Embeddings（for Parsing）by Information Bottleneck）

【EMNLP 2019 最佳论文】信息瓶颈专门化单词嵌入（用于解析）（Specializing Word Embeddings（for Parsing）by Information Bottleneck）

专知会员服务

24+阅读 · 2019年11月20日

【AAAI2020接受论文】利用图卷积网络将知识注入文本任务，Infusing Knowledge into the Textual Entailment Task Using Graph Convolutional Networks

【AAAI2020接受论文】利用图卷积网络将知识注入文本任务，Infusing Knowledge into the Textual Entailment Task Using Graph Convolutional Networks

专知会员服务

45+阅读 · 2019年11月11日

熵与其它信息量估计—国科大UCAS胡包钢教授《信息论与机器学习》课程第四讲

熵与其它信息量估计—国科大UCAS胡包钢教授《信息论与机器学习》课程第四讲

专知

10+阅读 · 2020年3月9日

长文本表示学习概述

长文本表示学习概述

云栖社区

15+阅读 · 2019年5月9日

一文读懂依存句法分析

一文读懂依存句法分析

AINLP

16+阅读 · 2019年4月28日

一文了解成分句法分析

一文了解成分句法分析

人工智能头条

15+阅读 · 2019年4月24日

别说还不懂依存句法分析

别说还不懂依存句法分析

人工智能头条

23+阅读 · 2019年4月8日

从信息论的角度来理解损失函数

从信息论的角度来理解损失函数

深度学习每日摘要

17+阅读 · 2019年4月7日

从信息瓶颈理论一瞥机器学习的“大一统理论”

从信息瓶颈理论一瞥机器学习的“大一统理论”

PaperWeekly

14+阅读 · 2019年1月4日

基于信息理论的机器学习

基于信息理论的机器学习

专知

22+阅读 · 2017年11月23日

【直观详解】信息熵、交叉熵和相对熵

【直观详解】信息熵、交叉熵和相对熵

机器学习研究会

10+阅读 · 2017年11月7日

Generative Adversarial Text to Image Synthesis论文解读

Generative Adversarial Text to Image Synthesis论文解读

统计学习与视觉计算组

13+阅读 · 2017年6月9日

互联网商业模式价格形成机制与资源配置效率研究——基于消费者信息不完美与搜寻的博弈理论视角

国家自然科学基金

0+阅读 · 2015年12月31日

基于聚合的社会化短文本信息处理与细粒度倾向性分析

国家自然科学基金

0+阅读 · 2015年12月31日

张量分析及其在高维信息处理中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

中文社交化短文本情感分析与话题挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

Web页面数据对象的感知理解与计算

国家自然科学基金

0+阅读 · 2014年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

高密度信息存储的偏光全息理论及关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

Arxiv

0+阅读 · 3月8日

Cost Trade-offs of Reasoning and Non-Reasoning Large Language Models in Text-to-SQL

Arxiv

0+阅读 · 3月7日

On the Monotonicity of Information Costs

Arxiv

0+阅读 · 3月5日

From Verbatim to Gist: Distilling Pyramidal Multimodal Memory via Semantic Information Bottleneck for Long-Horizon Video Agents

Arxiv

0+阅读 · 3月2日

On the Structure of Information

Arxiv

0+阅读 · 2月22日

On the Structure of Information

Arxiv

0+阅读 · 2月19日

Reason to Retrieve: Enhancing Query Understanding through Decomposition and Interpretation

Arxiv

0+阅读 · 2月10日

A Cost-Effective Near-Storage Processing Solution for Offline Inference of Long-Context LLMs

Arxiv

0+阅读 · 2月6日

Explanations are a Means to an End: Decision Theoretic Explanation Evaluation

Arxiv

0+阅读 · 2月4日

LLM-based Embeddings: Attention Values Encode Sentence Semantics Better Than Hidden States

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

最新内容

新兴反无人机技术与不对称防御对策

新兴反无人机技术与不对称防御对策

专知会员服务

2+阅读 · 今天15:12

《美空军条令出版物 3-60，目标定位（2026版）》

《美空军条令出版物 3-60，目标定位（2026版）》

专知会员服务

3+阅读 · 今天15:06

多模态多智能体AI系统赋能军事态势感知：与单智能体方法的比较研究

多模态多智能体AI系统赋能军事态势感知：与单智能体方法的比较研究

专知会员服务

5+阅读 · 今天14:54

《无人机在冲突地区提供紧急医疗与外科支持》

《无人机在冲突地区提供紧急医疗与外科支持》

专知会员服务

3+阅读 · 今天14:48

《定向能武器交战授权治理管道》

《定向能武器交战授权治理管道》

专知会员服务

3+阅读 · 今天14:41

《防空协同制导：用于中段目标分配的多目标成本函数》

《防空协同制导：用于中段目标分配的多目标成本函数》

专知会员服务

3+阅读 · 今天14:35

《人工智能与海军作战》最新报告

《人工智能与海军作战》最新报告

专知会员服务

3+阅读 · 今天14:00

人工智能专题：中国人工智能系列白皮书-具身智能(2026)，100页pdf

人工智能专题：中国人工智能系列白皮书-具身智能(2026)，100页pdf

专知会员服务

2+阅读 · 今天13:17

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

专知会员服务

2+阅读 · 今天13:07

具身智能安全综述：风险、攻击与防御的多层分类框架

具身智能安全综述：风险、攻击与防御的多层分类框架

专知会员服务

3+阅读 · 今天13:04

【ICML 2026】GLANCE：用视觉-语言好奇心驱动VLM智能体主动探索

【ICML 2026】GLANCE：用视觉-语言好奇心驱动VLM智能体主动探索

专知会员服务

3+阅读 · 今天12:09

具身AI安全综述：风险、攻击与防御

具身AI安全综述：风险、攻击与防御

专知会员服务

3+阅读 · 今天12:02

DeepSeek 版Claude Code，免费小白安装教程来了！

DeepSeek 版Claude Code，免费小白安装教程来了！

专知会员服务

13+阅读 · 5月5日

【ICML Spotlight 2026】 T²PO: 不确定性引导的探索控制框架，实现稳定多轮Agentic强化学习

【ICML Spotlight 2026】 T²PO: 不确定性引导的探索控制框架，实现稳定多轮Agentic强化学习

专知会员服务

6+阅读 · 5月5日

基础模型驱动的工业智能体：技术成熟度、能力变迁与未竟之挑战

基础模型驱动的工业智能体：技术成熟度、能力变迁与未竟之挑战

专知会员服务

8+阅读 · 5月5日

相关VIP内容

【斯坦福博士论文】驾驭上下文内记忆与学习的质量—效率权衡

【斯坦福博士论文】驾驭上下文内记忆与学习的质量—效率权衡

专知会员服务

10+阅读 · 4月30日

【阿姆斯特丹博士论文】表示学习中的信息理论

【阿姆斯特丹博士论文】表示学习中的信息理论

专知会员服务

23+阅读 · 2025年7月18日

《决策成本：解读决策中记忆、强化学习和神经连接的相互作用》166页博士论文

《决策成本：解读决策中记忆、强化学习和神经连接的相互作用》166页博士论文

专知会员服务

54+阅读 · 2024年4月22日

【知识论概念】《理由论的进展》鲁汶大学2022最新220页博士论文

【知识论概念】《理由论的进展》鲁汶大学2022最新220页博士论文

专知会员服务

15+阅读 · 2022年8月9日

如何理解信息论？伯克利最新《信息论》图文导论，43页pdf概述信息论中的熵、不确定、熵、互信息、编解码等基础概念

如何理解信息论？伯克利最新《信息论》图文导论，43页pdf概述信息论中的熵、不确定、熵、互信息、编解码等基础概念

专知会员服务

173+阅读 · 2022年7月17日

【干货书】数据科学中的信息理论方法

【干货书】数据科学中的信息理论方法

专知会员服务

97+阅读 · 2022年6月27日

论深度学习的信息瓶颈理论（On the information bottleneck theory of deep learning）

论深度学习的信息瓶颈理论（On the information bottleneck theory of deep learning）

专知会员服务

66+阅读 · 2019年12月20日

腾讯信息流内容理解技术实践，A User-Centered Concept Mining System for Query and Document Understanding at Tencent

腾讯信息流内容理解技术实践，A User-Centered Concept Mining System for Query and Document Understanding at Tencent

专知会员服务

41+阅读 · 2019年12月15日

【EMNLP 2019 最佳论文】信息瓶颈专门化单词嵌入（用于解析）（Specializing Word Embeddings（for Parsing）by Information Bottleneck）

【EMNLP 2019 最佳论文】信息瓶颈专门化单词嵌入（用于解析）（Specializing Word Embeddings（for Parsing）by Information Bottleneck）

专知会员服务

24+阅读 · 2019年11月20日

【AAAI2020接受论文】利用图卷积网络将知识注入文本任务，Infusing Knowledge into the Textual Entailment Task Using Graph Convolutional Networks

【AAAI2020接受论文】利用图卷积网络将知识注入文本任务，Infusing Knowledge into the Textual Entailment Task Using Graph Convolutional Networks

专知会员服务

45+阅读 · 2019年11月11日

热门VIP内容

开通专知VIP会员享更多权益服务

《美空军条令出版物 3-60，目标定位（2026版）》

《无人机在冲突地区提供紧急医疗与外科支持》

新兴反无人机技术与不对称防御对策

多模态多智能体AI系统赋能军事态势感知：与单智能体方法的比较研究

相关资讯

熵与其它信息量估计—国科大UCAS胡包钢教授《信息论与机器学习》课程第四讲

熵与其它信息量估计—国科大UCAS胡包钢教授《信息论与机器学习》课程第四讲

专知

10+阅读 · 2020年3月9日

长文本表示学习概述

长文本表示学习概述

云栖社区

15+阅读 · 2019年5月9日

一文读懂依存句法分析

一文读懂依存句法分析

AINLP

16+阅读 · 2019年4月28日

一文了解成分句法分析

一文了解成分句法分析

人工智能头条

15+阅读 · 2019年4月24日

别说还不懂依存句法分析

别说还不懂依存句法分析

人工智能头条

23+阅读 · 2019年4月8日

从信息论的角度来理解损失函数

从信息论的角度来理解损失函数

深度学习每日摘要

17+阅读 · 2019年4月7日

从信息瓶颈理论一瞥机器学习的“大一统理论”

从信息瓶颈理论一瞥机器学习的“大一统理论”

PaperWeekly

14+阅读 · 2019年1月4日

基于信息理论的机器学习

基于信息理论的机器学习

专知

22+阅读 · 2017年11月23日

【直观详解】信息熵、交叉熵和相对熵

【直观详解】信息熵、交叉熵和相对熵

机器学习研究会

10+阅读 · 2017年11月7日

Generative Adversarial Text to Image Synthesis论文解读

Generative Adversarial Text to Image Synthesis论文解读

统计学习与视觉计算组

13+阅读 · 2017年6月9日

相关论文

Context Channel Capacity: An Information-Theoretic Framework for Understanding Catastrophic Forgetting

Arxiv

0+阅读 · 3月8日

Cost Trade-offs of Reasoning and Non-Reasoning Large Language Models in Text-to-SQL

Arxiv

0+阅读 · 3月7日

On the Monotonicity of Information Costs

Arxiv

0+阅读 · 3月5日

From Verbatim to Gist: Distilling Pyramidal Multimodal Memory via Semantic Information Bottleneck for Long-Horizon Video Agents

Arxiv

0+阅读 · 3月2日

On the Structure of Information

Arxiv

0+阅读 · 2月22日

On the Structure of Information

Arxiv

0+阅读 · 2月19日

Reason to Retrieve: Enhancing Query Understanding through Decomposition and Interpretation

Arxiv

0+阅读 · 2月10日

A Cost-Effective Near-Storage Processing Solution for Offline Inference of Long-Context LLMs

Arxiv

0+阅读 · 2月6日

Explanations are a Means to an End: Decision Theoretic Explanation Evaluation

Arxiv

0+阅读 · 2月4日

LLM-based Embeddings: Attention Values Encode Sentence Semantics Better Than Hidden States

Arxiv

0+阅读 · 2月2日

相关基金

互联网商业模式价格形成机制与资源配置效率研究——基于消费者信息不完美与搜寻的博弈理论视角

国家自然科学基金

0+阅读 · 2015年12月31日

基于聚合的社会化短文本信息处理与细粒度倾向性分析

国家自然科学基金

0+阅读 · 2015年12月31日

张量分析及其在高维信息处理中的应用

国家自然科学基金

4+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

强调与对比影响语篇理解的认知过程及其神经机制

国家自然科学基金

4+阅读 · 2015年12月31日

中文社交化短文本情感分析与话题挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

Web页面数据对象的感知理解与计算

国家自然科学基金

0+阅读 · 2014年12月31日

信息论学习中的正则化及相关高维数据分析方法的数学理论

国家自然科学基金

12+阅读 · 2014年12月31日

高密度信息存储的偏光全息理论及关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员