语义内容决定算法性能 (Semantic Content Determines Algorithmic Performance) - 专知论文

会员服务 ·

0

算法 · 近似 · 语言模型 · 大语言模型 · 不变 ·

Semantic Content Determines Algorithmic Performance

翻译：语义内容决定算法性能

Martiño Ríos-García,Nawaf Alampara,Kevin Maik Jablonka

Counting should not depend on what is being counted; more generally, any algorithm's behavior should be invariant to the semantic content of its arguments. We introduce WhatCounts to test this property in isolation. Unlike prior work that conflates semantic sensitivity with reasoning complexity or prompt variation, WhatCounts is atomic: count items in an unambiguous, delimited list with no duplicates, distractors, or reasoning steps for different semantic types. Frontier LLMs show over 40% accuracy variation depending solely on what is being counted - cities versus chemicals, names versus symbols. Controlled ablations rule out confounds. The gap is semantic, and it shifts unpredictably with small amounts of unrelated fine-tuning. LLMs do not implement algorithms; they approximate them, and the approximation is argument-dependent. As we show with an agentic example, this has implications beyond counting: any LLM function may carry hidden dependencies on the meaning of its inputs.

翻译：计数不应依赖于被计数对象；更一般地说，任何算法的行为都应对其参数的语义内容保持不变。我们提出WhatCounts来独立验证这一特性。与先前将语义敏感性与推理复杂度或提示词变化相混淆的研究不同，WhatCounts具有原子性：针对不同语义类型，在无歧义、带分隔符且无重复项和干扰项的列表中直接计数，无需推理步骤。前沿大语言模型仅因计数对象不同——城市与化学品、名称与符号——就表现出超过40%准确率差异。受控消融实验排除了混杂因素。这种差异源于语义层面，且会因少量无关微调而产生不可预测的变化。大语言模型并非实现算法，而是近似算法，且这种近似具有参数依赖性。正如我们在智能体示例中所展示的，这一现象的影响超越计数范畴：任何大语言模型函数都可能隐含着对其输入意义的潜在依赖。

0

相关内容

在数学和计算机科学之中，算法（Algorithm）为一个计算的具体步骤，常用于计算、数据处理和自动推理。精确而言，算法是一个表示为有限长列表的有效方法。算法应包含清晰定义的指令用于计算函数。来自维基百科：算法

【剑桥大学-算法手册】Advanced Algorithms, Artificial Intelligence

【剑桥大学-算法手册】Advanced Algorithms, Artificial Intelligence

专知会员服务

36+阅读 · 2024年11月11日

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

专知会员服务

56+阅读 · 2022年10月8日

【干货书】算法，Algorithms，314页pdf

【干货书】算法，Algorithms，314页pdf

专知会员服务

84+阅读 · 2022年8月20日

“推荐算法”究竟是什么？人大《算法向善与个性化推荐发展研究》报告帮你快速了解，附48页pdf

“推荐算法”究竟是什么？人大《算法向善与个性化推荐发展研究》报告帮你快速了解，附48页pdf

专知会员服务

48+阅读 · 2022年2月9日

【经典书】算法C语言实现，Algorithms in C. 672页pdf

【经典书】算法C语言实现，Algorithms in C. 672页pdf

专知会员服务

82+阅读 · 2020年8月13日

【经典书】算法基础：打开算法之门，Algorithm unlocked，237页pdf

【经典书】算法基础：打开算法之门，Algorithm unlocked，237页pdf

专知会员服务

147+阅读 · 2020年7月3日

【KDD2020】具有条件公平性的算法决策，Algorithmic Decision Making with Conditional Fairness

【KDD2020】具有条件公平性的算法决策，Algorithmic Decision Making with Conditional Fairness

专知会员服务

22+阅读 · 2020年6月19日

语义相似性算法演化论文，29页pdf，Evolution of Semantic Similarity - A Survey

语义相似性算法演化论文，29页pdf，Evolution of Semantic Similarity - A Survey

专知会员服务

44+阅读 · 2020年4月30日

因果关联学习，Causal Relational Learning

因果关联学习，Causal Relational Learning

专知会员服务

185+阅读 · 2020年4月21日

【NLP| 推荐文章】基于文本和知识库的语义搜索（Semantic search on text and knowledge bases）

专知会员服务

46+阅读 · 2019年11月24日

基于深度元学习的因果推断新方法

基于深度元学习的因果推断新方法

图与推荐

12+阅读 · 2020年7月21日

如何有效提升中文NER性能？词汇增强方法总结

如何有效提升中文NER性能？词汇增强方法总结

AINLP

25+阅读 · 2020年6月15日

“文本情感语义计算”国家自然科学基金重点项目网站正式上线

“文本情感语义计算”国家自然科学基金重点项目网站正式上线

哈工大SCIR

12+阅读 · 2019年8月16日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

专栏 | 如何做好文本关键词提取？从三种算法说起

专栏 | 如何做好文本关键词提取？从三种算法说起

机器之心

14+阅读 · 2018年3月4日

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

新智元

35+阅读 · 2018年1月24日

干货|掌握机器学习数学基础之优化[1]（重点知识）

干货|掌握机器学习数学基础之优化[1]（重点知识）

机器学习研究会

10+阅读 · 2017年11月19日

关系推理：基于表示学习和语义要素

关系推理：基于表示学习和语义要素

计算机研究与发展

19+阅读 · 2017年8月22日

云计算环境中面向内容的密文检索关键技术研究

国家自然科学基金

0+阅读 · 2017年12月31日

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

随机映射框架下的图像语义分析与提取技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

数据分析算法的融合与人才培养

国家自然科学基金

7+阅读 · 2015年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

Universal computation is intrinsic to language model decoding

Arxiv

0+阅读 · 2月10日

Semantics and Multi-Query Optimization Algorithms for the Analyze Operator

Arxiv

0+阅读 · 2月9日

Semantic Self-Distillation for Language Model Uncertainty

Arxiv

0+阅读 · 2月4日

Code over Words: Overcoming Semantic Inertia via Code-Grounded Reasoning

Arxiv

0+阅读 · 2月2日

LLM-based Embeddings: Attention Values Encode Sentence Semantics Better Than Hidden States

Arxiv

0+阅读 · 2月2日

People Can Accurately Predict Behavior of Complex Algorithms That Are Available, Compact, and Aligned

Arxiv

0+阅读 · 1月26日

Surprisal and Metaphor Novelty Judgments: Moderate Correlations and Divergent Scaling Effects Revealed by Corpus-Based and Synthetic Datasets

Arxiv

0+阅读 · 1月26日

Form and Meaning in Intrinsic Multilingual Evaluations

Arxiv

0+阅读 · 1月15日

Multilinguality as Sense Adaptation

Arxiv

0+阅读 · 1月15日

Value-Aware Numerical Representations for Transformer Language Models

Arxiv

0+阅读 · 1月14日

VIP会员

文章信息

相关主题

大语言模型

相关VIP内容

【剑桥大学-算法手册】Advanced Algorithms, Artificial Intelligence

【剑桥大学-算法手册】Advanced Algorithms, Artificial Intelligence

专知会员服务

36+阅读 · 2024年11月11日

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

推荐！【量子算法设计、应用】《不确定性条件下用于决策的量子计算算法》IBM、美国空军109页技术报告

专知会员服务

56+阅读 · 2022年10月8日

【干货书】算法，Algorithms，314页pdf

【干货书】算法，Algorithms，314页pdf

专知会员服务

84+阅读 · 2022年8月20日

“推荐算法”究竟是什么？人大《算法向善与个性化推荐发展研究》报告帮你快速了解，附48页pdf

“推荐算法”究竟是什么？人大《算法向善与个性化推荐发展研究》报告帮你快速了解，附48页pdf

专知会员服务

48+阅读 · 2022年2月9日

【经典书】算法C语言实现，Algorithms in C. 672页pdf

【经典书】算法C语言实现，Algorithms in C. 672页pdf

专知会员服务

82+阅读 · 2020年8月13日

【经典书】算法基础：打开算法之门，Algorithm unlocked，237页pdf

【经典书】算法基础：打开算法之门，Algorithm unlocked，237页pdf

专知会员服务

147+阅读 · 2020年7月3日

【KDD2020】具有条件公平性的算法决策，Algorithmic Decision Making with Conditional Fairness

【KDD2020】具有条件公平性的算法决策，Algorithmic Decision Making with Conditional Fairness

专知会员服务

22+阅读 · 2020年6月19日

语义相似性算法演化论文，29页pdf，Evolution of Semantic Similarity - A Survey

语义相似性算法演化论文，29页pdf，Evolution of Semantic Similarity - A Survey

专知会员服务

44+阅读 · 2020年4月30日

因果关联学习，Causal Relational Learning

因果关联学习，Causal Relational Learning

专知会员服务

185+阅读 · 2020年4月21日

【NLP| 推荐文章】基于文本和知识库的语义搜索（Semantic search on text and knowledge bases）

专知会员服务

46+阅读 · 2019年11月24日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

基于深度元学习的因果推断新方法

基于深度元学习的因果推断新方法

图与推荐

12+阅读 · 2020年7月21日

如何有效提升中文NER性能？词汇增强方法总结

如何有效提升中文NER性能？词汇增强方法总结

AINLP

25+阅读 · 2020年6月15日

“文本情感语义计算”国家自然科学基金重点项目网站正式上线

“文本情感语义计算”国家自然科学基金重点项目网站正式上线

哈工大SCIR

12+阅读 · 2019年8月16日

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

北大、清华、微软联合提出RepPoints，比边界框更好用的目标检测方法

全球人工智能

13+阅读 · 2019年4月30日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

变分自编码器（Variational Autoencoder, VAE）通俗教程，细节、基础、符号解释很齐全

CreateAMind

12+阅读 · 2018年4月7日

专栏 | 如何做好文本关键词提取？从三种算法说起

专栏 | 如何做好文本关键词提取？从三种算法说起

机器之心

14+阅读 · 2018年3月4日

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

【计算机视觉必读干货】图像分类、定位、检测，语义分割和实例分割方法梳理

新智元

35+阅读 · 2018年1月24日

干货|掌握机器学习数学基础之优化[1]（重点知识）

干货|掌握机器学习数学基础之优化[1]（重点知识）

机器学习研究会

10+阅读 · 2017年11月19日

关系推理：基于表示学习和语义要素

关系推理：基于表示学习和语义要素

计算机研究与发展

19+阅读 · 2017年8月22日

相关论文

Universal computation is intrinsic to language model decoding

Arxiv

0+阅读 · 2月10日

Semantics and Multi-Query Optimization Algorithms for the Analyze Operator

Arxiv

0+阅读 · 2月9日

Semantic Self-Distillation for Language Model Uncertainty

Arxiv

0+阅读 · 2月4日

Code over Words: Overcoming Semantic Inertia via Code-Grounded Reasoning

Arxiv

0+阅读 · 2月2日

LLM-based Embeddings: Attention Values Encode Sentence Semantics Better Than Hidden States

Arxiv

0+阅读 · 2月2日

People Can Accurately Predict Behavior of Complex Algorithms That Are Available, Compact, and Aligned

Arxiv

0+阅读 · 1月26日

Surprisal and Metaphor Novelty Judgments: Moderate Correlations and Divergent Scaling Effects Revealed by Corpus-Based and Synthetic Datasets

Arxiv

0+阅读 · 1月26日

Form and Meaning in Intrinsic Multilingual Evaluations

Arxiv

0+阅读 · 1月15日

Multilinguality as Sense Adaptation

Arxiv

0+阅读 · 1月15日

Value-Aware Numerical Representations for Transformer Language Models

Arxiv

0+阅读 · 1月14日

相关基金

云计算环境中面向内容的密文检索关键技术研究

国家自然科学基金

0+阅读 · 2017年12月31日

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

逻辑等价算子在不确定性推理中的应用

国家自然科学基金

1+阅读 · 2015年12月31日

随机映射框架下的图像语义分析与提取技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于犹豫模糊语言信息的定性决策理论与方法

国家自然科学基金

2+阅读 · 2015年12月31日

数据分析算法的融合与人才培养

国家自然科学基金

7+阅读 · 2015年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

基于深度学习的机器译文质量估计方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

不确定性推理与语义网中知识表示的数学基础

国家自然科学基金

18+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员