ABD: Default Exception Abduction in Finite First Order Worlds - 专知论文

会员服务 ·

0

基准 · 基准测试 · 包含 · 结构 · 输出 ·

ABD: Default Exception Abduction in Finite First Order Worlds

翻译：ABD：有限一阶世界中的默认异常溯因

Serafim Batzoglou

We introduce ABD, a benchmark for default-exception abduction over finite first-order worlds. Given a background theory with an abnormality predicate and a set of relational structures, a model must output a first-order formula that defines exceptions, restoring satisfiability while keeping exceptions sparse. We formalize three observation regimes (closed-world, existential completion, universal completion) with exact SMT verification. Evaluating ten frontier LLMs on 600 instances, the best models achieve high validity but parsimony gaps remain, and holdout evaluation reveals distinct generalization failure modes across regimes.

翻译：本文提出ABD，一个面向有限一阶世界中默认-异常溯因任务的基准测试。给定包含异常谓词的背景理论及一组关系结构，模型需输出一个定义异常情况的一阶公式，在恢复可满足性的同时保持异常描述的稀疏性。我们通过精确的SMT验证形式化了三种观测机制（封闭世界、存在性补全、全称补全）。在600个测试实例上对十个前沿大语言模型进行评估，最佳模型虽能实现较高的有效性，但简洁性仍存在差距；留出评估进一步揭示了不同观测机制下各异的泛化失效模式。

0

相关内容

【AAAI 2026 教程】面向图数据异常活动检测的基础模型研究进展

【AAAI 2026 教程】面向图数据异常活动检测的基础模型研究进展

专知会员服务

25+阅读 · 1月26日

【KDD2025】一种新颖的可解释性无监督异常检测模型

【KDD2025】一种新颖的可解释性无监督异常检测模型

专知会员服务

8+阅读 · 2025年11月6日

分布外如何检测？东大等最新《视觉语言模型时代的广义异常检测及其拓展》综述

分布外如何检测？东大等最新《视觉语言模型时代的广义异常检测及其拓展》综述

专知会员服务

25+阅读 · 2024年8月2日

【WWW2024】知识数据对齐的弱监督异常检测

【WWW2024】知识数据对齐的弱监督异常检测

专知会员服务

23+阅读 · 2024年2月7日

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

专知会员服务

37+阅读 · 2023年7月22日

《基于高斯混合流和入包的异常检测》2023最新57页论文

《基于高斯混合流和入包的异常检测》2023最新57页论文

专知会员服务

29+阅读 · 2023年5月15日

索邦大学121页博士论文《时间序列中的无监督异常检测》

索邦大学121页博士论文《时间序列中的无监督异常检测》

专知会员服务

104+阅读 · 2022年7月25日

复杂系统如何检测异常？北卡UNCC等最新《复杂分布式系统中基于图的深度学习异常检测方法综述》，阐述最新图异常检测技术进展

复杂系统如何检测异常？北卡UNCC等最新《复杂分布式系统中基于图的深度学习异常检测方法综述》，阐述最新图异常检测技术进展

专知会员服务

58+阅读 · 2022年6月12日

熊辉等首篇「深度学习图异常检测」综述论文，176篇文献全面概述GAD技术

熊辉等首篇「深度学习图异常检测」综述论文，176篇文献全面概述GAD技术

专知会员服务

83+阅读 · 2021年6月23日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知会员服务

219+阅读 · 2019年10月18日

莫纳什大学最新「深度学习时间序列异常检测」综述

莫纳什大学最新「深度学习时间序列异常检测」综述

专知

11+阅读 · 2022年11月11日

异常检测（Anomaly Detection）综述

异常检测（Anomaly Detection）综述

极市平台

20+阅读 · 2020年10月24日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知

49+阅读 · 2020年8月28日

异常检测怎么做，试试孤立随机森林算法（附代码）

异常检测怎么做，试试孤立随机森林算法（附代码）

机器之心

16+阅读 · 2020年3月15日

【技术分享】算法是如何更智能地发现异常商业数据的？

【技术分享】算法是如何更智能地发现异常商业数据的？

AliData

19+阅读 · 2019年8月21日

异常检测论文大列表：方法、应用、综述

异常检测论文大列表：方法、应用、综述

专知

126+阅读 · 2019年7月15日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

异常检测的阈值，你怎么选？给你整理好了...

异常检测的阈值，你怎么选？给你整理好了...

机器学习算法与Python学习

10+阅读 · 2018年9月19日

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

大数据文摘

19+阅读 · 2018年4月29日

不确定分数阶非线性系统Mittag-Leffler自适应控制

国家自然科学基金

1+阅读 · 2016年12月31日

有限元先验与后验误差估计中常数的精细估计及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

MBD环境下复杂产品信息网络的演化机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

社交网络级联数据流异常检测模型研究

国家自然科学基金

4+阅读 · 2015年12月31日

一组新的乙肝病毒X基因的序列变异在原发性肝癌中的临床意义和功能研究

国家自然科学基金

0+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

随机微分方程解的稳定性和矩有界性

国家自然科学基金

0+阅读 · 2015年12月31日

高维混合数据异常知识发现的粒计算模型关键问题研究

国家自然科学基金

1+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

时间序列异常值探测的Bayes方法及其在GNSS动态数据处理中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

ABD: Default Exception Abduction in Finite First Order Worlds

Arxiv

0+阅读 · 5月3日

Unified Taxonomy for Multivariate Time Series Anomaly Detection using Deep Learning

Arxiv

0+阅读 · 4月24日

KRONE: Hierarchical and Modular Log Anomaly Detection

Arxiv

0+阅读 · 3月25日

Revisiting OmniAnomaly for Anomaly Detection: performance metrics and comparison with PCA-based models

Arxiv

0+阅读 · 3月19日

Unified Taxonomy for Multivariate Time Series Anomaly Detection using Deep Learning

Arxiv

0+阅读 · 3月19日

Anomaly detection using surprisals

Arxiv

0+阅读 · 3月10日

ABD: Default Exception Abduction in Finite First Order Worlds

Arxiv

0+阅读 · 3月8日

Least trimmed squares regression with missing values and cellwise outliers

Arxiv

0+阅读 · 3月4日

Learning Discriminative and Generalizable Anomaly Detector for Dynamic Graph with Limited Supervision

Arxiv

0+阅读 · 2月23日

Anomaly detection for generic failure monitoring in robotic assembly, screwing and manipulation

Arxiv

0+阅读 · 2月23日

VIP会员

文章信息

相关主题

最新内容

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

7+阅读 · 7月21日

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

8+阅读 · 7月21日

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

2+阅读 · 7月21日

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

4+阅读 · 7月21日

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

6+阅读 · 7月21日

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

5+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

7+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

6+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

8+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

6+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

8+阅读 · 7月20日

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

专知会员服务

8+阅读 · 7月20日

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

15+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

7+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

10+阅读 · 7月19日

相关VIP内容

【AAAI 2026 教程】面向图数据异常活动检测的基础模型研究进展

【AAAI 2026 教程】面向图数据异常活动检测的基础模型研究进展

专知会员服务

25+阅读 · 1月26日

【KDD2025】一种新颖的可解释性无监督异常检测模型

【KDD2025】一种新颖的可解释性无监督异常检测模型

专知会员服务

8+阅读 · 2025年11月6日

分布外如何检测？东大等最新《视觉语言模型时代的广义异常检测及其拓展》综述

分布外如何检测？东大等最新《视觉语言模型时代的广义异常检测及其拓展》综述

专知会员服务

25+阅读 · 2024年8月2日

【WWW2024】知识数据对齐的弱监督异常检测

【WWW2024】知识数据对齐的弱监督异常检测

专知会员服务

23+阅读 · 2024年2月7日

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

专知会员服务

37+阅读 · 2023年7月22日

《基于高斯混合流和入包的异常检测》2023最新57页论文

《基于高斯混合流和入包的异常检测》2023最新57页论文

专知会员服务

29+阅读 · 2023年5月15日

索邦大学121页博士论文《时间序列中的无监督异常检测》

索邦大学121页博士论文《时间序列中的无监督异常检测》

专知会员服务

104+阅读 · 2022年7月25日

复杂系统如何检测异常？北卡UNCC等最新《复杂分布式系统中基于图的深度学习异常检测方法综述》，阐述最新图异常检测技术进展

复杂系统如何检测异常？北卡UNCC等最新《复杂分布式系统中基于图的深度学习异常检测方法综述》，阐述最新图异常检测技术进展

专知会员服务

58+阅读 · 2022年6月12日

熊辉等首篇「深度学习图异常检测」综述论文，176篇文献全面概述GAD技术

熊辉等首篇「深度学习图异常检测」综述论文，176篇文献全面概述GAD技术

专知会员服务

83+阅读 · 2021年6月23日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知会员服务

219+阅读 · 2019年10月18日

热门VIP内容

开通专知VIP会员享更多权益服务

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

《无人机对海面作战影响评估》

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

相关资讯

莫纳什大学最新「深度学习时间序列异常检测」综述

莫纳什大学最新「深度学习时间序列异常检测」综述

专知

11+阅读 · 2022年11月11日

异常检测（Anomaly Detection）综述

异常检测（Anomaly Detection）综述

极市平台

20+阅读 · 2020年10月24日

【KDD2020-Tutorial】深度学习异常检测，180页ppt

【KDD2020-Tutorial】深度学习异常检测，180页ppt

专知

49+阅读 · 2020年8月28日

异常检测怎么做，试试孤立随机森林算法（附代码）

异常检测怎么做，试试孤立随机森林算法（附代码）

机器之心

16+阅读 · 2020年3月15日

【技术分享】算法是如何更智能地发现异常商业数据的？

【技术分享】算法是如何更智能地发现异常商业数据的？

AliData

19+阅读 · 2019年8月21日

异常检测论文大列表：方法、应用、综述

异常检测论文大列表：方法、应用、综述

专知

126+阅读 · 2019年7月15日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

最新49页《深度学习异常检测综述》论文，带你全面了解深度学习异常检测方法

专知

137+阅读 · 2019年1月14日

异常检测的阈值，你怎么选？给你整理好了...

异常检测的阈值，你怎么选？给你整理好了...

机器学习算法与Python学习

10+阅读 · 2018年9月19日

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

吴恩达机器学习中文版笔记：异常检测（Anomaly Detection）

大数据文摘

19+阅读 · 2018年4月29日

相关论文

ABD: Default Exception Abduction in Finite First Order Worlds

Arxiv

0+阅读 · 5月3日

Unified Taxonomy for Multivariate Time Series Anomaly Detection using Deep Learning

Arxiv

0+阅读 · 4月24日

KRONE: Hierarchical and Modular Log Anomaly Detection

Arxiv

0+阅读 · 3月25日

Revisiting OmniAnomaly for Anomaly Detection: performance metrics and comparison with PCA-based models

Arxiv

0+阅读 · 3月19日

Unified Taxonomy for Multivariate Time Series Anomaly Detection using Deep Learning

Arxiv

0+阅读 · 3月19日

Anomaly detection using surprisals

Arxiv

0+阅读 · 3月10日

ABD: Default Exception Abduction in Finite First Order Worlds

Arxiv

0+阅读 · 3月8日

Least trimmed squares regression with missing values and cellwise outliers

Arxiv

0+阅读 · 3月4日

Learning Discriminative and Generalizable Anomaly Detector for Dynamic Graph with Limited Supervision

Arxiv

0+阅读 · 2月23日

Anomaly detection for generic failure monitoring in robotic assembly, screwing and manipulation

Arxiv

0+阅读 · 2月23日

相关基金

不确定分数阶非线性系统Mittag-Leffler自适应控制

国家自然科学基金

1+阅读 · 2016年12月31日

有限元先验与后验误差估计中常数的精细估计及其应用

国家自然科学基金

1+阅读 · 2015年12月31日

MBD环境下复杂产品信息网络的演化机理研究

国家自然科学基金

0+阅读 · 2015年12月31日

社交网络级联数据流异常检测模型研究

国家自然科学基金

4+阅读 · 2015年12月31日

一组新的乙肝病毒X基因的序列变异在原发性肝癌中的临床意义和功能研究

国家自然科学基金

0+阅读 · 2015年12月31日

事件触发机制下随机多智能体系统的有限时间一致性研究

国家自然科学基金

2+阅读 · 2015年12月31日

随机微分方程解的稳定性和矩有界性

国家自然科学基金

0+阅读 · 2015年12月31日

高维混合数据异常知识发现的粒计算模型关键问题研究

国家自然科学基金

1+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

时间序列异常值探测的Bayes方法及其在GNSS动态数据处理中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员