Full-conformal novelty detection - 专知论文

会员服务 ·

0

共形 · 数据集 · 样本 · 非参数 · 推断 ·

Full-conformal novelty detection

翻译：全共形新颖性检测

Junu Lee,Ilia Popov,Zhimei Ren

This paper presents a powerful methodology for flexible full-data nonparametric novelty detection that offers distribution-free false discovery rate (FDR) control guarantees. Building on the full conformal inference framework and the concept of e-values, we introduce full conformal e-values to quantify evidence for novelty relative to a given reference dataset. These e-values are then utilized by carefully crafted multiple testing procedures to identify a set of novel units out-of-sample with provable finite-sample FDR control. We showcase several instantiations of e-values, including those which employ a data-driven model selection strategy to amplify power. Furthermore, our framework is extended to address distribution shift, accommodating scenarios where novelty detection must be performed on data drawn from a shifted distribution relative to the reference dataset. In all settings, our method can perform powerfully -- outperforming existing novelty detection methods -- even with limited amounts of reference data; this is illustrated by empirical evaluations on synthetic data and an application to a malicious LLM prompts dataset.

翻译：本文提出一种强大的全数据非参数新颖性检测方法论，该方法在无需分布假设的情况下提供虚假发现率（FDR）控制保证。基于全共形推断框架和e值概念，我们引入全共形e值来量化相对于给定参考数据集的证据新颖性。随后，通过精心设计的多重检验程序利用这些e值，在样本外识别出一组新颖单元，并具有可证明的有限样本FDR控制能力。我们展示了e值的多种实例化方式，包括采用数据驱动模型选择策略以增强检测效力的方法。此外，我们的框架被扩展至应对分布偏移场景，即新颖性检测需针对从偏移分布（相对于参考数据集）中抽取的数据执行。在所有设定下，即使参考数据量有限，我们的方法仍能表现出强劲性能——超越现有新颖性检测方法；这通过合成数据的实验评估及恶意大语言模型提示数据集的应用程序得到验证。

0

相关内容

【KDD2025】一种新颖的可解释性无监督异常检测模型

【KDD2025】一种新颖的可解释性无监督异常检测模型

专知会员服务

7+阅读 · 2025年11月6日

《假新闻检测的特征计算流程：基于大语言模型的提取方法》

《假新闻检测的特征计算流程：基于大语言模型的提取方法》

专知会员服务

15+阅读 · 2025年7月3日

【新书】共形预测的理论基础，179页pdf

【新书】共形预测的理论基础，179页pdf

专知会员服务

46+阅读 · 2024年11月20日

什么是共形预测？伯克利《共形预测》新书，David Stutz讲稿45页ppt

什么是共形预测？伯克利《共形预测》新书，David Stutz讲稿45页ppt

专知会员服务

61+阅读 · 2023年11月16日

《大型语言模型能否加强假新闻检测？利用数据增强改进假新闻检测》2023最新报告

《大型语言模型能否加强假新闻检测？利用数据增强改进假新闻检测》2023最新报告

专知会员服务

57+阅读 · 2023年10月16日

【博士论文】学习表征以检测新颖性和异常性，72页pdf

【博士论文】学习表征以检测新颖性和异常性，72页pdf

专知会员服务

19+阅读 · 2023年9月30日

《对媒体完整性进行数字、语义和物理分析》48页技术报告

《对媒体完整性进行数字、语义和物理分析》48页技术报告

专知会员服务

27+阅读 · 2023年9月21日

什么是共形预测(conformal prediction)？LPSM最新《共形预测》教程，71页ppt

什么是共形预测(conformal prediction)？LPSM最新《共形预测》教程，71页ppt

专知会员服务

44+阅读 · 2023年9月3日

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

专知会员服务

37+阅读 · 2023年7月22日

《基于高斯混合流和入包的异常检测》2023最新57页论文

《基于高斯混合流和入包的异常检测》2023最新57页论文

专知会员服务

29+阅读 · 2023年5月15日

异常检测（Anomaly Detection）综述

异常检测（Anomaly Detection）综述

极市平台

20+阅读 · 2020年10月24日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知

18+阅读 · 2020年10月11日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

异常检测论文大列表：方法、应用、综述

异常检测论文大列表：方法、应用、综述

专知

126+阅读 · 2019年7月15日

【学界】虚拟对抗训练：一种新颖的半监督学习正则化方法

【学界】虚拟对抗训练：一种新颖的半监督学习正则化方法

GAN生成式对抗网络

10+阅读 · 2019年6月9日

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

机器之心

11+阅读 · 2019年6月3日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

全新视角：用变分推断统一理解生成模型（VAE、GAN、AAE、ALI）

全新视角：用变分推断统一理解生成模型（VAE、GAN、AAE、ALI）

PaperWeekly

15+阅读 · 2018年7月19日

FAIR最新视觉论文集锦：FPN，RetinaNet，Mask和Mask-X RCNN（含代码实现）

FAIR最新视觉论文集锦：FPN，RetinaNet，Mask和Mask-X RCNN（含代码实现）

AI科技评论

16+阅读 · 2018年4月7日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

大规模多视角高维图像特征提取

国家自然科学基金

5+阅读 · 2017年12月31日

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

基于密集快速特征提取的可视媒体篡改检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维半参数模型假设检验问题的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多片计算全息图的凹非球面绝对检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

可用于深度非球面高精度、通用化检测的非零位环形子孔径拼接干涉检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

一种全新的结构修改重分析方法及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

非线性约束全局优化的新方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

Is It Novel and Why? Fine-Grained Patent Novelty Prediction Based on Passage Retrieval

Is It Novel and Why? Fine-Grained Patent Novelty Prediction Based on Passage Retrieval

Arxiv

0+阅读 · 5月4日

Beyond Fixed False Discovery Rates: Post-Hoc Conformal Selection with E-Variables

Arxiv

0+阅读 · 4月17日

Beyond Single-Dimension Novelty: How Combinations of Theory, Method, and Results-based Novelty Shape Scientific Impact

Arxiv

0+阅读 · 4月14日

NovBench: Evaluating Large Language Models on Academic Paper Novelty Assessment

Arxiv

0+阅读 · 4月13日

Beyond Fixed False Discovery Rates: Post-Hoc Conformal Selection with E-Variables

Arxiv

0+阅读 · 4月13日

Conformal Prediction Assessment: A Framework for Conditional Coverage Evaluation and Selection

Arxiv

0+阅读 · 3月28日

Efficient Detection of Bad Benchmark Items with Novel Scalability Coefficients

Arxiv

0+阅读 · 3月26日

Elements of Conformal Prediction for Statisticians

Arxiv

0+阅读 · 3月25日

On min-Storey estimators for multiple testing and conformal novelty detection

Arxiv

0+阅读 · 3月18日

On the Adversarial Robustness of Learning-based Conformal Novelty Detection

Arxiv

0+阅读 · 2月20日

VIP会员

文章信息

相关主题

最新内容

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

0+阅读 · 14分钟前

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

0+阅读 · 23分钟前

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

0+阅读 · 27分钟前

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

0+阅读 · 31分钟前

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

0+阅读 · 35分钟前

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

4+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

7+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

6+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

相关VIP内容

【KDD2025】一种新颖的可解释性无监督异常检测模型

【KDD2025】一种新颖的可解释性无监督异常检测模型

专知会员服务

7+阅读 · 2025年11月6日

《假新闻检测的特征计算流程：基于大语言模型的提取方法》

《假新闻检测的特征计算流程：基于大语言模型的提取方法》

专知会员服务

15+阅读 · 2025年7月3日

【新书】共形预测的理论基础，179页pdf

【新书】共形预测的理论基础，179页pdf

专知会员服务

46+阅读 · 2024年11月20日

什么是共形预测？伯克利《共形预测》新书，David Stutz讲稿45页ppt

什么是共形预测？伯克利《共形预测》新书，David Stutz讲稿45页ppt

专知会员服务

61+阅读 · 2023年11月16日

《大型语言模型能否加强假新闻检测？利用数据增强改进假新闻检测》2023最新报告

《大型语言模型能否加强假新闻检测？利用数据增强改进假新闻检测》2023最新报告

专知会员服务

57+阅读 · 2023年10月16日

【博士论文】学习表征以检测新颖性和异常性，72页pdf

【博士论文】学习表征以检测新颖性和异常性，72页pdf

专知会员服务

19+阅读 · 2023年9月30日

《对媒体完整性进行数字、语义和物理分析》48页技术报告

《对媒体完整性进行数字、语义和物理分析》48页技术报告

专知会员服务

27+阅读 · 2023年9月21日

什么是共形预测(conformal prediction)？LPSM最新《共形预测》教程，71页ppt

什么是共形预测(conformal prediction)？LPSM最新《共形预测》教程，71页ppt

专知会员服务

44+阅读 · 2023年9月3日

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

弹药异常检测《使用机器学习进行缺陷表征》最佳论文，MODSIM World 2023

专知会员服务

37+阅读 · 2023年7月22日

《基于高斯混合流和入包的异常检测》2023最新57页论文

《基于高斯混合流和入包的异常检测》2023最新57页论文

专知会员服务

29+阅读 · 2023年5月15日

热门VIP内容

开通专知VIP会员享更多权益服务

《特种部队在透明战场中的生存力》最新报告

《人工智能生成的零日漏洞：对未来作战的影响》

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

相关资讯

异常检测（Anomaly Detection）综述

异常检测（Anomaly Detection）综述

极市平台

20+阅读 · 2020年10月24日

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

【商汤科技】可变形Transformers端到端对象检测，Deformable DETR

专知

18+阅读 · 2020年10月11日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

异常检测论文大列表：方法、应用、综述

异常检测论文大列表：方法、应用、综述

专知

126+阅读 · 2019年7月15日

【学界】虚拟对抗训练：一种新颖的半监督学习正则化方法

【学界】虚拟对抗训练：一种新颖的半监督学习正则化方法

GAN生成式对抗网络

10+阅读 · 2019年6月9日

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

集多种半监督学习范式为一体，谷歌新研究提出新型半监督方法 MixMatch

机器之心

11+阅读 · 2019年6月3日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

全新视角：用变分推断统一理解生成模型（VAE、GAN、AAE、ALI）

全新视角：用变分推断统一理解生成模型（VAE、GAN、AAE、ALI）

PaperWeekly

15+阅读 · 2018年7月19日

FAIR最新视觉论文集锦：FPN，RetinaNet，Mask和Mask-X RCNN（含代码实现）

FAIR最新视觉论文集锦：FPN，RetinaNet，Mask和Mask-X RCNN（含代码实现）

AI科技评论

16+阅读 · 2018年4月7日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

相关论文

Is It Novel and Why? Fine-Grained Patent Novelty Prediction Based on Passage Retrieval

Is It Novel and Why? Fine-Grained Patent Novelty Prediction Based on Passage Retrieval

Arxiv

0+阅读 · 5月4日

Beyond Fixed False Discovery Rates: Post-Hoc Conformal Selection with E-Variables

Arxiv

0+阅读 · 4月17日

Beyond Single-Dimension Novelty: How Combinations of Theory, Method, and Results-based Novelty Shape Scientific Impact

Arxiv

0+阅读 · 4月14日

NovBench: Evaluating Large Language Models on Academic Paper Novelty Assessment

Arxiv

0+阅读 · 4月13日

Beyond Fixed False Discovery Rates: Post-Hoc Conformal Selection with E-Variables

Arxiv

0+阅读 · 4月13日

Conformal Prediction Assessment: A Framework for Conditional Coverage Evaluation and Selection

Arxiv

0+阅读 · 3月28日

Efficient Detection of Bad Benchmark Items with Novel Scalability Coefficients

Arxiv

0+阅读 · 3月26日

Elements of Conformal Prediction for Statisticians

Arxiv

0+阅读 · 3月25日

On min-Storey estimators for multiple testing and conformal novelty detection

Arxiv

0+阅读 · 3月18日

On the Adversarial Robustness of Learning-based Conformal Novelty Detection

Arxiv

0+阅读 · 2月20日

相关基金

大规模多视角高维图像特征提取

国家自然科学基金

5+阅读 · 2017年12月31日

语义Web知识库补全关键技术研究

国家自然科学基金

18+阅读 · 2017年12月31日

基于密集快速特征提取的可视媒体篡改检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

高维半参数模型假设检验问题的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多片计算全息图的凹非球面绝对检测技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

可用于深度非球面高精度、通用化检测的非零位环形子孔径拼接干涉检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

复杂数据下带有形状约束的半参数模型统计推断

国家自然科学基金

3+阅读 · 2014年12月31日

一种全新的结构修改重分析方法及其应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

非线性约束全局优化的新方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员