More Haste, Less Speed: Weaker Single-Layer Watermark Improves Distortion-Free Watermark Ensembles - 专知论文

会员服务 ·

0

集成 · 鲁棒 · 模型生成 · 强鲁棒性 · 词元 ·

More Haste, Less Speed: Weaker Single-Layer Watermark Improves Distortion-Free Watermark Ensembles

翻译：欲速则不达：更弱的单层水印提升无失真水印集成效果

Ruibo Chen,Yihan Wu,Xuehao Cui,Jingqi Zhang,Heng Huang

Watermarking has emerged as a crucial technique for detecting and attributing content generated by large language models. While recent advancements have utilized watermark ensembles to enhance robustness, prevailing methods typically prioritize maximizing the strength of the watermark at every individual layer. In this work, we identify a critical limitation in this "stronger-is-better" approach: strong watermarks significantly reduce the entropy of the token distribution, which paradoxically weakens the effectiveness of watermarking in subsequent layers. We theoretically and empirically show that detectability is bounded by entropy and that watermark ensembles induce a monotonic decrease in both entropy and the expected green-list ratio across layers. To address this inherent trade-off, we propose a general framework that utilizes weaker single-layer watermarks to preserve the entropy required for effective multi-layer ensembling. Empirical evaluations demonstrate that this counter-intuitive strategy mitigates signal decay and consistently outperforms strong baselines in both detectability and robustness.

翻译：水印技术已成为检测和溯源大语言模型生成内容的关键方法。尽管近期研究利用水印集成来增强鲁棒性，但主流方法通常优先追求最大化每一独立层的水印强度。本研究发现这种"越强越好"策略存在关键局限：强水印会显著降低词元分布的熵值，这种效应反而会削弱后续层的水印有效性。我们通过理论与实验证明，可检测性受熵值约束，且水印集成会导致熵值与预期绿表比率随层数增加呈单调递减。为应对这一固有权衡，我们提出一个通用框架，通过采用更弱的单层水印来保持有效多层集成所需的熵值。实证评估表明，这一反直觉策略能有效缓解信号衰减，在可检测性与鲁棒性方面均持续优于现有强基线方法。

0

相关内容

面向 AI 生成图像的安全与鲁棒水印：全面综述

面向 AI 生成图像的安全与鲁棒水印：全面综述

专知会员服务

14+阅读 · 2025年10月6日

扩散模型时代的可视水印：进展与挑战

扩散模型时代的可视水印：进展与挑战

专知会员服务

7+阅读 · 2025年5月17日

图增强生成（GraphRAG）

图增强生成（GraphRAG）

专知会员服务

35+阅读 · 2025年1月4日

【CIKM2024】LLM蒸馏到GNN，性能提升6.2%！Emory提出大模型蒸馏到文本图｜CIKM 2024

【CIKM2024】LLM蒸馏到GNN，性能提升6.2%！Emory提出大模型蒸馏到文本图｜CIKM 2024

专知会员服务

23+阅读 · 2024年8月22日

大模型时代下的文本水印综述

大模型时代下的文本水印综述

专知会员服务

35+阅读 · 2024年1月26日

NeurIPS 2023｜LLM给CLIP加buff了！LaCLIP：利用大模型重写文本改进 CLIP 训练

NeurIPS 2023｜LLM给CLIP加buff了！LaCLIP：利用大模型重写文本改进 CLIP 训练

专知会员服务

35+阅读 · 2024年1月13日

大模型如何高效？OSU等最新《高效大型语言模型》综述，详述模型压缩、预训练、微调、提示等技术

大模型如何高效？OSU等最新《高效大型语言模型》综述，详述模型压缩、预训练、微调、提示等技术

专知会员服务

70+阅读 · 2023年12月10日

大模型哪家强？清华最新《大语言模型综合性能评估报告》权威评测，26页ppt

大模型哪家强？清华最新《大语言模型综合性能评估报告》权威评测，26页ppt

专知会员服务

157+阅读 · 2023年8月8日

低资源如何合成图像？华东理工等最新《有限数据下的图像合成》综述，详述图像合成技术进展

低资源如何合成图像？华东理工等最新《有限数据下的图像合成》综述，详述图像合成技术进展

专知会员服务

29+阅读 · 2023年8月7日

人工智能模型水印研究综述

专知会员服务

28+阅读 · 2021年7月16日

对抗攻击之利用水印生成对抗样本

对抗攻击之利用水印生成对抗样本

计算机视觉life

10+阅读 · 2020年9月27日

如何有效提升中文NER性能？词汇增强方法总结

如何有效提升中文NER性能？词汇增强方法总结

AINLP

25+阅读 · 2020年6月15日

30秒让图片变裸照，使用无门槛，这个软件比Deepfake杀伤力更大

30秒让图片变裸照，使用无门槛，这个软件比Deepfake杀伤力更大

AI100

29+阅读 · 2019年6月28日

基于GAN的图像水印去除器，效果堪比PS高手

基于GAN的图像水印去除器，效果堪比PS高手

AI100

12+阅读 · 2019年6月25日

Fast-OCNet: 更快更好的OCNet.

Fast-OCNet: 更快更好的OCNet.

极市平台

21+阅读 · 2019年2月10日

GitHub项目推荐 | 深度抠图(Keras/TensorFlow/OpenCV) - Deep Image Matting

GitHub项目推荐 | 深度抠图(Keras/TensorFlow/OpenCV) - Deep Image Matting

AI研习社

70+阅读 · 2018年12月29日

NLP-Progress记录NLP最新数据集、论文和代码: 助你紧跟NLP前沿

NLP-Progress记录NLP最新数据集、论文和代码: 助你紧跟NLP前沿

中国人工智能学会

12+阅读 · 2018年11月15日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

IBM新论文|SamplePairing：针对图像处理领域的高效数据增强方式

IBM新论文|SamplePairing：针对图像处理领域的高效数据增强方式

极市平台

16+阅读 · 2018年1月20日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

基于程序多模态的动态软件水印方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于离子印迹固相萃取分离和富集海水痕量金属元素自动快速监测新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非对称扩展的可逆水印研究

国家自然科学基金

0+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

云计算下的加密域多媒体水印与模式匹配

国家自然科学基金

1+阅读 · 2015年12月31日

图像复原中非凸稀疏优化问题的快速算法

国家自然科学基金

0+阅读 · 2015年12月31日

基于超小波和全局特征量的数字音频水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

矢量地图数据的非对称数字水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

笔迹图像中关键词语过滤技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于人眼视觉特性与ASIFT的多尺度变换域视频水印算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

PMark: Towards Robust and Distortion-free Semantic-level Watermarking with Channel Constraints

Arxiv

0+阅读 · 3月2日

Vanishing Watermarks: Diffusion-Based Image Editing Undermines Robust Invisible Watermarking

Arxiv

0+阅读 · 2月24日

Improving the Trade-off Between Watermark Strength and Speculative Sampling Efficiency for Language Models

Arxiv

0+阅读 · 2月23日

A Watermark for Black-Box Language Models

Arxiv

0+阅读 · 2月23日

Towards Anytime-Valid Statistical Watermarking

Towards Anytime-Valid Statistical Watermarking

Arxiv

0+阅读 · 2月19日

Online LLM watermark detection via e-processes

Arxiv

0+阅读 · 2月15日

A Unified Framework for LLM Watermarks

Arxiv

0+阅读 · 2月6日

Improving Detection of Watermarked Language Models

Arxiv

0+阅读 · 2月3日

MarkCleaner: High-Fidelity Watermark Removal via Imperceptible Micro-Geometric Perturbation

Arxiv

0+阅读 · 2月2日

MirrorMark: A Distortion-Free Multi-Bit Watermark for Large Language Models

Arxiv

0+阅读 · 1月29日

VIP会员

文章信息

相关主题

最新内容

《Palantir的科技生态系统》

《Palantir的科技生态系统》

专知会员服务

0+阅读 · 15分钟前

《脑机接口：拓展神经前沿及其战略意涵》最新报告

《脑机接口：拓展神经前沿及其战略意涵》最新报告

专知会员服务

1+阅读 · 20分钟前

《美军联合跨部门特遣部队401：反无人机系统表征通用标准（C4）》最新报告（中文版）

《美军联合跨部门特遣部队401：反无人机系统表征通用标准（C4）》最新报告（中文版）

专知会员服务

1+阅读 · 38分钟前

《反无人机系统传感器融合》90页报告

《反无人机系统传感器融合》90页报告

专知会员服务

1+阅读 · 41分钟前

运用人工智能与卫星通信驱散“战争迷雾”

运用人工智能与卫星通信驱散“战争迷雾”

专知会员服务

1+阅读 · 53分钟前

ACL 2026 | LLMSurgeon：从生成文本诊断大模型训练数据

ACL 2026 | LLMSurgeon：从生成文本诊断大模型训练数据

专知会员服务

0+阅读 · 今天14:18

【综述】世界模型：架构、方法、推理与应用全景

【综述】世界模型：架构、方法、推理与应用全景

专知会员服务

0+阅读 · 今天14:16

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

专知会员服务

4+阅读 · 6月1日

综述 | OPSD：大语言模型的在线策略自蒸馏

综述 | OPSD：大语言模型的在线策略自蒸馏

专知会员服务

3+阅读 · 6月1日

算法化战争：人工智能时代的新范式（万字长文）

算法化战争：人工智能时代的新范式（万字长文）

专知会员服务

10+阅读 · 6月1日

帕兰蒂尔Maven：军事人工智能的新纪元

帕兰蒂尔Maven：军事人工智能的新纪元

专知会员服务

8+阅读 · 6月1日

《军事网络取证系统中的人工智能驱动情报融合：帕兰蒂尔公司“Maven智能系统”案例研究》

《军事网络取证系统中的人工智能驱动情报融合：帕兰蒂尔公司“Maven智能系统”案例研究》

专知会员服务

10+阅读 · 6月1日

《扩展主权人工智能操作系统：将Symphony作为帕兰蒂尔Foundry与英伟达的计算本体》

《扩展主权人工智能操作系统：将Symphony作为帕兰蒂尔Foundry与英伟达的计算本体》

专知会员服务

10+阅读 · 6月1日

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

专知会员服务

14+阅读 · 5月31日

比利时发布用于实时战场军事装备识别的离线人工智能系统

比利时发布用于实时战场军事装备识别的离线人工智能系统

专知会员服务

6+阅读 · 5月31日

相关VIP内容

面向 AI 生成图像的安全与鲁棒水印：全面综述

面向 AI 生成图像的安全与鲁棒水印：全面综述

专知会员服务

14+阅读 · 2025年10月6日

扩散模型时代的可视水印：进展与挑战

扩散模型时代的可视水印：进展与挑战

专知会员服务

7+阅读 · 2025年5月17日

图增强生成（GraphRAG）

图增强生成（GraphRAG）

专知会员服务

35+阅读 · 2025年1月4日

【CIKM2024】LLM蒸馏到GNN，性能提升6.2%！Emory提出大模型蒸馏到文本图｜CIKM 2024

【CIKM2024】LLM蒸馏到GNN，性能提升6.2%！Emory提出大模型蒸馏到文本图｜CIKM 2024

专知会员服务

23+阅读 · 2024年8月22日

大模型时代下的文本水印综述

大模型时代下的文本水印综述

专知会员服务

35+阅读 · 2024年1月26日

NeurIPS 2023｜LLM给CLIP加buff了！LaCLIP：利用大模型重写文本改进 CLIP 训练

NeurIPS 2023｜LLM给CLIP加buff了！LaCLIP：利用大模型重写文本改进 CLIP 训练

专知会员服务

35+阅读 · 2024年1月13日

大模型如何高效？OSU等最新《高效大型语言模型》综述，详述模型压缩、预训练、微调、提示等技术

大模型如何高效？OSU等最新《高效大型语言模型》综述，详述模型压缩、预训练、微调、提示等技术

专知会员服务

70+阅读 · 2023年12月10日

大模型哪家强？清华最新《大语言模型综合性能评估报告》权威评测，26页ppt

大模型哪家强？清华最新《大语言模型综合性能评估报告》权威评测，26页ppt

专知会员服务

157+阅读 · 2023年8月8日

低资源如何合成图像？华东理工等最新《有限数据下的图像合成》综述，详述图像合成技术进展

低资源如何合成图像？华东理工等最新《有限数据下的图像合成》综述，详述图像合成技术进展

专知会员服务

29+阅读 · 2023年8月7日

人工智能模型水印研究综述

专知会员服务

28+阅读 · 2021年7月16日

热门VIP内容

开通专知VIP会员享更多权益服务

《脑机接口：拓展神经前沿及其战略意涵》最新报告

《反无人机系统传感器融合》90页报告

《Palantir的科技生态系统》

《美军联合跨部门特遣部队401：反无人机系统表征通用标准（C4）》最新报告（中文版）

相关资讯

对抗攻击之利用水印生成对抗样本

对抗攻击之利用水印生成对抗样本

计算机视觉life

10+阅读 · 2020年9月27日

如何有效提升中文NER性能？词汇增强方法总结

如何有效提升中文NER性能？词汇增强方法总结

AINLP

25+阅读 · 2020年6月15日

30秒让图片变裸照，使用无门槛，这个软件比Deepfake杀伤力更大

30秒让图片变裸照，使用无门槛，这个软件比Deepfake杀伤力更大

AI100

29+阅读 · 2019年6月28日

基于GAN的图像水印去除器，效果堪比PS高手

基于GAN的图像水印去除器，效果堪比PS高手

AI100

12+阅读 · 2019年6月25日

Fast-OCNet: 更快更好的OCNet.

Fast-OCNet: 更快更好的OCNet.

极市平台

21+阅读 · 2019年2月10日

GitHub项目推荐 | 深度抠图(Keras/TensorFlow/OpenCV) - Deep Image Matting

GitHub项目推荐 | 深度抠图(Keras/TensorFlow/OpenCV) - Deep Image Matting

AI研习社

70+阅读 · 2018年12月29日

NLP-Progress记录NLP最新数据集、论文和代码: 助你紧跟NLP前沿

NLP-Progress记录NLP最新数据集、论文和代码: 助你紧跟NLP前沿

中国人工智能学会

12+阅读 · 2018年11月15日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

IBM新论文|SamplePairing：针对图像处理领域的高效数据增强方式

IBM新论文|SamplePairing：针对图像处理领域的高效数据增强方式

极市平台

16+阅读 · 2018年1月20日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

相关论文

PMark: Towards Robust and Distortion-free Semantic-level Watermarking with Channel Constraints

Arxiv

0+阅读 · 3月2日

Vanishing Watermarks: Diffusion-Based Image Editing Undermines Robust Invisible Watermarking

Arxiv

0+阅读 · 2月24日

Improving the Trade-off Between Watermark Strength and Speculative Sampling Efficiency for Language Models

Arxiv

0+阅读 · 2月23日

A Watermark for Black-Box Language Models

Arxiv

0+阅读 · 2月23日

Towards Anytime-Valid Statistical Watermarking

Towards Anytime-Valid Statistical Watermarking

Arxiv

0+阅读 · 2月19日

Online LLM watermark detection via e-processes

Arxiv

0+阅读 · 2月15日

A Unified Framework for LLM Watermarks

Arxiv

0+阅读 · 2月6日

Improving Detection of Watermarked Language Models

Arxiv

0+阅读 · 2月3日

MarkCleaner: High-Fidelity Watermark Removal via Imperceptible Micro-Geometric Perturbation

Arxiv

0+阅读 · 2月2日

MirrorMark: A Distortion-Free Multi-Bit Watermark for Large Language Models

Arxiv

0+阅读 · 1月29日

相关基金

基于程序多模态的动态软件水印方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于离子印迹固相萃取分离和富集海水痕量金属元素自动快速监测新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非对称扩展的可逆水印研究

国家自然科学基金

0+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

云计算下的加密域多媒体水印与模式匹配

国家自然科学基金

1+阅读 · 2015年12月31日

图像复原中非凸稀疏优化问题的快速算法

国家自然科学基金

0+阅读 · 2015年12月31日

基于超小波和全局特征量的数字音频水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

矢量地图数据的非对称数字水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

笔迹图像中关键词语过滤技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于人眼视觉特性与ASIFT的多尺度变换域视频水印算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员