Who Gets Flagged? The Pluralistic Evaluation Gap in AI Content Watermarking - 专知论文

会员服务 ·

0

Who Gets Flagged? The Pluralistic Evaluation Gap in AI Content Watermarking

翻译：谁会被标记？人工智能内容水印中的多元化评估差距

Alexander Nemecek,Osama Zafar,Yuqiao Xu,Wenbiao Li,Erman Ayday

from arxiv, 7 pages

Watermarking is becoming the default mechanism for AI content authentication, with governance policies and frameworks referencing it as infrastructure for content provenance. Yet across text, image, and audio modalities, watermark signal strength, detectability, and robustness depend on statistical properties of the content itself, properties that vary systematically across languages, cultural visual traditions, and demographic groups. We examine how this content dependence creates modality-specific pathways to bias. Reviewing the major watermarking benchmarks across modalities, we find that, with one exception, none report performance across languages, cultural content types, or population groups. To address this, we propose three concrete evaluation dimensions for pluralistic watermark benchmarking: cross-lingual detection parity, culturally diverse content coverage, and demographic disaggregation of detection metrics. We connect these to the governance frameworks currently mandating watermarking deployment and show that watermarking is held to a lower fairness standard than the generative systems it is meant to govern. Our position is that evaluation must precede deployment, and that the same bias auditing requirements applied to AI models should extend to the verification layer.

翻译：水印正成为人工智能内容认证的默认机制，治理政策与框架将其引述为内容溯源的基础设施。然而，在文本、图像与音频模态中，水印信号强度、可检测性与鲁棒性取决于内容本身的统计特性，而这些特性在不同语言、文化视觉传统及人口群体间存在系统性差异。我们探讨了这种内容依赖性如何产生跨模态的偏差路径。通过审视各模态的主要水印基准测试，我们发现除一项例外，均未报告跨语言、文化内容类型或人群组别的性能表现。为此，我们提出水印多元化基准测试的三个具体评估维度：跨语言检测公平性、多元文化内容覆盖率以及检测指标的人口统计学细分。我们将这些维度与当前强制部署水印的治理框架相关联，并表明水印所遵循的公平性标准低于其本应治理的生成式系统。我们的立场是：评估必须优先于部署，且应用于人工智能模型的偏差审计要求应延伸至验证层。

0

相关内容

面向 AI 生成图像的安全与鲁棒水印：全面综述

面向 AI 生成图像的安全与鲁棒水印：全面综述

专知会员服务

14+阅读 · 2025年10月6日

扩散模型时代的可视水印：进展与挑战

扩散模型时代的可视水印：进展与挑战

专知会员服务

7+阅读 · 2025年5月17日

《内容凭证：加强生成式人工智能时代的多媒体完整性》最新25页报告

《内容凭证：加强生成式人工智能时代的多媒体完整性》最新25页报告

专知会员服务

20+阅读 · 2025年3月4日

生成式人工智能数据标注安全规范

生成式人工智能数据标注安全规范

专知会员服务

52+阅读 · 2024年4月10日

大模型时代下的文本水印综述

大模型时代下的文本水印综述

专知会员服务

35+阅读 · 2024年1月26日

《网络安全标准实践指南——生成式人工智能服务内容标识方法》发布

《网络安全标准实践指南——生成式人工智能服务内容标识方法》发布

专知会员服务

37+阅读 · 2023年8月29日

重磅!《“可信AI”评估体系产品手册》正式发布,24页pdf

重磅!《“可信AI”评估体系产品手册》正式发布,24页pdf

专知会员服务

76+阅读 · 2023年7月4日

百度基于异构互联知识图谱的多模内容创作技术

百度基于异构互联知识图谱的多模内容创作技术

专知会员服务

52+阅读 · 2022年6月7日

人工智能模型水印研究综述

专知会员服务

28+阅读 · 2021年7月16日

《人工智能安全标准化白皮书（2019版）》发布, 95页PDF，全国信息安全标准化技术委员会

《人工智能安全标准化白皮书（2019版）》发布, 95页PDF，全国信息安全标准化技术委员会

专知会员服务

99+阅读 · 2019年11月4日

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

专知

18+阅读 · 2022年9月3日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

对抗攻击之利用水印生成对抗样本

对抗攻击之利用水印生成对抗样本

计算机视觉life

10+阅读 · 2020年9月27日

《人工智能之认知图谱》重磅发布（附报告全文下载）

《人工智能之认知图谱》重磅发布（附报告全文下载）

学术头条

42+阅读 · 2020年8月28日

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

AI前线

15+阅读 · 2019年3月21日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

论文公布啦！腾讯AI Lab开源最大规模多标签图像数据集，刷新行业数据集基准

论文公布啦！腾讯AI Lab开源最大规模多标签图像数据集，刷新行业数据集基准

专知

10+阅读 · 2019年1月8日

AI版权征文 | 日本人工智能发展及著作权问题上的选择与纠结（上篇）

AI版权征文 | 日本人工智能发展及著作权问题上的选择与纠结（上篇）

百度公共政策研究院

10+阅读 · 2018年11月1日

图像美学质量评价技术发展趋势

图像美学质量评价技术发展趋势

科技导报

19+阅读 · 2018年6月25日

从人脸识别到行人重识别，下一个风口

从人脸识别到行人重识别，下一个风口

计算机视觉战队

13+阅读 · 2017年11月24日

基于程序多模态的动态软件水印方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于非对称扩展的可逆水印研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于内容感知编辑算子的复合型人脸图像真实感绘制

国家自然科学基金

0+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

融合稀疏层次模型的内容辨识研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于超小波和全局特征量的数字音频水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

矢量地图数据的非对称数字水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

笔迹图像中关键词语过滤技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于人眼视觉特性与ASIFT的多尺度变换域视频水印算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

AgentMark: Utility-Preserving Behavioral Watermarking for Agents

Arxiv

0+阅读 · 4月24日

DuCodeMark: Dual-Purpose Code Dataset Watermarking via Style-Aware Watermark-Poison Design

Arxiv

0+阅读 · 4月20日

RLSpoofer: A Lightweight Evaluator for LLM Watermark Spoofing Resilience

Arxiv

0+阅读 · 4月13日

Gaussian Shannon: High-Precision Diffusion Model Watermarking Based on Communication

Arxiv

0+阅读 · 4月8日

UniMark: Artificial Intelligence Generated Content Identification Toolkit

Arxiv

0+阅读 · 4月2日

Functional Subspace Watermarking for Large Language Models

Arxiv

0+阅读 · 3月19日

Rel-Zero: Harnessing Patch-Pair Invariance for Robust Zero-Watermarking Against AI Editing

Arxiv

0+阅读 · 3月18日

Latent-Mark: An Audio Watermark Robust to Neural Resynthesis

Arxiv

0+阅读 · 3月16日

Editing Away the Evidence: Diffusion-Based Image Manipulation and the Failure Modes of Robust Watermarking

Arxiv

0+阅读 · 3月13日

SLICE: Semantic Latent Injection via Compartmentalized Embedding for Image Watermarking

Arxiv

0+阅读 · 3月13日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

3+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

3+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

3+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

3+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

3+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

3+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

4+阅读 · 6月22日

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

7+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

5+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

8+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

21+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

相关VIP内容

面向 AI 生成图像的安全与鲁棒水印：全面综述

面向 AI 生成图像的安全与鲁棒水印：全面综述

专知会员服务

14+阅读 · 2025年10月6日

扩散模型时代的可视水印：进展与挑战

扩散模型时代的可视水印：进展与挑战

专知会员服务

7+阅读 · 2025年5月17日

《内容凭证：加强生成式人工智能时代的多媒体完整性》最新25页报告

《内容凭证：加强生成式人工智能时代的多媒体完整性》最新25页报告

专知会员服务

20+阅读 · 2025年3月4日

生成式人工智能数据标注安全规范

生成式人工智能数据标注安全规范

专知会员服务

52+阅读 · 2024年4月10日

大模型时代下的文本水印综述

大模型时代下的文本水印综述

专知会员服务

35+阅读 · 2024年1月26日

《网络安全标准实践指南——生成式人工智能服务内容标识方法》发布

《网络安全标准实践指南——生成式人工智能服务内容标识方法》发布

专知会员服务

37+阅读 · 2023年8月29日

重磅!《“可信AI”评估体系产品手册》正式发布,24页pdf

重磅!《“可信AI”评估体系产品手册》正式发布,24页pdf

专知会员服务

76+阅读 · 2023年7月4日

百度基于异构互联知识图谱的多模内容创作技术

百度基于异构互联知识图谱的多模内容创作技术

专知会员服务

52+阅读 · 2022年6月7日

人工智能模型水印研究综述

专知会员服务

28+阅读 · 2021年7月16日

《人工智能安全标准化白皮书（2019版）》发布, 95页PDF，全国信息安全标准化技术委员会

《人工智能安全标准化白皮书（2019版）》发布, 95页PDF，全国信息安全标准化技术委员会

专知会员服务

99+阅读 · 2019年11月4日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 3D场景图：开放挑战与未来方向

21世纪的无人机战争

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

相关资讯

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

专知

18+阅读 · 2022年9月3日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

对抗攻击之利用水印生成对抗样本

对抗攻击之利用水印生成对抗样本

计算机视觉life

10+阅读 · 2020年9月27日

《人工智能之认知图谱》重磅发布（附报告全文下载）

《人工智能之认知图谱》重磅发布（附报告全文下载）

学术头条

42+阅读 · 2020年8月28日

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

AI前线

15+阅读 · 2019年3月21日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

论文公布啦！腾讯AI Lab开源最大规模多标签图像数据集，刷新行业数据集基准

论文公布啦！腾讯AI Lab开源最大规模多标签图像数据集，刷新行业数据集基准

专知

10+阅读 · 2019年1月8日

AI版权征文 | 日本人工智能发展及著作权问题上的选择与纠结（上篇）

AI版权征文 | 日本人工智能发展及著作权问题上的选择与纠结（上篇）

百度公共政策研究院

10+阅读 · 2018年11月1日

图像美学质量评价技术发展趋势

图像美学质量评价技术发展趋势

科技导报

19+阅读 · 2018年6月25日

从人脸识别到行人重识别，下一个风口

从人脸识别到行人重识别，下一个风口

计算机视觉战队

13+阅读 · 2017年11月24日

相关论文

AgentMark: Utility-Preserving Behavioral Watermarking for Agents

Arxiv

0+阅读 · 4月24日

DuCodeMark: Dual-Purpose Code Dataset Watermarking via Style-Aware Watermark-Poison Design

Arxiv

0+阅读 · 4月20日

RLSpoofer: A Lightweight Evaluator for LLM Watermark Spoofing Resilience

Arxiv

0+阅读 · 4月13日

Gaussian Shannon: High-Precision Diffusion Model Watermarking Based on Communication

Arxiv

0+阅读 · 4月8日

UniMark: Artificial Intelligence Generated Content Identification Toolkit

Arxiv

0+阅读 · 4月2日

Functional Subspace Watermarking for Large Language Models

Arxiv

0+阅读 · 3月19日

Rel-Zero: Harnessing Patch-Pair Invariance for Robust Zero-Watermarking Against AI Editing

Arxiv

0+阅读 · 3月18日

Latent-Mark: An Audio Watermark Robust to Neural Resynthesis

Arxiv

0+阅读 · 3月16日

Editing Away the Evidence: Diffusion-Based Image Manipulation and the Failure Modes of Robust Watermarking

Arxiv

0+阅读 · 3月13日

SLICE: Semantic Latent Injection via Compartmentalized Embedding for Image Watermarking

Arxiv

0+阅读 · 3月13日

相关基金

基于程序多模态的动态软件水印方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于非对称扩展的可逆水印研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于内容感知编辑算子的复合型人脸图像真实感绘制

国家自然科学基金

0+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

融合稀疏层次模型的内容辨识研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于超小波和全局特征量的数字音频水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

矢量地图数据的非对称数字水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

笔迹图像中关键词语过滤技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于人眼视觉特性与ASIFT的多尺度变换域视频水印算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员