SWAN: Semantic Watermarking with Abstract Meaning Representation - 专知论文

会员服务 ·

0

语义表示 · 表示 · 语义结构 · 结构 · 嵌入 ·

SWAN: Semantic Watermarking with Abstract Meaning Representation

翻译：SWAN：基于抽象语义表示（AMR）的语义水印技术

Ziping Ye,Gourab Dey,Christos Christodoulopoulos,Charith Peris,Anil Ramakrishna,Weitong Ruan,Aram Galstyan,Kai-Wei Chang,Rahul Gupta,Ninareh Mehrabi

from arxiv, Accepted to ACL 2026 Main

We introduce SWAN (Semantic Watermarking with Abstract Meaning Representation), a novel framework that embeds watermark signatures into the semantic structure of a sentence using Abstract Meaning Representation (AMR). In contrast to existing watermarking methods, which typically encode signatures by adjusting token selection preferences during text generation, SWAN embeds the signature directly in the sentence's semantic representation. As the signature is encoded at the semantic structure level, any paraphrase that preserves meaning automatically preserves the signature. SWAN is training-free: watermark injection is achieved by prompting an LLM to generate sentences guided by a selected AMR template while maintaining contextual coherence, and detection uses an off-the-shelf AMR parser followed by a simple one-proportion z-test. Empirical evaluation on the RealNews benchmark shows SWAN matches state-of-the-art detection performance on unaltered watermarked text, while significantly improving robustness against paraphrasing, increasing detection AUC by up to 13.9 percentage points compared to prior methods. These results demonstrate that SWAN's approach of anchoring watermarks in AMR semantic structures provides a simple, effective, and prompt-based method for robust text provenance verification under paraphrasing, opening new avenues for semantic-level watermarking research.

翻译：我们提出SWAN（基于抽象语义表示（AMR）的语义水印）这一新颖框架，通过利用抽象语义表示（AMR）将水印签名嵌入句子的语义结构中。与现有通常在文本生成过程中通过调整词元选择偏好来编码签名的水印方法不同，SWAN直接将签名编码在句子的语义表示层。由于签名在语义结构层面进行编码，任何保留原意的改写都会自动保留该签名。SWAN无需训练：水印注入通过提示大语言模型（LLM）在保持上下文连贯性的同时，依据选定的AMR模板生成文本来实现；检测则采用现成的AMR解析器，再辅以简单的单比例z检验。在RealNews基准上的实证评估表明，SWAN在未经修改的水印文本上的检测性能达到当前最优水平，同时显著提升了对抗改写攻击的鲁棒性：与先前方法相比，检测AUC最高提升了13.9个百分点。这些结果证明，SWAN将水印锚定在AMR语义结构中的方法，提供了一种简单、有效且基于提示的解决方案，可在改写场景下实现稳健的文本来源验证，为语义层面水印研究开辟了新途径。

0

相关内容

语义表示

从基础到大型语言模型的自然语言处理精通：应用高级规则基技术到大型语言模型并使用Python解决现实世界的商业问题。

从基础到大型语言模型的自然语言处理精通：应用高级规则基技术到大型语言模型并使用Python解决现实世界的商业问题。

专知会员服务

38+阅读 · 2024年4月28日

大模型时代下的文本水印综述

大模型时代下的文本水印综述

专知会员服务

35+阅读 · 2024年1月26日

《对话-抽象意义表示（AMR）解析管道》美国陆军研究实验室2022最新28页技术报告

《对话-抽象意义表示（AMR）解析管道》美国陆军研究实验室2022最新28页技术报告

专知会员服务

25+阅读 · 2022年11月3日

【LREC2022教程】自然语言处理统一意义表示学习，113页ppt

【LREC2022教程】自然语言处理统一意义表示学习，113页ppt

专知会员服务

26+阅读 · 2022年6月10日

人工智能模型水印研究综述

专知会员服务

28+阅读 · 2021年7月16日

如何用AI鉴别出垃圾水文？腾讯微信团队ACMMM2020《自媒体在线文章质量的认知表示学习》讲解

如何用AI鉴别出垃圾水文？腾讯微信团队ACMMM2020《自媒体在线文章质量的认知表示学习》讲解

专知会员服务

14+阅读 · 2020年8月17日

【ACL2020-复旦大学】FLAT：采用扁平化Transformer的中文NER，FLAT: Chinese NER Using Flat-Lattice Transformer

【ACL2020-复旦大学】FLAT：采用扁平化Transformer的中文NER，FLAT: Chinese NER Using Flat-Lattice Transformer

专知会员服务

64+阅读 · 2020年4月28日

【EMNLP 2019 最佳论文】信息瓶颈专门化单词嵌入（用于解析）（Specializing Word Embeddings（for Parsing）by Information Bottleneck）

【EMNLP 2019 最佳论文】信息瓶颈专门化单词嵌入（用于解析）（Specializing Word Embeddings（for Parsing）by Information Bottleneck）

专知会员服务

24+阅读 · 2019年11月20日

【ACL 2019 Tutorials】基于图的含义表示:设计和处理（Graph-Based Meaning Representations: Design and Processing），Alexander Koller，Stephan Oepen，孙薇薇

【ACL 2019 Tutorials】基于图的含义表示:设计和处理（Graph-Based Meaning Representations: Design and Processing），Alexander Koller，Stephan Oepen，孙薇薇

专知会员服务

10+阅读 · 2019年11月16日

【AAAI2020接受论文】Emu:使用语义专门化增强多语言句子嵌入，Emu: Enhancing Multilingual Sentence Embeddings with Semantic Specialization

【AAAI2020接受论文】Emu:使用语义专门化增强多语言句子嵌入，Emu: Enhancing Multilingual Sentence Embeddings with Semantic Specialization

专知会员服务

26+阅读 · 2019年11月11日

对抗攻击之利用水印生成对抗样本

对抗攻击之利用水印生成对抗样本

计算机视觉life

10+阅读 · 2020年9月27日

字节跳动李航提出AMBERT！超越BERT！多粒度token预训练语言模型

字节跳动李航提出AMBERT！超越BERT！多粒度token预训练语言模型

专知

19+阅读 · 2020年8月31日

Keras新增TextVectorization层，可直接将文本字符串作为模型输入

Keras新增TextVectorization层，可直接将文本字符串作为模型输入

专知

19+阅读 · 2019年11月22日

【泡泡图灵智库】ContextDesc：用跨模态上下文增强的局部描述子

【泡泡图灵智库】ContextDesc：用跨模态上下文增强的局部描述子

泡泡机器人SLAM

34+阅读 · 2019年9月18日

自然语言处理基础：上下文词表征入门解读

自然语言处理基础：上下文词表征入门解读

机器之心

13+阅读 · 2019年3月2日

Awesome-Chinese-NLP：中文自然语言处理相关资料

Awesome-Chinese-NLP：中文自然语言处理相关资料

AINLP

30+阅读 · 2019年2月17日

神圣的NLP！一文理解词性标注、依存分析和命名实体识别任务

神圣的NLP！一文理解词性标注、依存分析和命名实体识别任务

深度学习与NLP

25+阅读 · 2018年8月22日

【干货】NLP中“词袋”模型和词嵌入模型的比较（附代码）

【干货】NLP中“词袋”模型和词嵌入模型的比较（附代码）

专知

11+阅读 · 2018年8月4日

【论文笔记】用图卷积网络( GCN)来做语义角色标注

【论文笔记】用图卷积网络( GCN)来做语义角色标注

专知

61+阅读 · 2018年5月26日

自然语言处理 (三)　之　word embedding

自然语言处理 (三)　之　word embedding

DeepLearning中文论坛

19+阅读 · 2015年8月3日

基于程序多模态的动态软件水印方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于非对称扩展的可逆水印研究

国家自然科学基金

0+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于超小波和全局特征量的数字音频水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于网络的情感语义词典的自动构建技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

维吾尔语命名实体间语义关系抽取理论方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

矢量地图数据的非对称数字水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

笔迹图像中关键词语过滤技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

柬埔寨语命名实体识别及汉柬双语可比语料库构建方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于人眼视觉特性与ASIFT的多尺度变换域视频水印算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

SAMark: A Self-Anchored Text Watermarking with Paragraph-Level Paraphrase Robustness

Arxiv

0+阅读 · 6月14日

DuraMark: Duration-Embedded Watermarking in LLM-based TTS

Arxiv

0+阅读 · 6月13日

T2S: A Rehearsal-Based Approach for Extraction-Resistant Model Watermarking

Arxiv

0+阅读 · 6月10日

Global Sketch-Based Watermarking for Diffusion Language Models

Arxiv

0+阅读 · 6月3日

SAMark: A Self-Anchored Text Watermarking with Paragraph-Level Paraphrase Robustness

Arxiv

0+阅读 · 5月25日

TextSeal: A Localized LLM Watermark for Provenance & Distillation Protection

Arxiv

0+阅读 · 5月21日

Dynamics-Level Watermarking of Flow Matching Models with Random Codes

Arxiv

0+阅读 · 5月15日

Watermarking Should Be Treated as a Monitoring Primitive

Arxiv

0+阅读 · 5月14日

Watermarking Game-Playing Agents in Perfect-Information Extensive-Form Games

Arxiv

0+阅读 · 5月14日

TextSeal: A Localized LLM Watermark for Provenance & Distillation Protection

Arxiv

0+阅读 · 5月12日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

从基础到大型语言模型的自然语言处理精通：应用高级规则基技术到大型语言模型并使用Python解决现实世界的商业问题。

从基础到大型语言模型的自然语言处理精通：应用高级规则基技术到大型语言模型并使用Python解决现实世界的商业问题。

专知会员服务

38+阅读 · 2024年4月28日

大模型时代下的文本水印综述

大模型时代下的文本水印综述

专知会员服务

35+阅读 · 2024年1月26日

《对话-抽象意义表示（AMR）解析管道》美国陆军研究实验室2022最新28页技术报告

《对话-抽象意义表示（AMR）解析管道》美国陆军研究实验室2022最新28页技术报告

专知会员服务

25+阅读 · 2022年11月3日

【LREC2022教程】自然语言处理统一意义表示学习，113页ppt

【LREC2022教程】自然语言处理统一意义表示学习，113页ppt

专知会员服务

26+阅读 · 2022年6月10日

人工智能模型水印研究综述

专知会员服务

28+阅读 · 2021年7月16日

如何用AI鉴别出垃圾水文？腾讯微信团队ACMMM2020《自媒体在线文章质量的认知表示学习》讲解

如何用AI鉴别出垃圾水文？腾讯微信团队ACMMM2020《自媒体在线文章质量的认知表示学习》讲解

专知会员服务

14+阅读 · 2020年8月17日

【ACL2020-复旦大学】FLAT：采用扁平化Transformer的中文NER，FLAT: Chinese NER Using Flat-Lattice Transformer

【ACL2020-复旦大学】FLAT：采用扁平化Transformer的中文NER，FLAT: Chinese NER Using Flat-Lattice Transformer

专知会员服务

64+阅读 · 2020年4月28日

【EMNLP 2019 最佳论文】信息瓶颈专门化单词嵌入（用于解析）（Specializing Word Embeddings（for Parsing）by Information Bottleneck）

【EMNLP 2019 最佳论文】信息瓶颈专门化单词嵌入（用于解析）（Specializing Word Embeddings（for Parsing）by Information Bottleneck）

专知会员服务

24+阅读 · 2019年11月20日

【ACL 2019 Tutorials】基于图的含义表示:设计和处理（Graph-Based Meaning Representations: Design and Processing），Alexander Koller，Stephan Oepen，孙薇薇

【ACL 2019 Tutorials】基于图的含义表示:设计和处理（Graph-Based Meaning Representations: Design and Processing），Alexander Koller，Stephan Oepen，孙薇薇

专知会员服务

10+阅读 · 2019年11月16日

【AAAI2020接受论文】Emu:使用语义专门化增强多语言句子嵌入，Emu: Enhancing Multilingual Sentence Embeddings with Semantic Specialization

【AAAI2020接受论文】Emu:使用语义专门化增强多语言句子嵌入，Emu: Enhancing Multilingual Sentence Embeddings with Semantic Specialization

专知会员服务

26+阅读 · 2019年11月11日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

对抗攻击之利用水印生成对抗样本

对抗攻击之利用水印生成对抗样本

计算机视觉life

10+阅读 · 2020年9月27日

字节跳动李航提出AMBERT！超越BERT！多粒度token预训练语言模型

字节跳动李航提出AMBERT！超越BERT！多粒度token预训练语言模型

专知

19+阅读 · 2020年8月31日

Keras新增TextVectorization层，可直接将文本字符串作为模型输入

Keras新增TextVectorization层，可直接将文本字符串作为模型输入

专知

19+阅读 · 2019年11月22日

【泡泡图灵智库】ContextDesc：用跨模态上下文增强的局部描述子

【泡泡图灵智库】ContextDesc：用跨模态上下文增强的局部描述子

泡泡机器人SLAM

34+阅读 · 2019年9月18日

自然语言处理基础：上下文词表征入门解读

自然语言处理基础：上下文词表征入门解读

机器之心

13+阅读 · 2019年3月2日

Awesome-Chinese-NLP：中文自然语言处理相关资料

Awesome-Chinese-NLP：中文自然语言处理相关资料

AINLP

30+阅读 · 2019年2月17日

神圣的NLP！一文理解词性标注、依存分析和命名实体识别任务

神圣的NLP！一文理解词性标注、依存分析和命名实体识别任务

深度学习与NLP

25+阅读 · 2018年8月22日

【干货】NLP中“词袋”模型和词嵌入模型的比较（附代码）

【干货】NLP中“词袋”模型和词嵌入模型的比较（附代码）

专知

11+阅读 · 2018年8月4日

【论文笔记】用图卷积网络( GCN)来做语义角色标注

【论文笔记】用图卷积网络( GCN)来做语义角色标注

专知

61+阅读 · 2018年5月26日

自然语言处理 (三)　之　word embedding

自然语言处理 (三)　之　word embedding

DeepLearning中文论坛

19+阅读 · 2015年8月3日

相关论文

SAMark: A Self-Anchored Text Watermarking with Paragraph-Level Paraphrase Robustness

Arxiv

0+阅读 · 6月14日

DuraMark: Duration-Embedded Watermarking in LLM-based TTS

Arxiv

0+阅读 · 6月13日

T2S: A Rehearsal-Based Approach for Extraction-Resistant Model Watermarking

Arxiv

0+阅读 · 6月10日

Global Sketch-Based Watermarking for Diffusion Language Models

Arxiv

0+阅读 · 6月3日

SAMark: A Self-Anchored Text Watermarking with Paragraph-Level Paraphrase Robustness

Arxiv

0+阅读 · 5月25日

TextSeal: A Localized LLM Watermark for Provenance & Distillation Protection

Arxiv

0+阅读 · 5月21日

Dynamics-Level Watermarking of Flow Matching Models with Random Codes

Arxiv

0+阅读 · 5月15日

Watermarking Should Be Treated as a Monitoring Primitive

Arxiv

0+阅读 · 5月14日

Watermarking Game-Playing Agents in Perfect-Information Extensive-Form Games

Arxiv

0+阅读 · 5月14日

TextSeal: A Localized LLM Watermark for Provenance & Distillation Protection

Arxiv

0+阅读 · 5月12日

相关基金

基于程序多模态的动态软件水印方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于非对称扩展的可逆水印研究

国家自然科学基金

0+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于超小波和全局特征量的数字音频水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于网络的情感语义词典的自动构建技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

维吾尔语命名实体间语义关系抽取理论方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

矢量地图数据的非对称数字水印技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

笔迹图像中关键词语过滤技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

柬埔寨语命名实体识别及汉柬双语可比语料库构建方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于人眼视觉特性与ASIFT的多尺度变换域视频水印算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员