Unveiling Unicode's Unseen Underpinnings in Undermining Authorship Attribution - 专知论文

会员服务 ·

0

通道 · 在线 · Aliasing · 掩码 · IP ·

Unveiling Unicode's Unseen Underpinnings in Undermining Authorship Attribution

翻译：揭示Unicode在削弱作者身份归因中的潜在影响

Robert Dilworth

from arxiv, 33 pages, 7 figures, 3 tables

When using a public communication channel--whether formal or informal, such as commenting or posting on social media--end users have no expectation of privacy: they compose a message and broadcast it for the world to see. Even if an end user takes utmost precautions to anonymize their online presence--using an alias or pseudonym; masking their IP address; spoofing their geolocation; concealing their operating system and user agent; deploying encryption; registering with a disposable phone number or email; disabling non-essential settings; revoking permissions; and blocking cookies and fingerprinting--one obvious element still lingers: the message itself. Assuming they avoid lapses in judgment or accidental self-exposure, there should be little evidence to validate their actual identity, right? Wrong. The content of their message--necessarily open for public consumption--exposes an attack vector: stylometric analysis, or author profiling. In this paper, we dissect the technique of stylometry, discuss an antithetical counter-strategy in adversarial stylometry, and devise enhancements through Unicode steganography.

翻译：在公共通信渠道（无论是正式还是非正式场景，例如在社交媒体上评论或发帖）中，最终用户对隐私无任何期待：他们撰写消息并向全世界广播。即便用户采取最严密的匿名化措施——使用化名或假名、隐藏IP地址、伪造地理定位、隐藏操作系统和用户代理、部署加密技术、通过一次性电话或邮箱注册、关闭非必要设置、撤销权限、屏蔽Cookie和指纹追踪——仍有一个显而易见的关键元素留存：消息本身。假设用户避免判断失误或意外暴露身份，那么几乎不存在可验证其真实身份的证据，对吗？错！其消息内容（必须公开供大众消费）暴露了一个攻击向量：文体风格分析（即作者画像）。本文深入剖析文体风格分析技术，探讨与之对抗的反向文体风格分析策略，并通过Unicode隐写术提出增强方案。

0

相关内容

《生成人工智能对抗性使用对国土安全的影响》美国土安全部最新99页报告

《生成人工智能对抗性使用对国土安全的影响》美国土安全部最新99页报告

专知会员服务

22+阅读 · 2025年1月21日

【KDD2024】揭示隐私漏洞:调查图数据中结构的作用

【KDD2024】揭示隐私漏洞:调查图数据中结构的作用

专知会员服务

11+阅读 · 2024年8月13日

《重新思考网络安全决策：在不确定情况下利用认知启发法》2024最新论文

《重新思考网络安全决策：在不确定情况下利用认知启发法》2024最新论文

专知会员服务

27+阅读 · 2024年2月1日

【MIT博士论文】社交媒体虚假信息深入理解：虚假信息传播建模、注意力和数字广告，322页pdf

【MIT博士论文】社交媒体虚假信息深入理解：虚假信息传播建模、注意力和数字广告，322页pdf

专知会员服务

46+阅读 · 2023年5月5日

《匿名保密通信框架：基于区块链的概念验证》美海军2022最新154页论文

《匿名保密通信框架：基于区块链的概念验证》美海军2022最新154页论文

专知会员服务

23+阅读 · 2022年12月21日

《信息战：防范虚假信息的教训》译文，加拿大国防2022最新报告

《信息战：防范虚假信息的教训》译文，加拿大国防2022最新报告

专知会员服务

39+阅读 · 2022年10月11日

《用对抗样本防御基于深度学习的视频指纹攻击》美海军研究生院2022最新60页论文

《用对抗样本防御基于深度学习的视频指纹攻击》美海军研究生院2022最新60页论文

专知会员服务

28+阅读 · 2022年10月7日

《基于像素的数字图像伪造检测的被动方法》140页博士论文

《基于像素的数字图像伪造检测的被动方法》140页博士论文

专知会员服务

21+阅读 · 2022年7月25日

【开放书】隐私的现代社会技术视角，459页pdf，Modern Socio-Technical Perspectives on Privacy

【开放书】隐私的现代社会技术视角，459页pdf，Modern Socio-Technical Perspectives on Privacy

专知会员服务

21+阅读 · 2022年3月24日

网络信息生态系统中的虚假信息：检测、缓解与挑战

专知会员服务

27+阅读 · 2021年8月7日

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

专知

12+阅读 · 2022年10月28日

【WWW2020-清华大学】图增强表示学习的新闻推荐,Graph Enhanced RepresentationLearning

【WWW2020-清华大学】图增强表示学习的新闻推荐,Graph Enhanced RepresentationLearning

专知

34+阅读 · 2020年4月4日

深度解读 | 美国打压华为这事水很深——什么是华为？（1）

深度解读 | 美国打压华为这事水很深——什么是华为？（1）

混沌研习社广州分社

21+阅读 · 2019年6月27日

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

AI前线

15+阅读 · 2019年3月21日

被动DNS，一个被忽视的安全利器

被动DNS，一个被忽视的安全利器

运维帮

11+阅读 · 2019年3月8日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

区块链隐私保护研究综述——祝烈煌详解

区块链隐私保护研究综述——祝烈煌详解

计算机研究与发展

23+阅读 · 2018年11月28日

AI版权征文 | 日本人工智能发展及著作权问题上的选择与纠结（上篇）

AI版权征文 | 日本人工智能发展及著作权问题上的选择与纠结（上篇）

百度公共政策研究院

10+阅读 · 2018年11月1日

差分隐私保护：从入门到脱坑

差分隐私保护：从入门到脱坑

FreeBuf

17+阅读 · 2018年9月10日

揭秘AI识别虚假新闻背后的原理

揭秘AI识别虚假新闻背后的原理

DeepTech深科技

10+阅读 · 2018年8月5日

面向时空特性的社交网络推演攻击与隐私保护关键技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

通信信号中的隐蔽信息传输机理研究

国家自然科学基金

1+阅读 · 2015年12月31日

即时通信中的隐蔽通信模型及方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

内容中心移动社交网络高效安全匿名通信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

即时通讯匿名隐通道系统模型与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

中英文论文中的中国作者姓名消歧研究

国家自然科学基金

0+阅读 · 2014年12月31日

网络用户隐私担忧与主动性泄露隐私信息之间的悖论：理论探索和基于社交网络的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

在线社会网络中信息级联效应及社会影响力优化策略研究

国家自然科学基金

0+阅读 · 2014年12月31日

Unveiling Unicode's Unseen Underpinnings in Undermining Authorship Attribution

Arxiv

0+阅读 · 6月19日

Debiasing Without Protected Attributes: Latent Concept Erasure from Textual Profiles

Arxiv

0+阅读 · 6月10日

Hijacking Text Heritage: Hiding the Human Signature through Homoglyphic Substitution

Arxiv

0+阅读 · 6月8日

What Your Posts Reveal: A Benchmark and Agentic Framework for User-Level Privacy Leakage on Social Media

Arxiv

0+阅读 · 6月5日

FADRW: A Feature-Aware Modulated and Dynamically Reweighted Loss for Few-Shot Linguistic Steganalysis

Arxiv

0+阅读 · 6月3日

Covert Influence Between Language Models

Arxiv

0+阅读 · 6月2日

Dissociative Identity: Language Model Agents Lack Grounding for Reputation Mechanisms

Arxiv

0+阅读 · 5月29日

CritiSense: Critical Digital Literacy and Resilience Against Misinformation

Arxiv

0+阅读 · 5月21日

Limits of Personalizing Differential Privacy Budgets

Arxiv

0+阅读 · 5月13日

Data anonymization in the presence of outliers via invariant coordinate selection

Arxiv

0+阅读 · 5月6日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

专知会员服务

0+阅读 · 今天15:55

GNN跨域综述：从消息传递到图基础模型

GNN跨域综述：从消息传递到图基础模型

专知会员服务

0+阅读 · 今天15:53

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

11+阅读 · 今天7:25

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

3+阅读 · 今天6:54

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

3+阅读 · 今天6:52

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

2+阅读 · 今天6:33

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

7+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

6+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

10+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

8+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

8+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

10+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

9+阅读 · 6月25日

相关VIP内容

《生成人工智能对抗性使用对国土安全的影响》美国土安全部最新99页报告

《生成人工智能对抗性使用对国土安全的影响》美国土安全部最新99页报告

专知会员服务

22+阅读 · 2025年1月21日

【KDD2024】揭示隐私漏洞:调查图数据中结构的作用

【KDD2024】揭示隐私漏洞:调查图数据中结构的作用

专知会员服务

11+阅读 · 2024年8月13日

《重新思考网络安全决策：在不确定情况下利用认知启发法》2024最新论文

《重新思考网络安全决策：在不确定情况下利用认知启发法》2024最新论文

专知会员服务

27+阅读 · 2024年2月1日

【MIT博士论文】社交媒体虚假信息深入理解：虚假信息传播建模、注意力和数字广告，322页pdf

【MIT博士论文】社交媒体虚假信息深入理解：虚假信息传播建模、注意力和数字广告，322页pdf

专知会员服务

46+阅读 · 2023年5月5日

《匿名保密通信框架：基于区块链的概念验证》美海军2022最新154页论文

《匿名保密通信框架：基于区块链的概念验证》美海军2022最新154页论文

专知会员服务

23+阅读 · 2022年12月21日

《信息战：防范虚假信息的教训》译文，加拿大国防2022最新报告

《信息战：防范虚假信息的教训》译文，加拿大国防2022最新报告

专知会员服务

39+阅读 · 2022年10月11日

《用对抗样本防御基于深度学习的视频指纹攻击》美海军研究生院2022最新60页论文

《用对抗样本防御基于深度学习的视频指纹攻击》美海军研究生院2022最新60页论文

专知会员服务

28+阅读 · 2022年10月7日

《基于像素的数字图像伪造检测的被动方法》140页博士论文

《基于像素的数字图像伪造检测的被动方法》140页博士论文

专知会员服务

21+阅读 · 2022年7月25日

【开放书】隐私的现代社会技术视角，459页pdf，Modern Socio-Technical Perspectives on Privacy

【开放书】隐私的现代社会技术视角，459页pdf，Modern Socio-Technical Perspectives on Privacy

专知会员服务

21+阅读 · 2022年3月24日

网络信息生态系统中的虚假信息：检测、缓解与挑战

专知会员服务

27+阅读 · 2021年8月7日

热门VIP内容

开通专知VIP会员享更多权益服务

GNN跨域综述：从消息传递到图基础模型

巡飞弹与反无人机系统——现代战场的两大支柱

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

无人机自主控制与人工智能：系统性综述

相关资讯

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

《用于网络防御的深度机器学习》【概念解读、事件简史、深度学习、面临挑战、军事应用】20余位作者2022最新126页技术报告

专知

12+阅读 · 2022年10月28日

【WWW2020-清华大学】图增强表示学习的新闻推荐,Graph Enhanced RepresentationLearning

【WWW2020-清华大学】图增强表示学习的新闻推荐,Graph Enhanced RepresentationLearning

专知

34+阅读 · 2020年4月4日

深度解读 | 美国打压华为这事水很深——什么是华为？（1）

深度解读 | 美国打压华为这事水很深——什么是华为？（1）

混沌研习社广州分社

21+阅读 · 2019年6月27日

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

语义鸿沟、异构鸿沟、数据缺失，多模态技术如何跨过这些坎？

AI前线

15+阅读 · 2019年3月21日

被动DNS，一个被忽视的安全利器

被动DNS，一个被忽视的安全利器

运维帮

11+阅读 · 2019年3月8日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

区块链隐私保护研究综述——祝烈煌详解

区块链隐私保护研究综述——祝烈煌详解

计算机研究与发展

23+阅读 · 2018年11月28日

AI版权征文 | 日本人工智能发展及著作权问题上的选择与纠结（上篇）

AI版权征文 | 日本人工智能发展及著作权问题上的选择与纠结（上篇）

百度公共政策研究院

10+阅读 · 2018年11月1日

差分隐私保护：从入门到脱坑

差分隐私保护：从入门到脱坑

FreeBuf

17+阅读 · 2018年9月10日

揭秘AI识别虚假新闻背后的原理

揭秘AI识别虚假新闻背后的原理

DeepTech深科技

10+阅读 · 2018年8月5日

相关论文

Unveiling Unicode's Unseen Underpinnings in Undermining Authorship Attribution

Arxiv

0+阅读 · 6月19日

Debiasing Without Protected Attributes: Latent Concept Erasure from Textual Profiles

Arxiv

0+阅读 · 6月10日

Hijacking Text Heritage: Hiding the Human Signature through Homoglyphic Substitution

Arxiv

0+阅读 · 6月8日

What Your Posts Reveal: A Benchmark and Agentic Framework for User-Level Privacy Leakage on Social Media

Arxiv

0+阅读 · 6月5日

FADRW: A Feature-Aware Modulated and Dynamically Reweighted Loss for Few-Shot Linguistic Steganalysis

Arxiv

0+阅读 · 6月3日

Covert Influence Between Language Models

Arxiv

0+阅读 · 6月2日

Dissociative Identity: Language Model Agents Lack Grounding for Reputation Mechanisms

Arxiv

0+阅读 · 5月29日

CritiSense: Critical Digital Literacy and Resilience Against Misinformation

Arxiv

0+阅读 · 5月21日

Limits of Personalizing Differential Privacy Budgets

Arxiv

0+阅读 · 5月13日

Data anonymization in the presence of outliers via invariant coordinate selection

Arxiv

0+阅读 · 5月6日

相关基金

面向时空特性的社交网络推演攻击与隐私保护关键技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

通信信号中的隐蔽信息传输机理研究

国家自然科学基金

1+阅读 · 2015年12月31日

即时通信中的隐蔽通信模型及方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

可恢复的数字语音取证水印技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

内容中心移动社交网络高效安全匿名通信机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

即时通讯匿名隐通道系统模型与算法研究

国家自然科学基金

1+阅读 · 2015年12月31日

可证明的网络和数据匿名性及隐私增强身份管理关键技术研究

国家自然科学基金

3+阅读 · 2014年12月31日

中英文论文中的中国作者姓名消歧研究

国家自然科学基金

0+阅读 · 2014年12月31日

网络用户隐私担忧与主动性泄露隐私信息之间的悖论：理论探索和基于社交网络的实证研究

国家自然科学基金

0+阅读 · 2014年12月31日

在线社会网络中信息级联效应及社会影响力优化策略研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员