StyleShield: Exposing the Fragility of AIGC Detectors through Continuous Controllable Style Transfer - 专知论文

会员服务 ·

0

检测器 · 风格迁移 · AIGC · 可控 · AIGC检测 ·

StyleShield: Exposing the Fragility of AIGC Detectors through Continuous Controllable Style Transfer

翻译：StyleShield：通过连续可控风格迁移揭示AIGC检测器的脆弱性

from arxiv, 12 pages, 5 figures. Code and model weights will be released upon acceptance

AI-generated content (AIGC) detectors are increasingly deployed in high-stakes settings such as academic integrity screening, yet their reliability rests on a fundamental paradox: as language models are trained on human-written corpora, the statistical boundary between AI and human writing will inevitably dissolve as models improve. Commercial incentives have further distorted this landscape -- detection services and "de-AIification" tools often operate within the same supply chain, replacing evaluation of content quality with judgment of content origin. We present StyleShield, the first flow matching framework for conditional text style transfer, operating directly in continuous token embedding space via a DiT backbone with zero-initialized cross-attention adapters conditioned on frozen Qwen-7B representations. At inference, we adapt the SDEdit paradigm from image synthesis to text embeddings, with a single parameter gamma providing smooth continuous control over the evasion-preservation trade-off. On a multi-domain Chinese benchmark, StyleShield achieves 94.6% evasion against the training detector and >=99% against three unseen detectors, maintaining 0.928 semantic similarity. We further introduce RateAudit, a document-level scheduling algorithm that demonstrates detection-rate verdicts can be set to arbitrary values, directly questioning the reliability of score-based evaluation.

翻译：人工智能生成内容（AIGC）检测器正越来越多地被部署于学术诚信筛查等高风险场景，但其可靠性建立在一个根本性悖论之上：随着语言模型在人类撰写语料上进行训练，AI与人类写作之间的统计边界必将随着模型性能提升而不可避免地被消解。商业激励进一步扭曲了这一格局——检测服务与“去AI化”工具常处于同一供应链体系内，将内容质量评估替换为内容来源判定。我们提出StyleShield——首个面向条件文本风格迁移的流匹配框架，通过基于零初始化交叉注意力适配器的DiT骨干网络，直接在连续词元嵌入空间中运行，并以冻结的Qwen-7B表征为条件。在推理阶段，我们将图像合成领域的SDEdit范式适配至文本嵌入，通过单一参数gamma对逃避-保留权衡进行平滑连续控制。在多领域中文基准测试中，StyleShield对训练集检测器实现94.6%的规避率，对三种未见检测器实现≥99%的规避率，同时保持0.928的语义相似度。我们进一步提出文件级调度算法RateAudit，证明检测率判定可被设置为任意数值，直接质疑了基于评分的评估体系的可信度。

0

相关内容

检测器

【ICCV2025】AIGI-Holmes：面向可解释性与可泛化性的AI生成图像检测方法 —— 基于多模态大语言模型的研究

【ICCV2025】AIGI-Holmes：面向可解释性与可泛化性的AI生成图像检测方法 —— 基于多模态大语言模型的研究

专知会员服务

10+阅读 · 2025年7月4日

AIGC如何助力工作和学习，98页ppt

AIGC如何助力工作和学习，98页ppt

专知会员服务

40+阅读 · 2025年3月14日

AIGC视觉内容生成与溯源研究进展

AIGC视觉内容生成与溯源研究进展

专知会员服务

27+阅读 · 2024年7月8日

AIGC大模型测评综述：使能技术，安全隐患和应对

AIGC大模型测评综述：使能技术，安全隐患和应对

专知会员服务

49+阅读 · 2024年7月2日

《检索增强生成在AIGC中的应用》综述

《检索增强生成在AIGC中的应用》综述

专知会员服务

93+阅读 · 2024年3月2日

AIGC如何安全可控?中山大学等最新《AIGC中对隐私和安全的挑战及其补救措施：探索隐私计算、区块链潜在应用》全面阐述

AIGC如何安全可控?中山大学等最新《AIGC中对隐私和安全的挑战及其补救措施：探索隐私计算、区块链潜在应用》全面阐述

专知会员服务

49+阅读 · 2023年6月6日

AIGC时代的多模态知识工程思考与展望

AIGC时代的多模态知识工程思考与展望

专知会员服务

135+阅读 · 2023年4月10日

ChatGPT等AIGC如何移动边缘部署？南洋理工最新《在移动网络中释放边云生成AI的力量:AIGC服务》综述其技术体系

ChatGPT等AIGC如何移动边缘部署？南洋理工最新《在移动网络中释放边云生成AI的力量:AIGC服务》综述其技术体系

专知会员服务

95+阅读 · 2023年3月30日

未来GPT-5一统AIGC任务？韩国庆熙大学等最新《生成式人工智能AIGC》综述，56页pdf全面阐述AIGC的文本图像生成技术

未来GPT-5一统AIGC任务？韩国庆熙大学等最新《生成式人工智能AIGC》综述，56页pdf全面阐述AIGC的文本图像生成技术

专知会员服务

151+阅读 · 2023年3月22日

重磅！腾讯发布《AIGC 发展趋势报告》：迎接人工智能的下一个时代｜附68页报告下载

重磅！腾讯发布《AIGC 发展趋势报告》：迎接人工智能的下一个时代｜附68页报告下载

专知会员服务

157+阅读 · 2023年2月2日

【ChatGPT系列报告】2023年AIGC应用与实践展望报告，47页ppt

【ChatGPT系列报告】2023年AIGC应用与实践展望报告，47页ppt

专知

27+阅读 · 2023年4月10日

国内外最值得关注的AIGC机构丨量子位智库报告（附下载）

国内外最值得关注的AIGC机构丨量子位智库报告（附下载）

量子位

10+阅读 · 2022年9月26日

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

专知

18+阅读 · 2022年9月3日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

92+阅读 · 2022年4月17日

语音关键词检测方法综述【附PPT与视频资料】

语音关键词检测方法综述【附PPT与视频资料】

人工智能前沿讲习班

10+阅读 · 2019年2月2日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

【机器视觉】表面缺陷检测：机器视觉检测技术

【机器视觉】表面缺陷检测：机器视觉检测技术

产业智能官

25+阅读 · 2018年5月30日

从场景到调参，爱奇艺的推荐算法演化之路

从场景到调参，爱奇艺的推荐算法演化之路

聊聊架构

10+阅读 · 2018年3月23日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

从传统方法到深度学习，人脸关键点检测方法综述

从传统方法到深度学习，人脸关键点检测方法综述

机器之心

14+阅读 · 2017年12月17日

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

高维单调转移模型的变量选择及其在违约风险评估中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于密集快速特征提取的可视媒体篡改检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于视觉上下文与文字显著性的复杂自然场景中文字检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

基于UGC的应急响应决策支持系统关键技术研究

国家自然科学基金

13+阅读 · 2014年12月31日

MVAD: A Benchmark Dataset for Multimodal AI-Generated Video-Audio Detection

Arxiv

0+阅读 · 6月12日

Evaluating Factual Density in Multi-Source RAG: A Study in Medical AI Accuracy

Arxiv

0+阅读 · 6月10日

DiscourseFlip: An Oblique Discourse-Level Opinion Manipulation Attack against Black-box Retrieval-Augmented Generation

Arxiv

0+阅读 · 6月3日

DetectZoo: A Unified Toolkit for AI-Generated Content Detection Across Text, Audio, and Image Modalities

Arxiv

0+阅读 · 6月2日

Improving Reproducibility in Evaluation through Multi-Level Annotator Modeling

Arxiv

0+阅读 · 5月13日

From Natural Alignment to Conditional Controllability in Multimodal Dialogue

Arxiv

0+阅读 · 5月9日

Challenges and Remedies to Privacy and Security in AIGC: Exploring the Potential of Privacy Computing, Blockchain, and Beyond

Arxiv

10+阅读 · 2023年6月1日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

156+阅读 · 2023年3月29日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

88+阅读 · 2023年3月21日

A Comprehensive Survey of AI-Generated Content (AIGC): A History of Generative AI from GAN to ChatGPT

Arxiv

34+阅读 · 2023年3月7日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

3+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

4+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

9+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

8+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

5+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

7+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

6+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

10+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

7+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

6+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

5+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

【ICCV2025】AIGI-Holmes：面向可解释性与可泛化性的AI生成图像检测方法 —— 基于多模态大语言模型的研究

【ICCV2025】AIGI-Holmes：面向可解释性与可泛化性的AI生成图像检测方法 —— 基于多模态大语言模型的研究

专知会员服务

10+阅读 · 2025年7月4日

AIGC如何助力工作和学习，98页ppt

AIGC如何助力工作和学习，98页ppt

专知会员服务

40+阅读 · 2025年3月14日

AIGC视觉内容生成与溯源研究进展

AIGC视觉内容生成与溯源研究进展

专知会员服务

27+阅读 · 2024年7月8日

AIGC大模型测评综述：使能技术，安全隐患和应对

AIGC大模型测评综述：使能技术，安全隐患和应对

专知会员服务

49+阅读 · 2024年7月2日

《检索增强生成在AIGC中的应用》综述

《检索增强生成在AIGC中的应用》综述

专知会员服务

93+阅读 · 2024年3月2日

AIGC如何安全可控?中山大学等最新《AIGC中对隐私和安全的挑战及其补救措施：探索隐私计算、区块链潜在应用》全面阐述

AIGC如何安全可控?中山大学等最新《AIGC中对隐私和安全的挑战及其补救措施：探索隐私计算、区块链潜在应用》全面阐述

专知会员服务

49+阅读 · 2023年6月6日

AIGC时代的多模态知识工程思考与展望

AIGC时代的多模态知识工程思考与展望

专知会员服务

135+阅读 · 2023年4月10日

ChatGPT等AIGC如何移动边缘部署？南洋理工最新《在移动网络中释放边云生成AI的力量:AIGC服务》综述其技术体系

ChatGPT等AIGC如何移动边缘部署？南洋理工最新《在移动网络中释放边云生成AI的力量:AIGC服务》综述其技术体系

专知会员服务

95+阅读 · 2023年3月30日

未来GPT-5一统AIGC任务？韩国庆熙大学等最新《生成式人工智能AIGC》综述，56页pdf全面阐述AIGC的文本图像生成技术

未来GPT-5一统AIGC任务？韩国庆熙大学等最新《生成式人工智能AIGC》综述，56页pdf全面阐述AIGC的文本图像生成技术

专知会员服务

151+阅读 · 2023年3月22日

重磅！腾讯发布《AIGC 发展趋势报告》：迎接人工智能的下一个时代｜附68页报告下载

重磅！腾讯发布《AIGC 发展趋势报告》：迎接人工智能的下一个时代｜附68页报告下载

专知会员服务

157+阅读 · 2023年2月2日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

【ChatGPT系列报告】2023年AIGC应用与实践展望报告，47页ppt

【ChatGPT系列报告】2023年AIGC应用与实践展望报告，47页ppt

专知

27+阅读 · 2023年4月10日

国内外最值得关注的AIGC机构丨量子位智库报告（附下载）

国内外最值得关注的AIGC机构丨量子位智库报告（附下载）

量子位

10+阅读 · 2022年9月26日

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

重磅！人工智能生成内容（AIGC）白皮书（2022年）发布，64页pdf

专知

18+阅读 · 2022年9月3日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

92+阅读 · 2022年4月17日

语音关键词检测方法综述【附PPT与视频资料】

语音关键词检测方法综述【附PPT与视频资料】

人工智能前沿讲习班

10+阅读 · 2019年2月2日

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

打开人工智能黑箱:看最新16篇可解释深度学习文章，带您了解增强AI透明性

专知

144+阅读 · 2019年1月13日

【机器视觉】表面缺陷检测：机器视觉检测技术

【机器视觉】表面缺陷检测：机器视觉检测技术

产业智能官

25+阅读 · 2018年5月30日

从场景到调参，爱奇艺的推荐算法演化之路

从场景到调参，爱奇艺的推荐算法演化之路

聊聊架构

10+阅读 · 2018年3月23日

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

【论文】所见所想所真，对抗学习GAN提升跨模态检索效果！阿里巴巴AI Labs等团队最新工作

专知

12+阅读 · 2017年12月21日

从传统方法到深度学习，人脸关键点检测方法综述

从传统方法到深度学习，人脸关键点检测方法综述

机器之心

14+阅读 · 2017年12月17日

相关论文

MVAD: A Benchmark Dataset for Multimodal AI-Generated Video-Audio Detection

Arxiv

0+阅读 · 6月12日

Evaluating Factual Density in Multi-Source RAG: A Study in Medical AI Accuracy

Arxiv

0+阅读 · 6月10日

DiscourseFlip: An Oblique Discourse-Level Opinion Manipulation Attack against Black-box Retrieval-Augmented Generation

Arxiv

0+阅读 · 6月3日

DetectZoo: A Unified Toolkit for AI-Generated Content Detection Across Text, Audio, and Image Modalities

Arxiv

0+阅读 · 6月2日

Improving Reproducibility in Evaluation through Multi-Level Annotator Modeling

Arxiv

0+阅读 · 5月13日

From Natural Alignment to Conditional Controllability in Multimodal Dialogue

Arxiv

0+阅读 · 5月9日

Challenges and Remedies to Privacy and Security in AIGC: Exploring the Potential of Privacy Computing, Blockchain, and Beyond

Arxiv

10+阅读 · 2023年6月1日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

156+阅读 · 2023年3月29日

A Complete Survey on Generative AI (AIGC): Is ChatGPT from GPT-4 to GPT-5 All You Need?

Arxiv

88+阅读 · 2023年3月21日

A Comprehensive Survey of AI-Generated Content (AIGC): A History of Generative AI from GAN to ChatGPT

Arxiv

34+阅读 · 2023年3月7日

相关基金

基于智能模糊测试的深度漏洞挖掘技术研究

国家自然科学基金

4+阅读 · 2017年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

高维单调转移模型的变量选择及其在违约风险评估中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于密集快速特征提取的可视媒体篡改检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度表达和迁移学习的人体检测研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于视觉上下文与文字显著性的复杂自然场景中文字检测研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于图像属性和深度学习的大规模物体检测研究与应用

国家自然科学基金

1+阅读 · 2015年12月31日

面向大数据的信息可视化设计方法研究

国家自然科学基金

7+阅读 · 2014年12月31日

基于UGC的应急响应决策支持系统关键技术研究

国家自然科学基金

13+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员