攻击方法论文 - 专知

会员服务 ·

攻击方法

Automated jailbreak attack targeting multiple defense strategies

Arxiv

0+阅读 · 6月15日

Semantic-Preserving Prompt Hijacking: A Black-Box Adversarial Attack on Auto-Prompt Optimization

Arxiv

0+阅读 · 6月12日

Reconstructing Template-Memorized Images from Natural Prompts

Arxiv

0+阅读 · 6月11日

Towards Physically Realizable Adversarial Attenuation Patch against SAR Object Detection

Arxiv

0+阅读 · 6月12日

Cyber-Resilient Digital Twins: Discriminating Attacks for Safe Critical Infrastructure Control

Arxiv

0+阅读 · 3月19日

CacheTrap: Unveiling a Stealthier Gray-Box Trojan against LLMs

Arxiv

0+阅读 · 4月27日

Invisible Threats from Model Context Protocol: Generating Stealthy Injection Payload via Tree-based Adaptive Search

Arxiv

0+阅读 · 3月25日

PIDP-Attack: Combining Prompt Injection with Database Poisoning Attacks on Retrieval-Augmented Generation Systems

Arxiv

0+阅读 · 3月26日

Cryptanalysis of a PIR Scheme based on Linear Codes over Rings

Arxiv

0+阅读 · 3月27日

Breaking Semantic-Aware Watermarks via LLM-Guided Coherence-Preserving Semantic Injection

Arxiv

0+阅读 · 2月25日

IU: Imperceptible Universal Backdoor Attack

Arxiv

0+阅读 · 2月28日

MarcoPolo: A Zero-Permission Attack for Location Type Inference from the Magnetic Field using Mobile Devices

Arxiv

0+阅读 · 2月14日

Confundo: Learning to Generate Robust Poison for Practical RAG Systems

Arxiv

0+阅读 · 2月6日

Temperature Scaling Attack Disrupting Model Confidence in Federated Learning

Arxiv

0+阅读 · 2月6日

BadTemplate: A Training-Free Backdoor Attack via Chat Template Against Large Language Models

Arxiv

0+阅读 · 2月5日

参考链接

微信扫码咨询专知VIP会员