成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
越狱攻击
关注
0
综合
百科
VIP
热门
动态
论文
精华
Sirens' Whisper: Inaudible Near-Ultrasonic Jailbreaks of Speech-Driven LLMs
Arxiv
0+阅读 · 3月14日
Jailbreaking Leaves a Trace: Understanding and Detecting Jailbreak Attacks from Internal Representations of Large Language Models
Arxiv
0+阅读 · 2月20日
JALMBench: Benchmarking Jailbreak Vulnerabilities in Audio Language Models
Arxiv
0+阅读 · 2月28日
Untargeted Jailbreak Attack
Arxiv
0+阅读 · 3月2日
Token-Level Constraint Boundary Search for Jailbreaking Text-to-Image Models
Arxiv
0+阅读 · 3月11日
When Memory Becomes a Vulnerability: Towards Multi-turn Jailbreak Attacks against Text-to-Image Generation Systems
Arxiv
0+阅读 · 3月4日
Towards Realistic Guarantees: A Probabilistic Certificate for SmoothLLM
Arxiv
0+阅读 · 2月20日
TAO-Attack: Toward Advanced Optimization-Based Jailbreak Attacks for Large Language Models
Arxiv
0+阅读 · 3月3日
Obscure but Effective: Classical Chinese Jailbreak Prompt Optimization via Bio-Inspired Search
Arxiv
0+阅读 · 2月27日
Obscure but Effective: Classical Chinese Jailbreak Prompt Optimization via Bio-Inspired Search
Arxiv
0+阅读 · 2月26日
Targeting Alignment: Extracting Safety Classifiers of Aligned LLMs
Arxiv
0+阅读 · 2月18日
Boundary Point Jailbreaking of Black-Box LLMs
Arxiv
0+阅读 · 2月18日
TrapSuffix: Proactive Defense Against Adversarial Suffixes in Jailbreaking
Arxiv
0+阅读 · 2月6日
Steering Dialogue Dynamics for Robustness against Multi-turn Jailbreaking Attacks
Arxiv
0+阅读 · 2月16日
Causal Front-Door Adjustment for Robust Jailbreak Attacks on LLMs
Arxiv
0+阅读 · 2月6日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top