成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
攻击方法
关注
0
综合
百科
VIP
热门
动态
论文
精华
Jailbreaking LLMs Without Gradients or Priors: Effective and Transferable Attacks
Arxiv
0+阅读 · 1月6日
Exploring the limits of strong membership inference attacks on large language models
Arxiv
0+阅读 · 1月8日
Low Resource Reconstruction Attacks Through Benign Prompts
Arxiv
0+阅读 · 1月7日
Adversarial Instance Generation and Robust Training for Neural Combinatorial Optimization with Multiple Objectives
Arxiv
0+阅读 · 1月4日
Involuntary Jailbreak: On Self-Prompting Attacks
Arxiv
0+阅读 · 2025年12月27日
Few Tokens Matter: Entropy Guided Attacks on Vision-Language Models
Arxiv
0+阅读 · 2025年12月26日
A Gray-box Attack against Latent Diffusion Model-based Image Editing by Posterior Collapse
Arxiv
0+阅读 · 2025年11月26日
GraphToxin: Reconstructing Full Unlearned Graphs from Graph Unlearning
Arxiv
0+阅读 · 2025年11月14日
FBA$^2$D: Frequency-based Black-box Attack for AI-generated Image Detection
Arxiv
0+阅读 · 2025年12月10日
An Efficient Gradient-Based Inference Attack for Federated Learning
Arxiv
0+阅读 · 2025年12月17日
A Taxonomy of Pix Fraud in Brazil: Attack Methodologies, AI-Driven Amplification, and Defensive Strategies
Arxiv
0+阅读 · 2025年11月25日
When Tables Leak: Attacking String Memorization in LLM-Based Tabular Data Generation
Arxiv
0+阅读 · 2025年12月9日
RoguePrompt: Dual-Layer Ciphering for Self-Reconstruction to Circumvent LLM Moderation
Arxiv
0+阅读 · 2025年11月24日
SECA: Semantically Equivalent and Coherent Attacks for Eliciting LLM Hallucinations
Arxiv
0+阅读 · 2025年11月30日
Boosting Adversarial Transferability via Fusing Logits of Top-1 Decomposed Feature
Arxiv
0+阅读 · 2023年5月2日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top