成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
提示注入
关注
0
综合
百科
VIP
热门
动态
论文
精华
PISmith: Reinforcement Learning-based Red Teaming for Prompt Injection Defenses
Arxiv
0+阅读 · 3月13日
Prompt Injection Vulnerability of Consensus Generating Applications in Digital Democracy
Arxiv
0+阅读 · 2月28日
The Mirror Design Pattern: Strict Data Geometry over Model Scale for Prompt Injection Detection
Arxiv
0+阅读 · 3月12日
AttriGuard: Defeating Indirect Prompt Injection in LLM Agents via Causal Attribution of Tool Invocations
Arxiv
0+阅读 · 3月11日
Adaptive Attacks on Trusted Monitors Subvert AI Control Protocols
Arxiv
0+阅读 · 3月2日
AgentSentry: Mitigating Indirect Prompt Injection in LLM Agents via Temporal Causal Diagnostics and Context Purification
Arxiv
0+阅读 · 2月26日
AdapTools: Adaptive Tool-based Indirect Prompt Injection Attacks on Agentic LLMs
Arxiv
0+阅读 · 2月24日
AlignSentinel: Alignment-Aware Detection of Prompt Injection Attacks
Arxiv
0+阅读 · 2月21日
ICON: Indirect Prompt Injection Defense for Agents based on Inference-Time Correction
Arxiv
0+阅读 · 2月24日
Skill-Inject: Measuring Agent Vulnerability to Skill File Attacks
Arxiv
0+阅读 · 2月23日
Skill-Inject: Measuring Agent Vulnerability to Skill File Attacks
Arxiv
0+阅读 · 2月25日
Skill-Inject: Measuring Agent Vulnerability to Skill File Attacks
Arxiv
0+阅读 · 2月24日
Bypassing AI Control Protocols via Agent-as-a-Proxy Attacks
Arxiv
0+阅读 · 2月25日
IH-Challenge: A Training Dataset to Improve Instruction Hierarchy on Frontier LLMs
Arxiv
0+阅读 · 3月11日
The Vulnerability of LLM Rankers to Prompt Injection Attacks
Arxiv
0+阅读 · 2月18日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top