成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
探针
关注
0
综合
百科
VIP
热门
动态
论文
精华
Probe-Geometry Alignment: Erasing the Cross-Sequence Memorization Signature Below Chance
Arxiv
0+阅读 · 5月3日
SPENCE: A Syntactic Probe for Detecting Contamination in NL2SQL Benchmarks
Arxiv
0+阅读 · 4月20日
Detecting Multi-Agent Collusion Through Multi-Agent Interpretability
Arxiv
0+阅读 · 4月1日
Safe-FedLLM: Delving into the Safety of Federated Large Language Models
Arxiv
0+阅读 · 4月18日
Bayesian Component Separation for DESI LAE Automated Spectroscopic Redshifts and Photometric Targeting
Arxiv
0+阅读 · 3月25日
K-Way Energy Probes for Metacognition Reduce to Softmax in Discriminative Predictive Coding Networks
Arxiv
0+阅读 · 4月13日
Neural Uncertainty Principle: A Unified View of Adversarial Fragility and LLM Hallucination
Arxiv
0+阅读 · 3月27日
Neural Uncertainty Principle: A Unified View of Adversarial Fragility and LLM Hallucination
Arxiv
0+阅读 · 3月26日
Neural Uncertainty Principle: A Unified View of Adversarial Fragility and LLM Hallucination
Arxiv
0+阅读 · 3月20日
Stop Probing, Start Coding: Why Linear Probes and Sparse Autoencoders Fail at Compositional Generalisation
Arxiv
0+阅读 · 3月30日
Atomic-Probe Governance for Skill Updates in Compositional Robot Policies
Arxiv
0+阅读 · 4月29日
Family Matters: Language Transfer and Merging for Adapting Small LLMs to Faroese
Arxiv
0+阅读 · 3月26日
Laminar: A Probe-First Scheduling Paradigm with Deterministic Runtime Survival
Arxiv
0+阅读 · 4月14日
Riding Brainwaves in LLM Space: Understanding Activation Patterns Using Individual Neural Signatures
Arxiv
0+阅读 · 3月23日
Prompt Injection as Role Confusion
Arxiv
0+阅读 · 3月20日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top