成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
Claude
关注
2
综合
百科
VIP
热门
动态
论文
精华
From (Elementary) Mathematical Data Model Schemas to Safe Blazor Web Applications with Claude AI
Arxiv
0+阅读 · 3月22日
Kill-Chain Canaries: Stage-Level Tracking of Prompt Injection Across Attack Surfaces and Model Safety Tiers
Arxiv
0+阅读 · 4月3日
Agentic Education: Using Claude Code to Teach Claude Code
Arxiv
0+阅读 · 4月30日
Corporations Constitute Intelligence
Arxiv
0+阅读 · 4月3日
Measuring the Permission Gate: A Stress-Test Evaluation of Claude Code's Auto Mode
Arxiv
0+阅读 · 4月28日
When AI Speaks, Whose Values Does It Express? A Cross-Cultural Audit of Individualism-Collectivism Bias in Large Language Models
Arxiv
0+阅读 · 4月24日
Finch: Benchmarking Finance & Accounting across Spreadsheet-Centric Enterprise Workflows
Arxiv
0+阅读 · 4月15日
QLCoder: A Query Synthesizer For Static Analysis of Security Vulnerabilities
Arxiv
0+阅读 · 3月19日
QLCoder: A Query Synthesizer For Static Analysis of Security Vulnerabilities
Arxiv
0+阅读 · 3月25日
CTI-REALM: Benchmark to Evaluate Agent Performance on Security Detection Rule Generation Capabilities
Arxiv
0+阅读 · 3月17日
Learning to Present: Inverse Specification Rewards for Agentic Slide Generation
Arxiv
0+阅读 · 3月17日
Evaluation format, not model capability, drives triage failure in the assessment of consumer health AI
Arxiv
0+阅读 · 3月15日
Machine-Generated, Machine-Checked Proofs for a Verified Compiler (Experience Report)
Arxiv
0+阅读 · 2月23日
SOP-Bench: Complex Industrial SOPs for Evaluating LLM Agents
Arxiv
0+阅读 · 2月23日
Benchmarking Political Persuasion Risks Across Frontier Large Language Models
Arxiv
0+阅读 · 3月10日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top