成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
人工智能安全
关注
245
人工智能安全风险指的是指安全威胁利用人工智能资产的脆弱性,引发人工智能安全事件或对相关方造成影响。
综合
百科
VIP
热门
动态
论文
精华
The Homogenization Problem in LLMs: Towards Meaningful Diversity in AI Safety
Arxiv
0+阅读 · 5月4日
Structure-Aware Diversity Pursuit as an AI Safety Strategy against Homogenization
Arxiv
0+阅读 · 4月20日
IatroBench: Pre-Registered Evidence of Iatrogenic Harm from AI Safety Measures
Arxiv
0+阅读 · 4月9日
Assessing the Case for Africa-Centric AI Safety Evaluations
Arxiv
0+阅读 · 3月20日
International AI Safety Report 2026
Arxiv
1+阅读 · 2月24日
ForesightSafety Bench: A Frontier Risk Evaluation and Governance Framework towards Safe AI
Arxiv
0+阅读 · 2月21日
ForesightSafety Bench: A Frontier Risk Evaluation and Governance Framework towards Safe AI
Arxiv
0+阅读 · 2月27日
Astra: AI Safety, Trust, & Risk Assessment
Arxiv
0+阅读 · 2月19日
Assessing the Case for Africa-Centric AI Safety Evaluations
Arxiv
0+阅读 · 2月14日
How Should AI Safety Benchmarks Benchmark Safety?
Arxiv
0+阅读 · 2月8日
ForesightSafety Bench: A Frontier Risk Evaluation and Governance Framework towards Safe AI
Arxiv
0+阅读 · 2月15日
How should AI Safety Benchmarks Benchmark Safety?
Arxiv
0+阅读 · 1月30日
PluriHarms: Benchmarking the Full Spectrum of Human Judgments on AI Harm
Arxiv
0+阅读 · 2月3日
Domain-Specific Constitutional AI: Enhancing Safety in LLM-Powered Mental Health Chatbots
Arxiv
0+阅读 · 1月20日
PluriHarms: Benchmarking the Full Spectrum of Human Judgments on AI Harm
Arxiv
0+阅读 · 1月13日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top