成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
自动化评估
关注
0
综合
百科
VIP
热门
动态
论文
精华
Toward LLM-Supported Automated Assessment of Critical Thinking Subskills
Arxiv
0+阅读 · 2月18日
A Scalable Framework for Evaluating Health Language Models
Arxiv
0+阅读 · 2月18日
Automated Assessment of Kidney Ureteroscopy Exploration for Training
Arxiv
0+阅读 · 2月17日
Supporting Humans in Evaluating AI Summaries of Legal Depositions
Arxiv
0+阅读 · 1月21日
SciArena: An Open Evaluation Platform for Non-Verifiable Scientific Literature-Grounded Tasks
Arxiv
0+阅读 · 1月22日
DR-Arena: an Automated Evaluation Framework for Deep Research Agents
Arxiv
0+阅读 · 1月15日
LegalRikai: Open Benchmark -- Benchmark for Complex Japanese Corporate Legal Tasks
Arxiv
0+阅读 · 2025年12月15日
LegalRikai: Open Benchmark -- A Benchmark for Complex Japanese Corporate Legal Tasks
Arxiv
0+阅读 · 2025年12月12日
AutoMedic: An Automated Evaluation Framework for Clinical Conversational Agents with Medical Dataset Grounding
Arxiv
0+阅读 · 2025年12月11日
Building Trust in Virtual Immunohistochemistry: Automated Assessment of Image Quality
Arxiv
0+阅读 · 2025年11月6日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top