成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
GPT-5
关注
0
综合
百科
VIP
热门
动态
论文
精华
Evidence-Grounded Subspecialty Reasoning: Evaluating a Curated Clinical Intelligence Layer on the 2025 Endocrinology Board-Style Examination
Arxiv
0+阅读 · 2月17日
Validating Formal Specifications with LLM-generated Test Cases
Arxiv
0+阅读 · 2月18日
OpenAIs HealthBench in Action: Evaluating an LLM-Based Medical Assistant on Realistic Clinical Queries
Arxiv
0+阅读 · 2月17日
Fine-Tuning GPT-5 for GPU Kernel Generation
Arxiv
0+阅读 · 2月11日
Compiler-Guided Inference-Time Adaptation: Improving GPT-5 Programming Performance in Idris
Arxiv
0+阅读 · 2月12日
In which fields do ChatGPT scores align better than citations with research quality?
Arxiv
0+阅读 · 2月8日
Automatic Item Generation for Personality Situational Judgment Tests with Large Language Models
Arxiv
0+阅读 · 2月8日
GPT-5 vs Other LLMs in Long Short-Context Performance
Arxiv
0+阅读 · 2月15日
How to Train Your Advisor: Steering Black-Box LLMs with Advisor Models
Arxiv
0+阅读 · 2月2日
Large Language Model and Formal Concept Analysis: a comparative study for Topic Modeling
Arxiv
0+阅读 · 2月2日
Health-ORSC-Bench: A Benchmark for Measuring Over-Refusal and Safety Completion in Health Context
Arxiv
0+阅读 · 1月25日
Vision Language Models for Optimization-Driven Intent Processing in Autonomous Networks
Arxiv
0+阅读 · 1月19日
A Safety Report on GPT-5.2, Gemini 3 Pro, Qwen3-VL, Doubao 1.8, Grok 4.1 Fast, Nano Banana Pro, and Seedream 4.5
Arxiv
0+阅读 · 1月15日
A Safety Report on GPT-5.2, Gemini 3 Pro, Qwen3-VL, Grok 4.1 Fast, Nano Banana Pro, and Seedream 4.5
Arxiv
0+阅读 · 1月16日
Predicting Biased Human Decision-Making with Large Language Models in Conversational Settings
Arxiv
0+阅读 · 1月16日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top