成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
模型性能
关注
2
综合
百科
VIP
热门
动态
论文
精华
GaelEval: Benchmarking LLM Performance for Scottish Gaelic
Arxiv
0+阅读 · 4月2日
Will LLMs Scaling Hit the Wall? Breaking Barriers via Distributed Resources on Massive Edge Devices
Arxiv
0+阅读 · 4月9日
Evaluating the performance of GCM trajectories using Weather Type frequencies for persistence and transitions: the Iberian Peninsula and Lamb classification
Arxiv
0+阅读 · 5月1日
TrajBooster: Boosting Humanoid Whole-Body Manipulation via Trajectory-Centric Learning
Arxiv
0+阅读 · 3月19日
Benchmarking Early Deterioration Prediction Across Hospital-Rich and MCI-Like Emergency Triage Under Constrained Sensing
Arxiv
0+阅读 · 3月30日
IndiaFinBench: An Evaluation Benchmark for Large Language Model Performance on Indian Financial Regulatory Text
Arxiv
0+阅读 · 4月21日
Measuring the Sensitivity of Classification Models with the Error Sensitivity Profile
Arxiv
0+阅读 · 4月28日
Strategic Scaling of Test-Time Compute: A Bandit Learning Approach
Arxiv
0+阅读 · 4月23日
Massive Memorization with Hundreds of Trillions of Parameters for Sequential Transducer Generative Recommenders
Arxiv
0+阅读 · 3月26日
Tunable Soft Equivariance with Guarantees
Arxiv
0+阅读 · 3月27日
MolQuest: A Benchmark for Agentic Evaluation of Abductive Reasoning in Chemical Structure Elucidation
Arxiv
0+阅读 · 3月26日
Learnability and Privacy Vulnerability are Entangled in a Few Critical Weights
Arxiv
0+阅读 · 3月13日
Representing data in words: A context engineering approach
Arxiv
0+阅读 · 3月13日
Massive Memorization with Hundreds of Trillions of Parameters for Sequential Transducer Generative Recommenders
Arxiv
0+阅读 · 2月25日
Improving LLM Performance Through Black-Box Online Tuning: A Case for Adding System Specs to Factsheets for Trusted AI
Arxiv
0+阅读 · 3月11日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top