模型评估论文 - 专知

会员服务 ·

模型评估

机器学习系统设计系统评估标准

Holographic Memory for Zero-Shot Compositional Reasoning in Knowledge Graphs: A Mechanistic Study of Where and Why It Fails

Arxiv

0+阅读 · 6月23日

Enhancing Clinician Decision-Making via Uncertainty-Aware Multi-Expert Fusion for Stroke Rehabilitation

Arxiv

0+阅读 · 6月23日

Bitwise Systolic Array Architecture for Runtime-Reconfigurable Multi-precision Quantized Multiplication on Hardware Accelerators

Arxiv

0+阅读 · 6月22日

MortarBench: Evaluating Mortgage Loan Origination Agents

Arxiv

0+阅读 · 6月22日

Machine Learning Modeling for Real-Time Melt Pool Monitoring in Laser Powder Bed Fusion Additive Manufacturing: A Hybrid Approach

Arxiv

0+阅读 · 6月22日

DREG: A Layer-Wise Jacobian Regularization as a General-Purpose Penalty

Arxiv

0+阅读 · 6月22日

Weight-Space Geometry of Offline Reasoning Training

Arxiv

0+阅读 · 6月21日

THEIA: Learning Complete Kleene Three-Valued Logic in a Pure-Neural Modular Architecture

Arxiv

0+阅读 · 6月23日

Neural Network-Based Parametric Model Reduction for Predicting Turbulent Flow for Different Vehicle Geometries

Arxiv

0+阅读 · 6月23日

2.5-D Decomposition for LLM-Based Spatial Construction

Arxiv

0+阅读 · 6月23日

Zero-Shot Test-Time Canonicalization using Out-of-Distribution Scoring

Arxiv

0+阅读 · 6月23日

Quantifying mandibular positioning error and simulated temporomandibular joint-space changes in patient-specific occlusal splints

Arxiv

0+阅读 · 6月23日

End-to-End Radar and Communication Modulation Recognition with Neuromorphic Computing

Arxiv

0+阅读 · 6月23日

Enforcing Human-like Kinematics in Dexterous Piano Playing via Adversarial Posture Regularization

Arxiv

0+阅读 · 6月22日

PyTorchFire: A GPU-Accelerated Wildfire Simulator with Differentiable Cellular Automata

Arxiv

0+阅读 · 6月20日

参考链接

微信扫码咨询专知VIP会员