不稳定论文 - 专知

会员服务 ·

不稳定

Learning to Refine Hidden States for Reliable LLM Reasoning

Arxiv

0+阅读 · 6月16日

Who Flips? Self- and Cross-Model Counterarguments Reveal Answer Instability in LLMs

Arxiv

0+阅读 · 6月14日

JADE: Expert-Grounded Dynamic Evaluation for Open-Ended Professional Tasks

Arxiv

0+阅读 · 6月14日

A Decision-Theoretic View of Test-Time Training: When, How Far, and Which Directions to Adapt

Arxiv

0+阅读 · 6月14日

Stabilizing Short Duration Speaker Verification through Neural Re-scoring with Hybrid Enrollment

Arxiv

0+阅读 · 6月15日

Taming Curvature: Architecture Warm-Up for Stable Transformer Training

Arxiv

0+阅读 · 6月15日

Service-Induced Congestion in Memory-Constrained LLM Serving

Arxiv

0+阅读 · 6月14日

RQUL-UIE: Revitalizing Quality-Unstable Labels for Underwater Image Enhancement via In-Dataset Self-Supervision

Arxiv

0+阅读 · 6月14日

CASHEW: Stabilizing Multimodal Reasoning via Iterative Trajectory Aggregation

Arxiv

0+阅读 · 6月13日

Markovianity-Based Conditioning Depth Diagnostics for Hidden Confounding in Observational Datasets

Arxiv

0+阅读 · 5月31日

The Ephemeral Web and the Case for Proactive Archiving

Arxiv

0+阅读 · 5月18日

A Likelihood Ratio Testing Approach for Interval-Censored Data

Arxiv

0+阅读 · 6月9日

Detecting Flakiness in Quantum Software: A Dynamic Testing Approach

Arxiv

0+阅读 · 6月5日

Polyhedral Instability Governs Regret in Online Learning

Arxiv

0+阅读 · 5月13日

When Surface Form Changes Moderation Decisions: A Paired Study of Code-Mixed Workflow Instability

Arxiv

0+阅读 · 6月5日

参考链接

微信扫码咨询专知VIP会员