Qwen3论文 - 专知

会员服务 ·

Qwen3

Not All Invariants Are Equal: Curating Training Data to Accelerate Program Verification with SLMs

Arxiv

0+阅读 · 6月23日

Mechanism-Guided Selective Unlearning for RLVR-Induced Reasoning

Arxiv

0+阅读 · 6月17日

Fearless Concurrency on the GPU

Arxiv

0+阅读 · 6月14日

Transferable Self-Evolving Playbooks for Agentic Security Auditing

Arxiv

0+阅读 · 6月15日

Open-SWE-Traces: Advancing Dual-Mode Multilingual Distillation for Software Engineering Agents

Arxiv

0+阅读 · 6月14日

SMEPilot: Characterizing and Optimizing LLM Inference with Scalable Matrix Extensions

Arxiv

0+阅读 · 6月15日

On-Policy Distillation with Curriculum Turn-level Guidance for Multi-turn Agents

Arxiv

0+阅读 · 6月14日

Stop When Further Reasoning Won't Help: Attention-State Adaptive Generation in Reasoning Models

Arxiv

0+阅读 · 6月13日

The Curse and Blessing of Mean Bias in FP4-Quantized LLM Training

Arxiv

0+阅读 · 6月12日

RAMPART: Registry-based Agentic Memory with Priority-Aware Runtime Transformation

Arxiv

0+阅读 · 6月3日

Ouroboros-Spatial: Closing the Data-Model Loop for Spatial Reasoning

Arxiv

0+阅读 · 6月10日

Argus-Retriever: Vision-LLM Late-Interaction Retrieval with Region-Aware Query-Conditioned MoE for Visual Document Retrieval

Arxiv

0+阅读 · 6月3日

Negation Neglect: When models fail to learn negations in training

Arxiv

0+阅读 · 5月13日

A Deterministic Agentic Workflow for HS Tariff Classification: Multi-Dimensional Rule Reasoning with Interpretable Decisions

Arxiv

0+阅读 · 5月14日

VLA Foundry: A Unified Framework for Training Vision-Language-Action Models

Arxiv

0+阅读 · 4月21日

参考链接

微信扫码咨询专知VIP会员