正确性论文 - 专知

会员服务 ·

正确性

Bridging Functional Correctness and Runtime Efficiency Gaps in LLM-Based Code Translation

Arxiv

0+阅读 · 6月16日

Trust the Right Teacher: Quality-Aware Self-Distillation for GUI Grounding

Trust the Right Teacher: Quality-Aware Self-Distillation for GUI Grounding

Arxiv

0+阅读 · 6月16日

Calyx: Privacy-Preserving Multi-Token Optimistic-Rollup Protocol

Arxiv

0+阅读 · 6月15日

Towards Functional Correctness of Large Code Models with Selective Generation

Arxiv

0+阅读 · 6月15日

Beyond Correctness: Enhancing Architectural Reasoning in Code LLMs via Scalable Labeling with Agentic Judgment

Arxiv

0+阅读 · 6月12日

DualGauge: Automated Joint Security-Functionality Benchmarking of Specification-Only Code Generation by LLMs and Coding Agents

Arxiv

0+阅读 · 6月15日

When Correct Edges Cannot Be Verified: A Provenance Gap in Incomplete KGQA and a Provenance-Favoring Completion Policy

Arxiv

0+阅读 · 6月14日

Understanding, Detecting, and Repairing Real-World In-Context-Learning-Based Text-to-SQL Errors

Arxiv

0+阅读 · 6月15日

CoRA: Confidence-Rationale Alignment for Reliable Chain-of-Thought Reasoning

Arxiv

0+阅读 · 6月12日

Exploiting Search in Symbolic Numeric Planning with Patterns

Arxiv

0+阅读 · 6月15日

Sensor-Conditioned Representation Learning via Scene-Relevant Observation Quotients

Arxiv

0+阅读 · 6月15日

AudioProcessBench: Benchmark for Identifying Process Errors in Audio-Grounded Reasoning

Arxiv

0+阅读 · 6月7日

Code Correctness Signals in LLM Hidden States: Pre-Generation Probing and Repair Geometry

Arxiv

0+阅读 · 6月12日

EstRTL: Functional Estimation Guided RTL Code Generation

Arxiv

0+阅读 · 6月1日

Optimizing Proof-Search via Linearization for Gödel-Löb Logic with Tree-Hypersequents

Arxiv

0+阅读 · 6月2日

参考链接

微信扫码咨询专知VIP会员