参考模型论文 - 专知

会员服务 ·

参考模型

ChatModel: Automating Reference Model Design and Verification with LLMs

Arxiv

0+阅读 · 6月17日

BLADE: Scalable Bi-level Adaptive Data Selection for LLM Training

Arxiv

0+阅读 · 6月17日

ChipMATE: Multi-Agent Training via Reinforcement Learning for Enhanced RTL Generation

Arxiv

0+阅读 · 5月13日

A Reference Model and Patterns for Production Event Data Enrichment

Arxiv

0+阅读 · 5月18日

Validating Threat Modeling Results with the Help of Vulnerable Test Applications

Arxiv

0+阅读 · 5月22日

Explicit Turn Resolution with Anisotropic Homogenisation for Efficient 3D Magneto-Thermal Finite-Element Simulation of Large-Scale No-Insulation HTS Magnets

Arxiv

0+阅读 · 5月29日

TPMM-DPO: Trajectory-aware Preference-guided Model Merging for Iterative Direct Preference Optimization

Arxiv

0+阅读 · 5月22日

Instantiating Bayesian CVaR lower bounds in Interactive Decision Making Problems

Arxiv

0+阅读 · 4月14日

Support-Contra Asymmetry in LLM Explanations

Arxiv

0+阅读 · 4月2日

Autoregressive Direct Preference Optimization

Arxiv

0+阅读 · 2月10日

Building Intelligent User Interfaces for Human-AI Alignment

Arxiv

0+阅读 · 2月12日

Learning beyond Teacher: Generalized On-Policy Distillation with Reward Extrapolation

Arxiv

0+阅读 · 2月12日

Mitigating Mismatch within Reference-based Preference Optimization

Arxiv

0+阅读 · 2月12日

Anchored Policy Optimization: Mitigating Exploration Collapse Via Support-Constrained Rectification

Arxiv

0+阅读 · 2月5日

Position: Explaining Behavioral Shifts in Large Language Models Requires a Comparative Approach

Arxiv

0+阅读 · 2月2日

参考链接

微信扫码咨询专知VIP会员