成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
偏好优化
关注
0
综合
百科
VIP
热门
动态
论文
精华
Reducing Hallucinations in LLMs via Factuality-Aware Preference Learning
Arxiv
0+阅读 · 1月6日
Stable Preference Optimization: A Bilevel Approach to Catastrophic Preference Shift
Arxiv
0+阅读 · 1月6日
SPO-CLAPScore: Enhancing CLAP-based alignment prediction system with Standardize Preference Optimization, for the first XACLE Challenge
Arxiv
0+阅读 · 1月6日
Fine-Grained Preference Optimization Improves Spatial Reasoning in VLMs
Arxiv
0+阅读 · 1月5日
Unified Generation and Self-Verification for Vision-Language Models via Advantage Decoupled Preference Optimization
Arxiv
0+阅读 · 1月4日
DA-DPO: Cost-efficient Difficulty-aware Preference Optimization for Reducing MLLM Hallucinations
Arxiv
0+阅读 · 1月2日
Pre-DPO: Improving Data Utilization in Direct Preference Optimization Using a Guiding Reference Model
Arxiv
0+阅读 · 2025年12月31日
InSPO: Unlocking Intrinsic Self-Reflection for LLM Preference Optimization
Arxiv
0+阅读 · 2025年12月30日
PhyGDPO: Physics-Aware Groupwise Direct Preference Optimization for Physically Consistent Text-to-Video Generation
Arxiv
0+阅读 · 2025年12月31日
Direct Diffusion Score Preference Optimization via Stepwise Contrastive Policy-Pair Supervision
Arxiv
0+阅读 · 2025年12月29日
InSPO: Unlocking Intrinsic Self-Reflection for LLM Preference Optimization
Arxiv
0+阅读 · 2025年12月29日
APO: Alpha-Divergence Preference Optimization
Arxiv
0+阅读 · 2025年12月28日
Structure-Aware Antibody Design with Affinity-Optimized Inverse Folding
Arxiv
0+阅读 · 2025年12月19日
STARE-VLA: Progressive Stage-Aware Reinforcement for Fine-Tuning Vision-Language-Action Models
Arxiv
0+阅读 · 2025年12月23日
Rethinking Direct Preference Optimization in Diffusion Models
Arxiv
0+阅读 · 2025年12月24日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top