成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
偏好优化
关注
0
综合
百科
VIP
热门
动态
论文
精华
RLPO: Residual Listwise Preference Optimization for Long-Context Review Ranking
Arxiv
0+阅读 · 4月16日
SignDPO: Multi-level Direct Preference Optimisation for Skeleton-based Gloss-free Sign Language Translation
Arxiv
0+阅读 · 4月20日
Backtranslation Augmented Direct Preference Optimization for Neural Machine Translation
Arxiv
0+阅读 · 4月28日
DynamicPO: Dynamic Preference Optimization for Recommendation
Arxiv
0+阅读 · 5月1日
CLewR: Curriculum Learning with Restarts for Machine Translation Preference Learning
Arxiv
0+阅读 · 4月17日
User Simulator-Guided Multi-Turn Preference Optimization for Reasoning LLM-based Conversational Recommendation
Arxiv
0+阅读 · 4月4日
RAD-DPO: Robust Adaptive Denoising Direct Preference Optimization for Generative Retrieval in E-commerce
Arxiv
0+阅读 · 4月28日
Reducing Hallucinations in LLMs via Factuality-Aware Preference Learning
Arxiv
0+阅读 · 4月15日
Visual Preference Optimization with Rubric Rewards
Arxiv
0+阅读 · 4月14日
EditCaption: Human-Aligned Instruction Synthesis for Image Editing via Supervised Fine-Tuning and Direct Preference Optimization
Arxiv
0+阅读 · 4月9日
PhysMoDPO: Physically-Plausible Humanoid Motion with Preference Optimization
Arxiv
0+阅读 · 3月16日
GlyphPrinter: Region-Grouped Direct Preference Optimization for Glyph-Accurate Visual Text Rendering
Arxiv
0+阅读 · 3月16日
PhysMoDPO: Physically-Plausible Humanoid Motion with Preference Optimization
Arxiv
0+阅读 · 3月13日
MoD-DPO: Towards Mitigating Cross-modal Hallucinations in Omni LLMs using Modality Decoupled Preference Optimization
Arxiv
0+阅读 · 3月3日
RAD-DPO: Robust Adaptive Denoising Direct Preference Optimization for Generative Retrieval in E-commerce
Arxiv
0+阅读 · 2月27日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top