成为VIP会员查看完整内容
VIP会员码认证
首页
主题
会员
服务
注册
·
登录
数据选择
关注
0
综合
百科
VIP
热门
动态
论文
精华
Enhancing Multilingual LLM Pretraining with Model-Based Data Selection
Arxiv
0+阅读 · 2月19日
Entropy-Based Data Selection for Language Models
Arxiv
0+阅读 · 2月19日
ScalSelect: Scalable Training-Free Multimodal Data Selection for Efficient Visual Instruction Tuning
Arxiv
0+阅读 · 2月12日
Improving Data Efficiency for LLM Reinforcement Fine-tuning Through Difficulty-targeted Online Data Selection and Rollout Replay
Arxiv
0+阅读 · 2月16日
Evaluating Sample Utility for Efficient Data Selection by Mimicking Model Weights
Arxiv
0+阅读 · 2月7日
Truth in the Few: High-Value Data Selection for Efficient Multi-Modal Reasoning
Arxiv
0+阅读 · 2月12日
OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration
Arxiv
0+阅读 · 2月7日
PASER: Post-Training Data Selection for Efficient Pruned Large Language Model Recovery
Arxiv
0+阅读 · 2月12日
Less is More: Improving LLM Alignment via Preference Data Selection
Arxiv
0+阅读 · 2月15日
Pool-based Active Learning as Noisy Lossy Compression: Characterizing Label Complexity via Finite Blocklength Analysis
Arxiv
0+阅读 · 2月5日
OPUS: Towards Efficient and Principled Data Selection in Large Language Model Pre-training in Every Iteration
Arxiv
0+阅读 · 2月5日
MiniRec: Data-Efficient Reinforcement Learning for LLM-based Recommendation
Arxiv
0+阅读 · 2月4日
InstructDiff: Domain-Adaptive Data Selection via Differential Entropy for Efficient LLM Fine-Tuning
Arxiv
0+阅读 · 1月30日
Diverse, not Short: A Length-Controlled Data Selection Strategy for Improving Response Diversity of Language Models
Arxiv
0+阅读 · 1月30日
Action Shapley: A Training Data Selection Metric for World Model in Reinforcement Learning
Arxiv
0+阅读 · 1月15日
参考链接
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top