We introduce Solar Open, a 102B-parameter bilingual Mixture-of-Experts language model for underserved languages. Solar Open demonstrates a systematic methodology for building competitive LLMs by addressing three interconnected challenges. First, to train effectively despite data scarcity for underserved languages, we synthesize 4.5T tokens of high-quality, domain-specific, and RL-oriented data. Second, we coordinate this data through a progressive curriculum jointly optimizing composition, quality thresholds, and domain coverage across 20 trillion tokens. Third, to enable reasoning capabilities through scalable RL, we apply our proposed framework SnapPO for efficient optimization. Across benchmarks in English and Korean, Solar Open achieves competitive performance, demonstrating the effectiveness of this methodology for underserved language AI development.


翻译:本文介绍Solar Open,一个针对资源匮乏语言开发的1020亿参数双语专家混合语言模型。Solar Open通过解决三个相互关联的挑战,展示了构建具有竞争力大语言模型的系统化方法。首先,为解决资源匮乏语言数据稀缺问题,我们合成了4.5万亿个高质量、领域特定且强化学习导向的token。其次,我们通过渐进式课程学习协调这些数据,在20万亿token范围内联合优化数据构成、质量阈值和领域覆盖。第三,为实现可扩展强化学习的推理能力,我们应用提出的SnapPO框架进行高效优化。在英语和韩语的基准测试中,Solar Open均取得具有竞争力的性能,证明了该方法对资源匮乏语言人工智能发展的有效性。

0
下载
关闭预览

相关内容

《OpenAI o1大模型》中英文技术报告,44页pdf
专知会员服务
149+阅读 · 2024年9月15日
Sora技术深度解析,21页pdf
专知会员服务
160+阅读 · 2024年2月26日
Sora技术详解及影响分析!
专知会员服务
70+阅读 · 2024年2月23日
OpenAI Sora视频生成模型技术报告中英全文
专知会员服务
115+阅读 · 2024年2月17日
《TextCycleGAN 技术报告》
专知会员服务
33+阅读 · 2023年5月4日
最新《ChatGPT》报告, 风口已至,商业化落地加速, 14页pdf
《全球开源生态研究报告(2022年)》发布,48页pdf
专知会员服务
39+阅读 · 2022年9月19日
OpenAI官方发布:强化学习中的关键论文
专知
14+阅读 · 2018年12月12日
资源 | 清华大学开源OpenKE:知识表示学习平台
机器之心
10+阅读 · 2017年11月4日
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Arxiv
0+阅读 · 2月5日
Arxiv
0+阅读 · 2月2日
Arxiv
0+阅读 · 1月27日
Arxiv
0+阅读 · 1月15日
Arxiv
0+阅读 · 1月5日
Arxiv
0+阅读 · 2025年12月31日
Arxiv
18+阅读 · 2024年12月27日
VIP会员
相关VIP内容
《OpenAI o1大模型》中英文技术报告,44页pdf
专知会员服务
149+阅读 · 2024年9月15日
Sora技术深度解析,21页pdf
专知会员服务
160+阅读 · 2024年2月26日
Sora技术详解及影响分析!
专知会员服务
70+阅读 · 2024年2月23日
OpenAI Sora视频生成模型技术报告中英全文
专知会员服务
115+阅读 · 2024年2月17日
《TextCycleGAN 技术报告》
专知会员服务
33+阅读 · 2023年5月4日
最新《ChatGPT》报告, 风口已至,商业化落地加速, 14页pdf
《全球开源生态研究报告(2022年)》发布,48页pdf
专知会员服务
39+阅读 · 2022年9月19日
相关基金
国家自然科学基金
1+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员