迈向高效、科学且普适的小语言模型开发

**摘要:**尽管语言模型的规模在持续增长,但我们对其内部工作机制的理解,以及高效训练模型(尤其是小模型)的能力仍然有限。参数量在十亿以下(Sub-1 billion)的小模型在经济成本、环境影响及可访问性方面具有显著的实际优势,这促使研究界迫切需要更有效的训练方法论。本论文通过两个互补的视角探讨了小语言模型的开发挑战:认知启发(Cognitive Inspiration)分析探究(Analytical Investigation)。 首先,借鉴人类高效习得语言的过程,本文探索了用于训练小模型的认知启发技术。通过一个名为 CLIMB 的框架,本文研究了在数据受限场景下,受人类语言习得启发的课程学习策略。此外,本文提出了一种认知驱动的方法——句法平滑(Syntactic Smoothing),该方法通过利用句法结构增强了对低频词的表示能力。 其次,本文采用分析视角研究了小模型的训练动力学与瓶颈。通过对 Pythia 模型系列的逐层行为分析,本文识别了小模型中的收敛挑战与饱和现象。该分析揭示了当前语言模型开发中一个更广泛的缺陷:即训练工具与分析工具之间的脱节,这种脱节阻碍了以科学、迭代的方式改进模型。为了解决这一问题,本文推出了 Pico——一个开源、轻量化且模块化的小模型开发框架。Pico 集成了模型训练与学习动力学的细粒度分析功能,由 pico-trainpico-analyze 两个组件构成,旨在为开发小语言模型提供一种基于原则(Principled)且实验驱动的方法论。 最终,本论文贡献了创新的技术方案与工具,旨在提升小语言模型训练的效率、科学性,并使其对更广泛的用户群体更具普适性。

成为VIP会员查看完整内容
0

相关内容

【NTU博士论文】让语言模型成为更类人的学习者
专知会员服务
23+阅读 · 2025年9月23日
大语言模型与小语言模型协同机制综述
专知会员服务
38+阅读 · 2025年5月15日
【NTU博士论文】让语言模型更接近人类学习者
专知会员服务
18+阅读 · 2025年5月3日
LLM 时代小模型的应用潜力与挑战 ,50页pdf
专知会员服务
37+阅读 · 2025年2月25日
小型语言模型综述
专知会员服务
54+阅读 · 2024年10月29日
大型语言模型:原理、实现与发展
专知会员服务
102+阅读 · 2023年11月28日
「知识增强预训练语言模型」最新研究综述
专知
18+阅读 · 2022年11月18日
多模态视觉语言表征学习研究综述
专知
27+阅读 · 2020年12月3日
绝对干货!NLP预训练模型:从transformer到albert
新智元
13+阅读 · 2019年11月10日
自然语言处理中的语言模型预训练方法
PaperWeekly
14+阅读 · 2018年10月21日
NLP通用模型诞生?一个模型搞定十大自然语言常见任务
人工智能头条
10+阅读 · 2018年6月29日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
VIP会员
最新内容
《对信息环境分析实现人工智能预测冲突》96页
专知会员服务
3+阅读 · 今天9:59
《面向海军应用的无人机网络安全仿真环境》
专知会员服务
4+阅读 · 今天9:41
无人机与僵局:俄乌战争难以突破
专知会员服务
3+阅读 · 今天9:02
《控制对手感知:电子战愿景与赋能技术》
专知会员服务
5+阅读 · 今天8:51
自主、人工智能与可消耗集群时代的海军情报
专知会员服务
8+阅读 · 4月6日
“史诗狂怒行动”中的海军动态
专知会员服务
10+阅读 · 4月5日
相关VIP内容
【NTU博士论文】让语言模型成为更类人的学习者
专知会员服务
23+阅读 · 2025年9月23日
大语言模型与小语言模型协同机制综述
专知会员服务
38+阅读 · 2025年5月15日
【NTU博士论文】让语言模型更接近人类学习者
专知会员服务
18+阅读 · 2025年5月3日
LLM 时代小模型的应用潜力与挑战 ,50页pdf
专知会员服务
37+阅读 · 2025年2月25日
小型语言模型综述
专知会员服务
54+阅读 · 2024年10月29日
大型语言模型:原理、实现与发展
专知会员服务
102+阅读 · 2023年11月28日
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员