https://llmsystem.github.io/llmsystem2025spring/

人工智能的最新进展在很大程度上得益于大型语言模型(LLMs)及其他生成式方法的发展。这些模型通常非常庞大(例如,GPT-3拥有1750亿参数),并且需要越来越大的数据量进行训练(例如,ChatGPT使用3000亿个token进行训练)。训练、部署、微调以及评估LLMs需要现代硬件和软件栈支持的复杂工程。开发可扩展的大型语言模型系统对于推动人工智能的发展至关重要。 在本课程中,学生将学习设计和实现LLM系统的核心技能。这包括在海量数据上高效训练LLM的算法与系统技术、高效的嵌入存储与检索、数据高效的微调、通信高效的算法、人类反馈强化学习的高效实现、基于GPU及其他硬件的加速、模型压缩以便部署,以及在线维护。我们将讨论机器学习、自然语言处理和系统研究中关于LLM系统的最新进展。

课程描述与目标

人工智能的最新进展在很大程度上得益于大型语言模型(LLMs)及其他生成式方法的发展。这些模型通常非常庞大(例如,GPT-3拥有1750亿参数),并且需要越来越大的数据量进行训练(例如,ChatGPT使用3000亿个token进行训练)。训练、部署、微调以及评估LLMs需要借助现代硬件和软件栈进行复杂的工程开发。构建可扩展的大型语言模型系统对于推动人工智能的发展至关重要。 在本课程中,学生将学习设计和实现LLM系统的核心技能,包括以下内容: * 高效训练海量数据上的LLM的算法与系统技术; * 高效的嵌入存储与检索; * 数据高效的微调; * 通信高效的算法; * 人类反馈强化学习的高效实现; * 基于GPU及其他硬件的加速; * 模型压缩以便于部署; * 系统的在线维护。

此外,本课程将探讨机器学习、自然语言处理和系统研究中关于LLM系统的最新进展。通过本课程,学生将掌握构建和优化大型语言模型系统的必要技能,为推动人工智能前沿发展奠定坚实基础。 课程目录:

成为VIP会员查看完整内容
35

相关内容

不可错过!《扩散模型与应用》课程
专知会员服务
41+阅读 · 2024年11月25日
开课了!CMU《多模态机器学习》2022课程,附课件与视频
专知会员服务
155+阅读 · 2022年2月1日
不可错过!CMU《深度学习导论》2020课程,附课件与视频
专知会员服务
80+阅读 · 2020年10月27日
国家自然科学基金
16+阅读 · 2017年12月31日
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Arxiv
176+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
501+阅读 · 2023年3月31日
Arxiv
182+阅读 · 2023年3月24日
Arxiv
27+阅读 · 2023年3月17日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
1+阅读 · 今天14:45
综述 | 世界动作模型:少做梦,多行动
专知会员服务
1+阅读 · 今天14:43
美以伊冲突:无人机与人工智能的运用
专知会员服务
3+阅读 · 今天14:31
《特种部队在透明战场中的生存力》最新报告
专知会员服务
2+阅读 · 今天14:11
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关基金
国家自然科学基金
16+阅读 · 2017年12月31日
国家自然科学基金
9+阅读 · 2017年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
47+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2015年12月31日
国家自然科学基金
31+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员