71页ppt！指令微调和RLHF讲座(NYU CSCI 2590) 附视频 - 专知VIP

会员服务 ·

25

指令微调 · 人类反馈强化学习 (RLHF) ·

2023 年 5 月 20 日

71页ppt！指令微调和RLHF讲座(NYU CSCI 2590) 附视频

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

我将介绍指令微调和人类反馈的强化学习（RLHF），这些是深度学习技术，为当前一代大型语言模型（如ChatGPT）提供动力。

成为VIP会员查看完整内容

52

相关内容

指令微调

【李老师400+页的ChatGPT全面介绍PPT】《ChatGPT的前世今生》

【李老师400+页的ChatGPT全面介绍PPT】《ChatGPT的前世今生》

专知会员服务

173+阅读 · 2023年4月13日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知会员服务

148+阅读 · 2023年4月7日

ChatGPT核心技术“RLHF”如何学习？最新《基于人类反馈的强化学习:从零到chatGPT》综述，附视频与51页slides

ChatGPT核心技术“RLHF”如何学习？最新《基于人类反馈的强化学习:从零到chatGPT》综述，附视频与51页slides

专知会员服务

188+阅读 · 2023年3月2日

144页ppt！《Transformers》全面讲解，附视频

144页ppt！《Transformers》全面讲解，附视频

专知会员服务

119+阅读 · 2023年1月1日

斯坦福大学首个Transformers专题讲座视频放出，NLP、CV和RL无所不包

斯坦福大学首个Transformers专题讲座视频放出，NLP、CV和RL无所不包

专知会员服务

47+阅读 · 2022年7月12日

UC伯克利最新深度学习课程上线，强化学习大牛Sergey Levine授课（B站可看）

专知会员服务

33+阅读 · 2021年3月21日

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

专知会员服务

61+阅读 · 2021年3月15日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知会员服务

46+阅读 · 2020年8月9日

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

专知会员服务

172+阅读 · 2020年6月25日

WSDM 2020教程《深度贝叶斯数据挖掘》，附257页PPT下载

WSDM 2020教程《深度贝叶斯数据挖掘》，附257页PPT下载

专知会员服务

157+阅读 · 2020年2月7日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

不可错过！普林斯顿陈丹琦最新《大语言模型理解》2022课程！全面讲述BERT、GPT、T5等大模型，附Slides

不可错过！普林斯顿陈丹琦最新《大语言模型理解》2022课程！全面讲述BERT、GPT、T5等大模型，附Slides

新智元

5+阅读 · 2022年10月29日

Hinton授课，斯坦福首个Transformers专题讲座视频放出，NLP、CV和RL无所不包

Hinton授课，斯坦福首个Transformers专题讲座视频放出，NLP、CV和RL无所不包

THU数据派

2+阅读 · 2022年7月11日

Hinton曾授课，斯坦福首个Transformers专题讲座视频放出，NLP、CV和RL无所不包

Hinton曾授课，斯坦福首个Transformers专题讲座视频放出，NLP、CV和RL无所不包

机器之心

2+阅读 · 2022年7月10日

【课程】斯坦福大学CS236：深度生成模型，附课程材料下载

【课程】斯坦福大学CS236：深度生成模型，附课程材料下载

专知

30+阅读 · 2019年9月25日

中文课程！台大李宏毅机器学习公开课2019版上线

中文课程！台大李宏毅机器学习公开课2019版上线

全球人工智能

14+阅读 · 2019年3月18日

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

新智元

14+阅读 · 2018年11月24日

Yan Lecun 自监督学习：机器能像人一样学习吗？ 110页PPT+视频

Yan Lecun 自监督学习：机器能像人一样学习吗？ 110页PPT+视频

专知

29+阅读 · 2018年10月9日

CMU2018春季课程：神经网络自然语言处理课程（附PPT和代码）

CMU2018春季课程：神经网络自然语言处理课程（附PPT和代码）

专知

12+阅读 · 2018年2月2日

【Manning主讲】斯坦福CS224n深度学习与NLP课程全部视频、PPT

【Manning主讲】斯坦福CS224n深度学习与NLP课程全部视频、PPT

新智元

11+阅读 · 2017年8月16日

乙酰转移酶p300对脂肪酸合成的调控机制及其在前列腺癌治疗中的意义

国家自然科学基金

0+阅读 · 2015年12月31日

多层聚丙交酯共聚物/壳聚糖电纺膜定位负载microRNA的血管再生活性材料

国家自然科学基金

0+阅读 · 2014年12月31日

miR-29b在Ang-II诱导肾小管上皮间充质转分化中的作用

国家自然科学基金

0+阅读 · 2013年12月31日

PPARβ/δ调节nNOS对肺型氧中毒保护作用的研究

国家自然科学基金

0+阅读 · 2013年12月31日

原子运动神经机理与动力外骨骼的脑机协调控制方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

miR-491通过调控T细胞的增殖和凋亡在诱导T细胞衰竭中的作用机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

稀土胺基化合物氧化引发偶联反应的研究

国家自然科学基金

0+阅读 · 2011年12月31日

新型含阴离子受体基团的锂离子二次电池聚合物电解质隔膜研究

国家自然科学基金

0+阅读 · 2011年12月31日

CD4+CD25+调节性T细胞对肿瘤干细胞的影响及其调控机制研究

国家自然科学基金

0+阅读 · 2011年12月31日

miR-155负向调控免疫应答的机制及其在哮喘发病中的作用

国家自然科学基金

0+阅读 · 2008年12月31日

Mixture-of-Experts Meets Instruction Tuning:A Winning Combination for Large Language Models

Arxiv

0+阅读 · 2023年7月5日

From ChatGPT to ThreatGPT: Impact of Generative AI in Cybersecurity and Privacy

Arxiv

0+阅读 · 2023年7月3日

MP3: Movement Primitive-Based (Re-)Planning Policy

Arxiv

0+阅读 · 2023年7月2日

A Juridicidade e a Regulamentação dos Dark Patterns

Arxiv

0+阅读 · 2023年7月1日

Abstract Orientable Incidence Structure and Algorithms for Finite Bounded Acyclic Categories. II. Data Structure and Fundamental Operations

Arxiv

0+阅读 · 2023年7月1日

Circular Systems Engineering

Arxiv

0+阅读 · 2023年6月30日

Harnessing LLMs in Curricular Design: Using GPT-4 to Support Authoring of Learning Objectives

Arxiv

0+阅读 · 2023年6月30日

A Survey on ChatGPT: AI-Generated Contents, Challenges, and Solutions

Arxiv

54+阅读 · 2023年5月25日

ChatGPT-Like Large-Scale Foundation Models for Prognostics and Health Management: A Survey and Roadmaps

Arxiv

31+阅读 · 2023年5月12日

Extreme Language Model Compression with Optimal Subwords and Shared Projections

Extreme Language Model Compression with Optimal Subwords and Shared Projections

Arxiv

18+阅读 · 2019年9月25日

VIP会员

相关主题

人类反馈强化学习 (RLHF)

最新内容

面向国防作战的最佳自主与蜂群无人机技术

面向国防作战的最佳自主与蜂群无人机技术

专知会员服务

2+阅读 · 今天8:04

《异构人类团队的协作决策过程混合建模研究》

《异构人类团队的协作决策过程混合建模研究》

专知会员服务

3+阅读 · 今天7:59

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

专知会员服务

3+阅读 · 今天7:56

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

专知会员服务

3+阅读 · 今天7:50

博士论文 | 面向大模型推理的内存高效算法

博士论文 | 面向大模型推理的内存高效算法

专知会员服务

3+阅读 · 7月27日

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

论文解读 | 从预训练到后训练：理解大模型推理能力如何形成

专知会员服务

4+阅读 · 7月27日

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《无人系统互操作性导论——无人系统联合架构（JAUS）》

专知会员服务

11+阅读 · 7月27日

美空军新型反无人机部队初探

美空军新型反无人机部队初探

专知会员服务

7+阅读 · 7月27日

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

专知会员服务

6+阅读 · 7月27日

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

专知会员服务

4+阅读 · 7月27日

《防空交战流程的概率建模研究》

《防空交战流程的概率建模研究》

专知会员服务

10+阅读 · 7月27日

ICML 2026 教程 | 数值优化理论还重要吗？

ICML 2026 教程 | 数值优化理论还重要吗？

专知会员服务

6+阅读 · 7月26日

ICM 2026 | 陶哲轩：人工智能时代的数学

ICM 2026 | 陶哲轩：人工智能时代的数学

专知会员服务

9+阅读 · 7月26日

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

专知会员服务

8+阅读 · 7月26日

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

专知会员服务

11+阅读 · 7月26日

相关VIP内容

【李老师400+页的ChatGPT全面介绍PPT】《ChatGPT的前世今生》

【李老师400+页的ChatGPT全面介绍PPT】《ChatGPT的前世今生》

专知会员服务

173+阅读 · 2023年4月13日

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知会员服务

148+阅读 · 2023年4月7日

ChatGPT核心技术“RLHF”如何学习？最新《基于人类反馈的强化学习:从零到chatGPT》综述，附视频与51页slides

ChatGPT核心技术“RLHF”如何学习？最新《基于人类反馈的强化学习:从零到chatGPT》综述，附视频与51页slides

专知会员服务

188+阅读 · 2023年3月2日

144页ppt！《Transformers》全面讲解，附视频

144页ppt！《Transformers》全面讲解，附视频

专知会员服务

119+阅读 · 2023年1月1日

斯坦福大学首个Transformers专题讲座视频放出，NLP、CV和RL无所不包

斯坦福大学首个Transformers专题讲座视频放出，NLP、CV和RL无所不包

专知会员服务

47+阅读 · 2022年7月12日

UC伯克利最新深度学习课程上线，强化学习大牛Sergey Levine授课（B站可看）

专知会员服务

33+阅读 · 2021年3月21日

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

【斯坦福NLP-CS224N硬核课】自然语言处理未来与深度学习，81页ppt

专知会员服务

61+阅读 · 2021年3月15日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知会员服务

46+阅读 · 2020年8月9日

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

【DeepMind硬核课】深度学习注意力与记忆机制，附70页ppt与视频

专知会员服务

172+阅读 · 2020年6月25日

WSDM 2020教程《深度贝叶斯数据挖掘》，附257页PPT下载

WSDM 2020教程《深度贝叶斯数据挖掘》，附257页PPT下载

专知会员服务

157+阅读 · 2020年2月7日

热门VIP内容

开通专知VIP会员享更多权益服务

《异构人类团队的协作决策过程混合建模研究》

《设计思维中的人机协作：生成式人工智能对共情访谈影响的探究》140页

面向国防作战的最佳自主与蜂群无人机技术

《C5ISR系统中的注意力动态与自适应决策支持研究：视觉与多模态注意力引导对任务绩效影响的递归量化分析》最新36页报告

相关资讯

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

194篇文献调研ChatGPT最新研究进展！最新《ChatGPT/GPT-4研究综述及对大型语言模型未来的展望》国内外研究者编著

专知

25+阅读 · 2023年4月7日

不可错过！普林斯顿陈丹琦最新《大语言模型理解》2022课程！全面讲述BERT、GPT、T5等大模型，附Slides

不可错过！普林斯顿陈丹琦最新《大语言模型理解》2022课程！全面讲述BERT、GPT、T5等大模型，附Slides

新智元

5+阅读 · 2022年10月29日

Hinton授课，斯坦福首个Transformers专题讲座视频放出，NLP、CV和RL无所不包

Hinton授课，斯坦福首个Transformers专题讲座视频放出，NLP、CV和RL无所不包

THU数据派

2+阅读 · 2022年7月11日

Hinton曾授课，斯坦福首个Transformers专题讲座视频放出，NLP、CV和RL无所不包

Hinton曾授课，斯坦福首个Transformers专题讲座视频放出，NLP、CV和RL无所不包

机器之心

2+阅读 · 2022年7月10日

【课程】斯坦福大学CS236：深度生成模型，附课程材料下载

【课程】斯坦福大学CS236：深度生成模型，附课程材料下载

专知

30+阅读 · 2019年9月25日

中文课程！台大李宏毅机器学习公开课2019版上线

中文课程！台大李宏毅机器学习公开课2019版上线

全球人工智能

14+阅读 · 2019年3月18日

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

DeepMind高赞课程：24小时看完深度强化学习最新进展（视频）

新智元

14+阅读 · 2018年11月24日

Yan Lecun 自监督学习：机器能像人一样学习吗？ 110页PPT+视频

Yan Lecun 自监督学习：机器能像人一样学习吗？ 110页PPT+视频

专知

29+阅读 · 2018年10月9日

CMU2018春季课程：神经网络自然语言处理课程（附PPT和代码）

CMU2018春季课程：神经网络自然语言处理课程（附PPT和代码）

专知

12+阅读 · 2018年2月2日

【Manning主讲】斯坦福CS224n深度学习与NLP课程全部视频、PPT

【Manning主讲】斯坦福CS224n深度学习与NLP课程全部视频、PPT

新智元

11+阅读 · 2017年8月16日

相关基金

乙酰转移酶p300对脂肪酸合成的调控机制及其在前列腺癌治疗中的意义

国家自然科学基金

0+阅读 · 2015年12月31日

多层聚丙交酯共聚物/壳聚糖电纺膜定位负载microRNA的血管再生活性材料

国家自然科学基金

0+阅读 · 2014年12月31日

miR-29b在Ang-II诱导肾小管上皮间充质转分化中的作用

国家自然科学基金

0+阅读 · 2013年12月31日

PPARβ/δ调节nNOS对肺型氧中毒保护作用的研究

国家自然科学基金

0+阅读 · 2013年12月31日

原子运动神经机理与动力外骨骼的脑机协调控制方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

miR-491通过调控T细胞的增殖和凋亡在诱导T细胞衰竭中的作用机制研究

国家自然科学基金

0+阅读 · 2012年12月31日

稀土胺基化合物氧化引发偶联反应的研究

国家自然科学基金

0+阅读 · 2011年12月31日

新型含阴离子受体基团的锂离子二次电池聚合物电解质隔膜研究

国家自然科学基金

0+阅读 · 2011年12月31日

CD4+CD25+调节性T细胞对肿瘤干细胞的影响及其调控机制研究

国家自然科学基金

0+阅读 · 2011年12月31日

miR-155负向调控免疫应答的机制及其在哮喘发病中的作用

国家自然科学基金

0+阅读 · 2008年12月31日

相关论文

Mixture-of-Experts Meets Instruction Tuning:A Winning Combination for Large Language Models

Arxiv

0+阅读 · 2023年7月5日

From ChatGPT to ThreatGPT: Impact of Generative AI in Cybersecurity and Privacy

Arxiv

0+阅读 · 2023年7月3日

MP3: Movement Primitive-Based (Re-)Planning Policy

Arxiv

0+阅读 · 2023年7月2日

A Juridicidade e a Regulamentação dos Dark Patterns

Arxiv

0+阅读 · 2023年7月1日

Abstract Orientable Incidence Structure and Algorithms for Finite Bounded Acyclic Categories. II. Data Structure and Fundamental Operations

Arxiv

0+阅读 · 2023年7月1日

Circular Systems Engineering

Arxiv

0+阅读 · 2023年6月30日

Harnessing LLMs in Curricular Design: Using GPT-4 to Support Authoring of Learning Objectives

Arxiv

0+阅读 · 2023年6月30日

A Survey on ChatGPT: AI-Generated Contents, Challenges, and Solutions

Arxiv

54+阅读 · 2023年5月25日

ChatGPT-Like Large-Scale Foundation Models for Prognostics and Health Management: A Survey and Roadmaps

Arxiv

31+阅读 · 2023年5月12日

Extreme Language Model Compression with Optimal Subwords and Shared Projections

Extreme Language Model Compression with Optimal Subwords and Shared Projections

Arxiv

18+阅读 · 2019年9月25日

微信扫码咨询专知VIP会员