【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学 - 专知VIP

会员服务 ·

74

不确定性决策 · 强化学习 ·

2020 年 4 月 28 日

【开放新书】不确定性决策与强化学习，267页pdf，瑞典查尔姆斯理工大学

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

决策理论是现代人工智能和经济学的基础。本课程主要从统计学的角度，也从哲学的角度，为决策理论打下坚实的基础。本课程有两个目的:

深入了解统计决策理论、实验设计的自动化方法，并将其与人类决策联系起来。
通过开发算法和智能代理的实验，将该理论应用到强化学习和人工智能的实际问题中。

课程可分为两部分。

第一部分，我们介绍了主观概率和效用的概念，以及如何用它们来表示和解决决策问题。然后讨论未知参数的估计和假设检验。最后，我们讨论了顺序抽样、顺序实验，以及更一般的顺序决策。
第二部分是不确定性下的决策研究，特别是强化学习和专家咨询学习。首先，我们研究几个有代表性的统计模型。然后，我们给出了使用这些模型做出最优决策的算法的概述。最后，我们来看看学习如何根据专家的建议来行动的问题，这个领域最近在在线广告、游戏树搜索和优化方面有很多应用。

成为VIP会员查看完整内容

相关内容

不确定性决策

不确定性决策

【开放书-纽约大学】面向数据科学的概率与统计，237页pdf

【开放书-纽约大学】面向数据科学的概率与统计，237页pdf

专知会员服务

149+阅读 · 2020年7月6日

波士顿大学Francesco《在线学习导论》2020书册，126页pdf详述在线学习最新进展

波士顿大学Francesco《在线学习导论》2020书册，126页pdf详述在线学习最新进展

专知会员服务

61+阅读 · 2020年5月13日

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

190+阅读 · 2020年5月5日

【硬核书】博弈论导论，417页pdf，Game Theory: An Introduction，普林斯顿大学出版社

【硬核书】博弈论导论，417页pdf，Game Theory: An Introduction，普林斯顿大学出版社

专知会员服务

235+阅读 · 2020年4月21日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

282+阅读 · 2020年4月19日

2020年MIT出版社新书《因果推理原理：基础与学习算法》，289页pdf

2020年MIT出版社新书《因果推理原理：基础与学习算法》，289页pdf

专知会员服务

476+阅读 · 2020年2月17日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

185+阅读 · 2020年1月17日

【开放书】部分观测动态系统的贝叶斯学习，119页pdf，Bayesian Learning for partially observed dynamical systems

【开放书】部分观测动态系统的贝叶斯学习，119页pdf，Bayesian Learning for partially observed dynamical systems

专知会员服务

41+阅读 · 2019年12月27日

人工智能学习笔记，247页pdf

人工智能学习笔记，247页pdf

专知会员服务

189+阅读 · 2019年12月14日

【微软Alekh等开放新书】强化学习理论与算法（Reinforcement Learning:Theory and Algorithms），附83页pdf

【微软Alekh等开放新书】强化学习理论与算法（Reinforcement Learning:Theory and Algorithms），附83页pdf

专知会员服务

122+阅读 · 2019年11月24日

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

专知

67+阅读 · 2019年9月26日

最新版《机器学习数学基础》发布，417页PDF免费下载

最新版《机器学习数学基础》发布，417页PDF免费下载

新智元

60+阅读 · 2019年9月5日

《AutoML：方法，系统，挑战》新书免费下载

《AutoML：方法，系统，挑战》新书免费下载

新智元

25+阅读 · 2019年5月28日

421页《机器学习数学基础》最新2019版PDF下载

421页《机器学习数学基础》最新2019版PDF下载

专知

178+阅读 · 2019年3月17日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

自然语言处理最新教材开放下载，乔治亚理工大学官方推荐

自然语言处理最新教材开放下载，乔治亚理工大学官方推荐

机器之心

13+阅读 · 2018年6月3日

论强化学习和概率推断的等价性：一种全新概率模型

论强化学习和概率推断的等价性：一种全新概率模型

机器之心

26+阅读 · 2018年5月5日

一文学习基于蒙特卡罗的强化学习方法（送书）

一文学习基于蒙特卡罗的强化学习方法（送书）

人工智能头条

7+阅读 · 2018年3月13日

Advances and Open Problems in Federated Learning

Advances and Open Problems in Federated Learning

Arxiv

18+阅读 · 2019年12月10日

Object-centric Forward Modeling for Model Predictive Control

Object-centric Forward Modeling for Model Predictive Control

Arxiv

5+阅读 · 2019年10月8日

Reward learning from human preferences and demonstrations in Atari

Arxiv

8+阅读 · 2018年11月15日

Sample Efficient Adaptive Text-to-Speech

Arxiv

7+阅读 · 2018年9月27日

Large Margin Few-Shot Learning

Arxiv

11+阅读 · 2018年7月8日

Reproducibility Report for "Learning To Count Objects In Natural Images For Visual Question Answering"

Reproducibility Report for "Learning To Count Objects In Natural Images For Visual Question Answering"

Arxiv

4+阅读 · 2018年5月21日

Learning Human Pose Models from Synthesized Data for Robust RGB-D Action Recognition

Arxiv

3+阅读 · 2018年5月1日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Learning to Evade Static PE Machine Learning Malware Models via Reinforcement Learning

Arxiv

3+阅读 · 2018年1月30日

A Generative Model For Zero Shot Learning Using Conditional Variational Autoencoders

Arxiv

9+阅读 · 2018年1月27日

VIP会员

相关主题

不确定性决策

最新内容

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

专知会员服务

8+阅读 · 7月16日

《无人地面战车（UGV）的崛起》报告

《无人地面战车（UGV）的崛起》报告

专知会员服务

5+阅读 · 7月16日

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

专知会员服务

5+阅读 · 7月16日

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

专知会员服务

8+阅读 · 7月16日

美陆军任务式指挥人工智能解决方案

美陆军任务式指挥人工智能解决方案

专知会员服务

7+阅读 · 7月16日

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

专知会员服务

5+阅读 · 7月16日

综述 | 现代智能体自我改进，从模型更新到脚手架演化

综述 | 现代智能体自我改进，从模型更新到脚手架演化

专知会员服务

8+阅读 · 7月16日

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

专知会员服务

12+阅读 · 7月15日

五角大楼新版反无人机手册：内容解析与战略影响（附手册100页原件）

五角大楼新版反无人机手册：内容解析与战略影响（附手册100页原件）

专知会员服务

14+阅读 · 7月15日

《军事基地能源韧性与经济性权衡评估方法研究》

《军事基地能源韧性与经济性权衡评估方法研究》

专知会员服务

7+阅读 · 7月15日

ACM MM 2026 | UNIT：释放大语言模型在图持续学习中的潜力

ACM MM 2026 | UNIT：释放大语言模型在图持续学习中的潜力

专知会员服务

8+阅读 · 7月15日

综述 | 具身视觉语言导航：系统综述与真实世界评测

综述 | 具身视觉语言导航：系统综述与真实世界评测

专知会员服务

10+阅读 · 7月15日

应对第1、2类无人机威胁的推荐战术、技术与程序

应对第1、2类无人机威胁的推荐战术、技术与程序

专知会员服务

10+阅读 · 7月15日

《反制多无人机集群攻城：序贯斯塔克伯格安全博弈方法研究》59页

《反制多无人机集群攻城：序贯斯塔克伯格安全博弈方法研究》59页

专知会员服务

11+阅读 · 7月15日

博士论文 | 可扩展、自我改进的大语言模型智能体

博士论文 | 可扩展、自我改进的大语言模型智能体

专知会员服务

12+阅读 · 7月14日

相关VIP内容

【开放书-纽约大学】面向数据科学的概率与统计，237页pdf

【开放书-纽约大学】面向数据科学的概率与统计，237页pdf

专知会员服务

149+阅读 · 2020年7月6日

波士顿大学Francesco《在线学习导论》2020书册，126页pdf详述在线学习最新进展

波士顿大学Francesco《在线学习导论》2020书册，126页pdf详述在线学习最新进展

专知会员服务

61+阅读 · 2020年5月13日

最新《智能交通系统的深度强化学习》综述论文，22页pdf

最新《智能交通系统的深度强化学习》综述论文，22页pdf

专知会员服务

190+阅读 · 2020年5月5日

【硬核书】博弈论导论，417页pdf，Game Theory: An Introduction，普林斯顿大学出版社

【硬核书】博弈论导论，417页pdf，Game Theory: An Introduction，普林斯顿大学出版社

专知会员服务

235+阅读 · 2020年4月21日

《强化学习》简介小册，24页pdf

《强化学习》简介小册，24页pdf

专知会员服务

282+阅读 · 2020年4月19日

2020年MIT出版社新书《因果推理原理：基础与学习算法》，289页pdf

2020年MIT出版社新书《因果推理原理：基础与学习算法》，289页pdf

专知会员服务

476+阅读 · 2020年2月17日

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

【新书】Python强化学习-基于Tensorflow与Keras和OpenAI Gym实战, 177页pdf

专知会员服务

185+阅读 · 2020年1月17日

【开放书】部分观测动态系统的贝叶斯学习，119页pdf，Bayesian Learning for partially observed dynamical systems

【开放书】部分观测动态系统的贝叶斯学习，119页pdf，Bayesian Learning for partially observed dynamical systems

专知会员服务

41+阅读 · 2019年12月27日

人工智能学习笔记，247页pdf

人工智能学习笔记，247页pdf

专知会员服务

189+阅读 · 2019年12月14日

【微软Alekh等开放新书】强化学习理论与算法（Reinforcement Learning:Theory and Algorithms），附83页pdf

【微软Alekh等开放新书】强化学习理论与算法（Reinforcement Learning:Theory and Algorithms），附83页pdf

专知会员服务

122+阅读 · 2019年11月24日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人地面战车（UGV）的崛起》报告

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

相关资讯

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

【微软Alekh等开放新书】强化学习理论与算法，83页pdf，了解最新进展

专知

25+阅读 · 2019年11月23日

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

【加州理工】什么是模仿学习(Imitation Learning（模仿学习), 这62页ppt带你了解进展，附下载

专知

21+阅读 · 2019年11月14日

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

【图灵奖得主Judea Pearl推荐新书】图模型(Graphical Models), 571页pdf，带你学习GM和因果推断

专知

67+阅读 · 2019年9月26日

最新版《机器学习数学基础》发布，417页PDF免费下载

最新版《机器学习数学基础》发布，417页PDF免费下载

新智元

60+阅读 · 2019年9月5日

《AutoML：方法，系统，挑战》新书免费下载

《AutoML：方法，系统，挑战》新书免费下载

新智元

25+阅读 · 2019年5月28日

421页《机器学习数学基础》最新2019版PDF下载

421页《机器学习数学基础》最新2019版PDF下载

专知

178+阅读 · 2019年3月17日

强化学习精品书籍

强化学习精品书籍

平均机器

26+阅读 · 2019年1月2日

自然语言处理最新教材开放下载，乔治亚理工大学官方推荐

自然语言处理最新教材开放下载，乔治亚理工大学官方推荐

机器之心

13+阅读 · 2018年6月3日

论强化学习和概率推断的等价性：一种全新概率模型

论强化学习和概率推断的等价性：一种全新概率模型

机器之心

26+阅读 · 2018年5月5日

一文学习基于蒙特卡罗的强化学习方法（送书）

一文学习基于蒙特卡罗的强化学习方法（送书）

人工智能头条

7+阅读 · 2018年3月13日

相关论文

Advances and Open Problems in Federated Learning

Advances and Open Problems in Federated Learning

Arxiv

18+阅读 · 2019年12月10日

Object-centric Forward Modeling for Model Predictive Control

Object-centric Forward Modeling for Model Predictive Control

Arxiv

5+阅读 · 2019年10月8日

Reward learning from human preferences and demonstrations in Atari

Arxiv

8+阅读 · 2018年11月15日

Sample Efficient Adaptive Text-to-Speech

Arxiv

7+阅读 · 2018年9月27日

Large Margin Few-Shot Learning

Arxiv

11+阅读 · 2018年7月8日

Reproducibility Report for "Learning To Count Objects In Natural Images For Visual Question Answering"

Reproducibility Report for "Learning To Count Objects In Natural Images For Visual Question Answering"

Arxiv

4+阅读 · 2018年5月21日

Learning Human Pose Models from Synthesized Data for Robust RGB-D Action Recognition

Arxiv

3+阅读 · 2018年5月1日

Multiagent Soft Q-Learning

Arxiv

11+阅读 · 2018年4月25日

Learning to Evade Static PE Machine Learning Malware Models via Reinforcement Learning

Arxiv

3+阅读 · 2018年1月30日

A Generative Model For Zero Shot Learning Using Conditional Variational Autoencoders

Arxiv

9+阅读 · 2018年1月27日

微信扫码咨询专知VIP会员