《有动机的智能体》MIT2023最新47页论文 - 专知VIP

会员服务 ·

18

军事防务 · 智能体 · 麻省理工学院 (MIT) · 人工智能 ·

2023 年 6 月 11 日

《有动机的智能体》MIT2023最新47页论文

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

动机是一种推动人类行动和行为的强大力量。它促使我们追求自己的目标和愿望，并能极大地影响我们的决策过程。在人工智能领域，模拟人类行动和决策的最常见方法是通过强化学习，它依赖于外部基于奖励的学习机制来影响智能体的行为。虽然奖励在大脑和机器中都是学习的主要动力，但最近的研究表明，大脑中的奖励信号以一种不同于学习的方式影响动机行为。在本文中，我们设计了一个基于个人动机而非学习做出决定的动机智能体。为此，我们着手证明，在稀疏的奖励环境中，一个有动机的智能体可以胜过一个学习型代智能体。我们还提出了一个基于多巴胺发射的目标维持机制的框架，并证明了这个组件如何在不依赖学习的情况下立即影响智能体在网格环境中的行为。总之，我们的工作旨在促进对人类和人工智能的动机及其在决策中的作用的理解。通过设计一个能根据个人动机做出决定的动机智能体，我们希望能阐明人类心理学的这一基本方面如何能在人工智能中被建模和利用。

成为VIP会员查看完整内容

45

相关内容

军事防务

军事防务数据板块介绍：系统化采集、存储、管理、分析与军事国防安全相关信息的专用数据板块，其核心在于整合全球新兴国防技术（军事人工智能、无人系统等）、热点案例（俄乌战争、美以伊战争）等方面的最新时讯、研究报告/论文、条令法规、案例分析，为战略研判、情报分析、决策支持等提供知识支撑。

《智能体辅助协作学习》2023最新博士论文

《智能体辅助协作学习》2023最新博士论文

专知会员服务

23+阅读 · 2023年8月1日

【MIT】准量化强化学习，90页ppt

【MIT】准量化强化学习，90页ppt

专知会员服务

38+阅读 · 2023年7月16日

【普林斯顿博士论文】智能体和机制的学习算法，201页pdf

【普林斯顿博士论文】智能体和机制的学习算法，201页pdf

专知会员服务

53+阅读 · 2023年4月18日

博士论文 |《多智能体系统：协作辅助智能体和对对抗性攻击的鲁棒性》哈佛大学

博士论文 |《多智能体系统：协作辅助智能体和对对抗性攻击的鲁棒性》哈佛大学

专知会员服务

69+阅读 · 2023年2月27日

【普林斯顿博士论文】克服深度强化学习中的采样和探索挑战，135页pdf

【普林斯顿博士论文】克服深度强化学习中的采样和探索挑战，135页pdf

专知会员服务

61+阅读 · 2023年1月31日

强化学习的简要总结，18页pdf

强化学习的简要总结，18页pdf

专知会员服务

59+阅读 · 2023年1月7日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知会员服务

90+阅读 · 2022年11月17日

《对抗性几何规划研究》2022最新论文，捷克理工大学

《对抗性几何规划研究》2022最新论文，捷克理工大学

专知会员服务

33+阅读 · 2022年10月30日

《基于兵棋推演展现人工智能的影响》论文集78页

《基于兵棋推演展现人工智能的影响》论文集78页

专知会员服务

83+阅读 · 2022年9月1日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

177+阅读 · 2020年2月8日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

39+阅读 · 2023年4月13日

AI好奇心，不只害死猫！MIT强化学习新算法，智能体这回「难易通吃」

AI好奇心，不只害死猫！MIT强化学习新算法，智能体这回「难易通吃」

新智元

0+阅读 · 2022年11月27日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知

10+阅读 · 2022年11月17日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

【量子强化学习】《量子计算和强化学习：实现通用人工智能的伙伴》2022最新17页论文

【量子强化学习】《量子计算和强化学习：实现通用人工智能的伙伴》2022最新17页论文

专知

3+阅读 · 2022年10月11日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

《基于兵棋推演展现人工智能的影响》论文集78页

《基于兵棋推演展现人工智能的影响》论文集78页

专知

8+阅读 · 2022年9月2日

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

机器之心

20+阅读 · 2019年5月3日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

一文了解强化学习

一文了解强化学习

AI100

15+阅读 · 2018年8月20日

基于区域选举稳定性理论的人工智能方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

网络演化博弈实验中的策略学习动力学与相变问题研究

国家自然科学基金

5+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

目标导向的网络挖掘与推荐关键问题研究

国家自然科学基金

1+阅读 · 2012年12月31日

社会认知中信念冲突的认知神经机制及其计算模型

国家自然科学基金

6+阅读 · 2012年12月31日

社会情境影响公平感知和社会决策的认知神经机制

国家自然科学基金

1+阅读 · 2011年12月31日

基于"非监督-监督-激励"集成学习模式的机器人行为自主学习系统研究

国家自然科学基金

1+阅读 · 2010年12月31日

具有模仿与强化学习机制的智能机器人

国家自然科学基金

2+阅读 · 2009年12月31日

基于心理学归因理论的社会推理计算模型研究

国家自然科学基金

1+阅读 · 2008年12月31日

虚拟环境中仿真情景适应性演化模型的研究

国家自然科学基金

1+阅读 · 2008年12月31日

Change-Point Testing for Risk Measures in Time Series

Arxiv

0+阅读 · 2023年7月31日

MetaDiff: Meta-Learning with Conditional Diffusion for Few-Shot Learning

Arxiv

0+阅读 · 2023年7月31日

Rating-based Reinforcement Learning

Arxiv

0+阅读 · 2023年7月30日

Click-Conversion Multi-Task Model with Position Bias Mitigation for Sponsored Search in eCommerce

Arxiv

0+阅读 · 2023年7月29日

Nature Language Reasoning, A Survey

Arxiv

83+阅读 · 2023年3月26日

Deep Learning for UAV-based Object Detection and Tracking: A Survey

Arxiv

64+阅读 · 2021年10月25日

Survey: Transformer based Video-Language Pre-training

Arxiv

20+阅读 · 2021年9月21日

The Book of Why: Review

Arxiv

15+阅读 · 2019年9月30日

A Survey of Learning Causality with Data: Problems and Methods

A Survey of Learning Causality with Data: Problems and Methods

Arxiv

19+阅读 · 2018年9月25日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

17+阅读 · 2018年6月27日

VIP会员

相关主题

麻省理工学院 (MIT)

最新内容

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《无人系统互操作性导论——无人系统联合架构（JAUS）》

专知会员服务

4+阅读 · 今天5:53

美空军新型反无人机部队初探

美空军新型反无人机部队初探

专知会员服务

1+阅读 · 今天5:45

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

专知会员服务

2+阅读 · 今天5:23

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

专知会员服务

1+阅读 · 今天5:11

《防空交战流程的概率建模研究》

《防空交战流程的概率建模研究》

专知会员服务

4+阅读 · 今天5:04

ICML 2026 教程 | 数值优化理论还重要吗？

ICML 2026 教程 | 数值优化理论还重要吗？

专知会员服务

4+阅读 · 7月26日

ICM 2026 | 陶哲轩：人工智能时代的数学

ICM 2026 | 陶哲轩：人工智能时代的数学

专知会员服务

7+阅读 · 7月26日

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

《面向可扩展高韧性无人机集群网络的速度感知分层通信框架》

专知会员服务

7+阅读 · 7月26日

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

《面向概率推理的可定制战术引擎及其在军事任务规划中的应用》

专知会员服务

9+阅读 · 7月26日

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

《先进防空系统选型战略框架：基于巴基斯坦的实证启示》

专知会员服务

8+阅读 · 7月26日

《反无人机交战场景下的战斗归零研究》

《反无人机交战场景下的战斗归零研究》

专知会员服务

7+阅读 · 7月26日

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

霍尔木兹与不对称作战时代：水雷、无人系统与海军力量的重新定义

专知会员服务

4+阅读 · 7月26日

博士论文 | 用代码结构感知方法推进代码大模型

博士论文 | 用代码结构感知方法推进代码大模型

专知会员服务

5+阅读 · 7月25日

综述 | 遥感多模态大模型：领域专用还是通用模型？

综述 | 遥感多模态大模型：领域专用还是通用模型？

专知会员服务

5+阅读 · 7月25日

《面向指挥控制训练与实时北约兼容数据分发的战术模拟器》

《面向指挥控制训练与实时北约兼容数据分发的战术模拟器》

专知会员服务

5+阅读 · 7月25日

相关VIP内容

《智能体辅助协作学习》2023最新博士论文

《智能体辅助协作学习》2023最新博士论文

专知会员服务

23+阅读 · 2023年8月1日

【MIT】准量化强化学习，90页ppt

【MIT】准量化强化学习，90页ppt

专知会员服务

38+阅读 · 2023年7月16日

【普林斯顿博士论文】智能体和机制的学习算法，201页pdf

【普林斯顿博士论文】智能体和机制的学习算法，201页pdf

专知会员服务

53+阅读 · 2023年4月18日

博士论文 |《多智能体系统：协作辅助智能体和对对抗性攻击的鲁棒性》哈佛大学

博士论文 |《多智能体系统：协作辅助智能体和对对抗性攻击的鲁棒性》哈佛大学

专知会员服务

69+阅读 · 2023年2月27日

【普林斯顿博士论文】克服深度强化学习中的采样和探索挑战，135页pdf

【普林斯顿博士论文】克服深度强化学习中的采样和探索挑战，135页pdf

专知会员服务

61+阅读 · 2023年1月31日

强化学习的简要总结，18页pdf

强化学习的简要总结，18页pdf

专知会员服务

59+阅读 · 2023年1月7日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知会员服务

90+阅读 · 2022年11月17日

《对抗性几何规划研究》2022最新论文，捷克理工大学

《对抗性几何规划研究》2022最新论文，捷克理工大学

专知会员服务

33+阅读 · 2022年10月30日

《基于兵棋推演展现人工智能的影响》论文集78页

《基于兵棋推演展现人工智能的影响》论文集78页

专知会员服务

83+阅读 · 2022年9月1日

【综述】自动驾驶领域中的强化学习，附18页论文下载

【综述】自动驾驶领域中的强化学习，附18页论文下载

专知会员服务

177+阅读 · 2020年2月8日

热门VIP内容

开通专知VIP会员享更多权益服务

美空军新型反无人机部队初探

《北约下一代建模与仿真（NexGen M&S）计划》2026年69页

《无人系统互操作性导论——无人系统联合架构（JAUS）》

《对抗性电磁环境下远程巡飞弹作战的安全指挥与控制数据链》

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

39+阅读 · 2023年4月13日

AI好奇心，不只害死猫！MIT强化学习新算法，智能体这回「难易通吃」

AI好奇心，不只害死猫！MIT强化学习新算法，智能体这回「难易通吃」

新智元

0+阅读 · 2022年11月27日

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

强化学习如何可解释？浙大最新《可解释强化学习》综述，37页pdf1阐述XRL概念、算法、挑战

专知

10+阅读 · 2022年11月17日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

【量子强化学习】《量子计算和强化学习：实现通用人工智能的伙伴》2022最新17页论文

【量子强化学习】《量子计算和强化学习：实现通用人工智能的伙伴》2022最新17页论文

专知

3+阅读 · 2022年10月11日

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

【牛津大学博士论文】深度强化学习的归纳偏差和泛化,168页pdf

专知

10+阅读 · 2022年10月6日

《基于兵棋推演展现人工智能的影响》论文集78页

《基于兵棋推演展现人工智能的影响》论文集78页

专知

8+阅读 · 2022年9月2日

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

DeepMind综述深度强化学习中的快与慢，智能体应该像人一样学习

机器之心

20+阅读 · 2019年5月3日

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

让智能体主动交互，DeepMind提出用元强化学习实现因果推理

机器之心

17+阅读 · 2019年2月11日

一文了解强化学习

一文了解强化学习

AI100

15+阅读 · 2018年8月20日

相关基金

基于区域选举稳定性理论的人工智能方法研究

国家自然科学基金

3+阅读 · 2014年12月31日

网络演化博弈实验中的策略学习动力学与相变问题研究

国家自然科学基金

5+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

目标导向的网络挖掘与推荐关键问题研究

国家自然科学基金

1+阅读 · 2012年12月31日

社会认知中信念冲突的认知神经机制及其计算模型

国家自然科学基金

6+阅读 · 2012年12月31日

社会情境影响公平感知和社会决策的认知神经机制

国家自然科学基金

1+阅读 · 2011年12月31日

基于"非监督-监督-激励"集成学习模式的机器人行为自主学习系统研究

国家自然科学基金

1+阅读 · 2010年12月31日

具有模仿与强化学习机制的智能机器人

国家自然科学基金

2+阅读 · 2009年12月31日

基于心理学归因理论的社会推理计算模型研究

国家自然科学基金

1+阅读 · 2008年12月31日

虚拟环境中仿真情景适应性演化模型的研究

国家自然科学基金

1+阅读 · 2008年12月31日

相关论文

Change-Point Testing for Risk Measures in Time Series

Arxiv

0+阅读 · 2023年7月31日

MetaDiff: Meta-Learning with Conditional Diffusion for Few-Shot Learning

Arxiv

0+阅读 · 2023年7月31日

Rating-based Reinforcement Learning

Arxiv

0+阅读 · 2023年7月30日

Click-Conversion Multi-Task Model with Position Bias Mitigation for Sponsored Search in eCommerce

Arxiv

0+阅读 · 2023年7月29日

Nature Language Reasoning, A Survey

Arxiv

83+阅读 · 2023年3月26日

Deep Learning for UAV-based Object Detection and Tracking: A Survey

Arxiv

64+阅读 · 2021年10月25日

Survey: Transformer based Video-Language Pre-training

Arxiv

20+阅读 · 2021年9月21日

The Book of Why: Review

Arxiv

15+阅读 · 2019年9月30日

A Survey of Learning Causality with Data: Problems and Methods

A Survey of Learning Causality with Data: Problems and Methods

Arxiv

19+阅读 · 2018年9月25日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

17+阅读 · 2018年6月27日

微信扫码咨询专知VIP会员