动机是一种推动人类行动和行为的强大力量。它促使我们追求自己的目标和愿望,并能极大地影响我们的决策过程。在人工智能领域,模拟人类行动和决策的最常见方法是通过强化学习,它依赖于外部基于奖励的学习机制来影响智能体的行为。虽然奖励在大脑和机器中都是学习的主要动力,但最近的研究表明,大脑中的奖励信号以一种不同于学习的方式影响动机行为。在本文中,我们设计了一个基于个人动机而非学习做出决定的动机智能体。为此,我们着手证明,在稀疏的奖励环境中,一个有动机的智能体可以胜过一个学习型代智能体。我们还提出了一个基于多巴胺发射的目标维持机制的框架,并证明了这个组件如何在不依赖学习的情况下立即影响智能体在网格环境中的行为。总之,我们的工作旨在促进对人类和人工智能的动机及其在决策中的作用的理解。通过设计一个能根据个人动机做出决定的动机智能体,我们希望能阐明人类心理学的这一基本方面如何能在人工智能中被建模和利用。