基于目标条件与元强化学习的通用动态目标识别 (General Dynamic Goal Recognition using Goal-Conditioned and Meta Reinforcement Learning) - 专知论文

会员服务 ·

0

识别 · 目标识别 · 动态目标 · 元强化学习 · 强化学习 ·

General Dynamic Goal Recognition using Goal-Conditioned and Meta Reinforcement Learning

翻译：基于目标条件与元强化学习的通用动态目标识别

Osher Elhadad,Owen Morrissey,Reuth Mirsky

from arxiv, Accepted for publication at AAMAS 2026

Understanding an agent's goal through its behavior is a common AI problem called Goal Recognition (GR). This task becomes particularly challenging in dynamic environments where goals are numerous and ever-changing. We introduce the General Dynamic Goal Recognition (GDGR) problem, a broader definition of GR aimed at real-time adaptation of GR systems. This paper presents two novel approaches to tackle GDGR: (1) GC-AURA, generalizing to new goals using Model-Free Goal-Conditioned Reinforcement Learning, and (2) Meta-AURA, adapting to novel environments with Meta-Reinforcement Learning. We evaluate these methods across diverse environments, demonstrating their ability to achieve rapid adaptation and high GR accuracy under dynamic and noisy conditions. This work is a significant step forward in enabling GR in dynamic and unpredictable real-world environments.

翻译：通过智能体行为理解其目标是人工智能领域一个常见问题，称为目标识别。在目标数量众多且不断变化的动态环境中，该任务变得尤为困难。我们提出了通用动态目标识别问题，这是对目标识别更广泛的定义，旨在实现目标识别系统的实时适应。本文提出了两种解决通用动态目标识别的新方法：(1) GC-AURA，利用无模型目标条件强化学习实现对新目标的泛化；(2) Meta-AURA，通过元强化学习适应新环境。我们在多种环境中评估了这些方法，证明了它们在动态和噪声条件下能够实现快速适应并达到较高的目标识别准确率。这项研究为推动目标识别在动态且不可预测的真实环境中的应用迈出了重要一步。

0

相关内容

【牛津博士论文】零样本元强化学习中的表示方法询问 ChatGPT

【牛津博士论文】零样本元强化学习中的表示方法询问 ChatGPT

专知会员服务

17+阅读 · 2025年7月28日

【法国里尔大学博士论文】面向目标的强化学习探索，324页pdf

【法国里尔大学博士论文】面向目标的强化学习探索，324页pdf

专知会员服务

27+阅读 · 2023年10月28日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知会员服务

259+阅读 · 2022年8月23日

【多目标多智能体系统决策】196页PDF布鲁塞尔自由大学博士论文，Decision Making in Multi-Objective Multi-Agent Systems——A Utility-Based Perspective

【多目标多智能体系统决策】196页PDF布鲁塞尔自由大学博士论文，Decision Making in Multi-Objective Multi-Agent Systems——A Utility-Based Perspective

专知会员服务

118+阅读 · 2022年3月18日

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

专知会员服务

33+阅读 · 2022年3月13日

基于深度学习的通用目标检测研究综述

专知会员服务

93+阅读 · 2021年8月29日

深度学习目标检测方法综述

深度学习目标检测方法综述

专知会员服务

280+阅读 · 2020年8月1日

【西安交大】深度学习目标检测方法综述

专知会员服务

164+阅读 · 2020年4月21日

【目标检测 | 2019最新综述】目标检测的最新进展，附40页PDF，Recent Advances in Deep Learning for Object Detection

【目标检测 | 2019最新综述】目标检测的最新进展，附40页PDF，Recent Advances in Deep Learning for Object Detection

专知会员服务

86+阅读 · 2019年11月15日

【目标检测 | 2019最新综述】基于深度学习的目标检测综述，附30页PDF， A Survey of Deep Learning-based Object Detection（From Fast R-CNN to NAS-FPN）

【目标检测 | 2019最新综述】基于深度学习的目标检测综述，附30页PDF， A Survey of Deep Learning-based Object Detection（From Fast R-CNN to NAS-FPN）

专知会员服务

56+阅读 · 2019年11月15日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

干货 | 基于深度学习的目标检测算法综述：常见问题及解决方案

干货 | 基于深度学习的目标检测算法综述：常见问题及解决方案

AI前线

10+阅读 · 2018年11月2日

如何用机器学习精准辨别“背景”和“目标”

如何用机器学习精准辨别“背景”和“目标”

论智

10+阅读 · 2018年10月22日

干货 | 基于深度学习的目标检测算法综述

干货 | 基于深度学习的目标检测算法综述

AI科技评论

18+阅读 · 2018年9月1日

干货 | 基于深度学习的目标检测算法综述（二）

干货 | 基于深度学习的目标检测算法综述（二）

AI科技评论

21+阅读 · 2018年8月20日

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

七月在线实验室

11+阅读 · 2018年7月18日

【深度学习】增加检测类别？这是一份目标检测的一般指南

【深度学习】增加检测类别？这是一份目标检测的一般指南

产业智能官

13+阅读 · 2018年5月27日

基于深度学习的目标检测算法综述

基于深度学习的目标检测算法综述

AI研习社

15+阅读 · 2018年4月25日

深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

数据挖掘入门与实战

13+阅读 · 2018年4月6日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

基于时空模式的复杂行为识别方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

42+阅读 · 2015年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

主被动视角联合的细粒度行为识别

国家自然科学基金

1+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于集成流形学习的监控视频中人体行为识别研究

国家自然科学基金

3+阅读 · 2014年12月31日

移动终端视频目标快速识别技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

CARL: Focusing Agentic Reinforcement Learning on Critical Actions

Arxiv

0+阅读 · 2月5日

Task Aware Dreamer for Task Generalization in Reinforcement Learning

Arxiv

0+阅读 · 1月23日

AION: Aerial Indoor Object-Goal Navigation Using Dual-Policy Reinforcement Learning

Arxiv

0+阅读 · 1月22日

Continual Knowledge Adaptation for Reinforcement Learning

Arxiv

0+阅读 · 1月20日

Communication Methods in Multi-Agent Reinforcement Learning

Arxiv

0+阅读 · 1月19日

Reinforcement Learning with Multi-Step Lookahead Information Via Adaptive Batching

Arxiv

0+阅读 · 1月15日

Active Evaluation of General Agents: Problem Definition and Comparison of Baseline Algorithms

Arxiv

0+阅读 · 1月12日

Goal Force: Teaching Video Models To Accomplish Physics-Conditioned Goals

Arxiv

0+阅读 · 1月9日

VL-LN Bench: Towards Long-horizon Goal-oriented Navigation with Active Dialogs

Arxiv

0+阅读 · 1月4日

VL-LN Bench: Towards Long-horizon Goal-oriented Navigation with Active Dialogs

Arxiv

0+阅读 · 2025年12月31日

VIP会员

文章信息

相关主题

元强化学习

相关VIP内容

【牛津博士论文】零样本元强化学习中的表示方法询问 ChatGPT

【牛津博士论文】零样本元强化学习中的表示方法询问 ChatGPT

专知会员服务

17+阅读 · 2025年7月28日

【法国里尔大学博士论文】面向目标的强化学习探索，324页pdf

【法国里尔大学博士论文】面向目标的强化学习探索，324页pdf

专知会员服务

27+阅读 · 2023年10月28日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知会员服务

259+阅读 · 2022年8月23日

【多目标多智能体系统决策】196页PDF布鲁塞尔自由大学博士论文，Decision Making in Multi-Objective Multi-Agent Systems——A Utility-Based Perspective

【多目标多智能体系统决策】196页PDF布鲁塞尔自由大学博士论文，Decision Making in Multi-Objective Multi-Agent Systems——A Utility-Based Perspective

专知会员服务

118+阅读 · 2022年3月18日

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

语音识别:不同深度学习方法的综述，Speech Recognition: a review of the different deep learning approaches

专知会员服务

33+阅读 · 2022年3月13日

基于深度学习的通用目标检测研究综述

专知会员服务

93+阅读 · 2021年8月29日

深度学习目标检测方法综述

深度学习目标检测方法综述

专知会员服务

280+阅读 · 2020年8月1日

【西安交大】深度学习目标检测方法综述

专知会员服务

164+阅读 · 2020年4月21日

【目标检测 | 2019最新综述】目标检测的最新进展，附40页PDF，Recent Advances in Deep Learning for Object Detection

【目标检测 | 2019最新综述】目标检测的最新进展，附40页PDF，Recent Advances in Deep Learning for Object Detection

专知会员服务

86+阅读 · 2019年11月15日

【目标检测 | 2019最新综述】基于深度学习的目标检测综述，附30页PDF， A Survey of Deep Learning-based Object Detection（From Fast R-CNN to NAS-FPN）

【目标检测 | 2019最新综述】基于深度学习的目标检测综述，附30页PDF， A Survey of Deep Learning-based Object Detection（From Fast R-CNN to NAS-FPN）

专知会员服务

56+阅读 · 2019年11月15日

热门VIP内容

开通专知VIP会员享更多权益服务

智能体记忆深度剖析：评价指标与系统局限性的分类体系及实证分析

《可信人工智能赋能系统的支柱》

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

人工智能赋能边缘与自主系统：美陆军现代化进程聚焦威胁探测与战术边缘情报

相关资讯

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

干货 | 基于深度学习的目标检测算法综述：常见问题及解决方案

干货 | 基于深度学习的目标检测算法综述：常见问题及解决方案

AI前线

10+阅读 · 2018年11月2日

如何用机器学习精准辨别“背景”和“目标”

如何用机器学习精准辨别“背景”和“目标”

论智

10+阅读 · 2018年10月22日

干货 | 基于深度学习的目标检测算法综述

干货 | 基于深度学习的目标检测算法综述

AI科技评论

18+阅读 · 2018年9月1日

干货 | 基于深度学习的目标检测算法综述（二）

干货 | 基于深度学习的目标检测算法综述（二）

AI科技评论

21+阅读 · 2018年8月20日

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

一文读懂目标检测：R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD

七月在线实验室

11+阅读 · 2018年7月18日

【深度学习】增加检测类别？这是一份目标检测的一般指南

【深度学习】增加检测类别？这是一份目标检测的一般指南

产业智能官

13+阅读 · 2018年5月27日

基于深度学习的目标检测算法综述

基于深度学习的目标检测算法综述

AI研习社

15+阅读 · 2018年4月25日

深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

深度学习的目标检测技术演进：R-CNN、Fast R-CNN、Faster R-CNN

数据挖掘入门与实战

13+阅读 · 2018年4月6日

【强化学习】强化学习+深度学习=人工智能

【强化学习】强化学习+深度学习=人工智能

产业智能官

55+阅读 · 2017年8月11日

相关论文

CARL: Focusing Agentic Reinforcement Learning on Critical Actions

Arxiv

0+阅读 · 2月5日

Task Aware Dreamer for Task Generalization in Reinforcement Learning

Arxiv

0+阅读 · 1月23日

AION: Aerial Indoor Object-Goal Navigation Using Dual-Policy Reinforcement Learning

Arxiv

0+阅读 · 1月22日

Continual Knowledge Adaptation for Reinforcement Learning

Arxiv

0+阅读 · 1月20日

Communication Methods in Multi-Agent Reinforcement Learning

Arxiv

0+阅读 · 1月19日

Reinforcement Learning with Multi-Step Lookahead Information Via Adaptive Batching

Arxiv

0+阅读 · 1月15日

Active Evaluation of General Agents: Problem Definition and Comparison of Baseline Algorithms

Arxiv

0+阅读 · 1月12日

Goal Force: Teaching Video Models To Accomplish Physics-Conditioned Goals

Arxiv

0+阅读 · 1月9日

VL-LN Bench: Towards Long-horizon Goal-oriented Navigation with Active Dialogs

Arxiv

0+阅读 · 1月4日

VL-LN Bench: Towards Long-horizon Goal-oriented Navigation with Active Dialogs

Arxiv

0+阅读 · 2025年12月31日

相关基金

基于时空模式的复杂行为识别方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

42+阅读 · 2015年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

主被动视角联合的细粒度行为识别

国家自然科学基金

1+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基于集成流形学习的监控视频中人体行为识别研究

国家自然科学基金

3+阅读 · 2014年12月31日

移动终端视频目标快速识别技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

开放动态环境下在线机器学习理论与方法

国家自然科学基金

11+阅读 · 2013年12月31日

微信扫码咨询专知VIP会员