Understanding Human Actions through the Lens of Executable Models - 专知论文

会员服务 ·

0

Understanding Human Actions through the Lens of Executable Models

翻译：理解人类行为：基于可执行模型的视角

Rimvydas Rubavicius,Manisha Dubey,N. Siddharth,Subramanian Ramamoorthy

from arxiv, 16 pages, 3 figures, 2 tables

Human-centred systems require an understanding of human actions in the physical world. Temporally extended sequences of actions are intentional and structured, yet existing methods for recognising what actions are performed often do not attempt to capture their structure, particularly how the actions are executed. This, however, is crucial for assessing the quality of the action's execution and its differences from other actions. To capture the internal mechanics of actions, we introduce a domain-specific language EXACT that represents human motions as underspecified motion programs, interpreted as reward-generating functions for zero-shot policy inference using forward-backwards representations. By leveraging the compositional nature of EXACT motion programs, we combine individual policies into an executable neuro-symbolic model that uses program structure for compositional modelling. We evaluate the utility of the proposed pipeline for creating executable action models by analysing motion-capture data to understand human actions, for the tasks of human action segmentation and action anomaly detection. Our results show that the use of executable action models improves data efficiency and captures intuitive relationships between actions compared with monolithic, task-specific approaches.

翻译：以人为中心的系统需要理解物理世界中的人类行为。在时间上延展的动作序列具有意图性和结构性，然而现有识别行为类型的方法通常未能捕捉其结构，特别是动作的执行方式。然而，这对评估动作执行质量及其与其他动作的差异至关重要。为捕捉动作的内部机制，我们引入领域特定语言EXACT，将人体运动表示为未完全指定的运动程序，并解释为利用前向-后向表征进行零样本策略推理的奖励生成函数。通过利用EXACT运动程序的组合特性，我们将个体策略整合为可执行的神经符号模型，该模型利用程序结构进行组合建模。我们通过分析动作捕捉数据理解人类行为，评估所提流水线在人类动作分割与动作异常检测任务中创建可执行动作模型的实用性。结果表明，与单一任务特定方法相比，可执行动作模型的使用提升了数据效率，并捕捉到动作间更直观的关系。

0

相关内容

综述 | 机器人操作世界模型：预测、行动接口与学习生命周期

综述 | 机器人操作世界模型：预测、行动接口与学习生命周期

专知会员服务

10+阅读 · 6月3日

【阿姆斯特丹博士论文】语言模型与人类理解与行为的对齐

【阿姆斯特丹博士论文】语言模型与人类理解与行为的对齐

专知会员服务

18+阅读 · 2025年7月19日

【斯坦福博士论文】构建类人化具身智能体：从人类行为中学习

【斯坦福博士论文】构建类人化具身智能体：从人类行为中学习

专知会员服务

27+阅读 · 2025年3月20日

以人为中心的基础模型：感知、生成与代理建模

以人为中心的基础模型：感知、生成与代理建模

专知会员服务

24+阅读 · 2025年2月13日

《以人为中心的大型语言模型（LLM）研究综述》

《以人为中心的大型语言模型（LLM）研究综述》

专知会员服务

41+阅读 · 2024年11月25日

【斯坦福博士论文】生成模型的视觉与行为

【斯坦福博士论文】生成模型的视觉与行为

专知会员服务

33+阅读 · 2024年7月11日

【牛津大学博士论文】面向对象的生成模型在机器人感知与行动中的应用，148页pdf

【牛津大学博士论文】面向对象的生成模型在机器人感知与行动中的应用，148页pdf

专知会员服务

22+阅读 · 2024年2月13日

多模态数据的行为识别综述

多模态数据的行为识别综述

专知会员服务

88+阅读 · 2022年11月30日

TPAMI 2022 | 最新综述：基于不同数据模态的行为识别

TPAMI 2022 | 最新综述：基于不同数据模态的行为识别

专知会员服务

53+阅读 · 2022年7月2日

《自然》：机器视觉行为理解与脑神经有内在关联？上交卢策吾团队构建映射模型

《自然》：机器视觉行为理解与脑神经有内在关联？上交卢策吾团队构建映射模型

专知会员服务

18+阅读 · 2022年4月17日

推荐！《可解释人工智能及其军事意义》【译文】印智库ORF2022最新报告

推荐！《可解释人工智能及其军事意义》【译文】印智库ORF2022最新报告

专知

40+阅读 · 2022年11月4日

最新《可解释人工智能》概述，50页ppt

最新《可解释人工智能》概述，50页ppt

专知

12+阅读 · 2021年3月17日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

知识图谱在可解释人工智能中的作用，附81页ppt

知识图谱在可解释人工智能中的作用，附81页ppt

专知

89+阅读 · 2019年11月11日

论具身学习及其设计：基于具身认知的视角

论具身学习及其设计：基于具身认知的视角

MOOC

15+阅读 · 2019年2月18日

【紫冬声音】基于人体骨架的行为识别

【紫冬声音】基于人体骨架的行为识别

中国自动化学会

17+阅读 · 2019年1月30日

基于人体骨架的行为识别【附PPT与视频资料】

基于人体骨架的行为识别【附PPT与视频资料】

人工智能前沿讲习班

31+阅读 · 2019年1月15日

干货｜基于双流递归神经网络的人体骨架行为识别！

干货｜基于双流递归神经网络的人体骨架行为识别！

全球人工智能

13+阅读 · 2017年12月15日

报名 | 让机器读懂你的意图——人体姿态估计入门

报名 | 让机器读懂你的意图——人体姿态估计入门

人工智能头条

10+阅读 · 2017年9月19日

【ICCV 2017论文笔记】我们应当如何理解视频中的人类行为？

【ICCV 2017论文笔记】我们应当如何理解视频中的人类行为？

极市平台

14+阅读 · 2017年9月15日

基于时空模式的复杂行为识别方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

主被动视角联合的细粒度行为识别

国家自然科学基金

1+阅读 · 2015年12月31日

人体行为识别的时空耦合随机图模型及其高效推理算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

通用时序逻辑表达下的视频时空行为理解研究与应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于多通道深度卷积神经网络的人体行为分析研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于集成流形学习的监控视频中人体行为识别研究

国家自然科学基金

3+阅读 · 2014年12月31日

行为轨迹数据高性能时空聚类及社会分析

国家自然科学基金

2+阅读 · 2014年12月31日

High-Speed Vision Improves Zero-Shot Semantic Understanding of Human Actions

Arxiv

0+阅读 · 5月1日

Action Motifs: Self-Supervised Hierarchical Representation of Human Body Movements

Arxiv

0+阅读 · 4月30日

Machine Behavior in Relational Moral Dilemmas: Moral Rightness, Predicted Human Behavior, and Model Decisions

Arxiv

0+阅读 · 4月23日

Robots that learn to evaluate models of collective behavior

Arxiv

0+阅读 · 4月8日

A Model of Understanding in Deep Learning Systems

Arxiv

0+阅读 · 4月5日

BehaviorVLM: Unified Finetuning-Free Behavioral Understanding with Vision-Language Reasoning

Arxiv

0+阅读 · 3月12日

Towards Modeling Cybersecurity Behavior of Humans in Organizations

Arxiv

0+阅读 · 3月9日

Behavior-Aware Anthropometric Scene Generation for Human-Usable 3D Layouts

Arxiv

0+阅读 · 3月3日

Understanding the Effects of AI-Assisted Critical Thinking on Human-AI Decision Making

Arxiv

0+阅读 · 3月2日

From Perception to Action: An Interactive Benchmark for Vision Reasoning

Arxiv

0+阅读 · 2月24日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

2+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

4+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

7+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

4+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

7+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

5+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

3+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

8+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

6+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

9+阅读 · 6月22日

相关VIP内容

综述 | 机器人操作世界模型：预测、行动接口与学习生命周期

综述 | 机器人操作世界模型：预测、行动接口与学习生命周期

专知会员服务

10+阅读 · 6月3日

【阿姆斯特丹博士论文】语言模型与人类理解与行为的对齐

【阿姆斯特丹博士论文】语言模型与人类理解与行为的对齐

专知会员服务

18+阅读 · 2025年7月19日

【斯坦福博士论文】构建类人化具身智能体：从人类行为中学习

【斯坦福博士论文】构建类人化具身智能体：从人类行为中学习

专知会员服务

27+阅读 · 2025年3月20日

以人为中心的基础模型：感知、生成与代理建模

以人为中心的基础模型：感知、生成与代理建模

专知会员服务

24+阅读 · 2025年2月13日

《以人为中心的大型语言模型（LLM）研究综述》

《以人为中心的大型语言模型（LLM）研究综述》

专知会员服务

41+阅读 · 2024年11月25日

【斯坦福博士论文】生成模型的视觉与行为

【斯坦福博士论文】生成模型的视觉与行为

专知会员服务

33+阅读 · 2024年7月11日

【牛津大学博士论文】面向对象的生成模型在机器人感知与行动中的应用，148页pdf

【牛津大学博士论文】面向对象的生成模型在机器人感知与行动中的应用，148页pdf

专知会员服务

22+阅读 · 2024年2月13日

多模态数据的行为识别综述

多模态数据的行为识别综述

专知会员服务

88+阅读 · 2022年11月30日

TPAMI 2022 | 最新综述：基于不同数据模态的行为识别

TPAMI 2022 | 最新综述：基于不同数据模态的行为识别

专知会员服务

53+阅读 · 2022年7月2日

《自然》：机器视觉行为理解与脑神经有内在关联？上交卢策吾团队构建映射模型

《自然》：机器视觉行为理解与脑神经有内在关联？上交卢策吾团队构建映射模型

专知会员服务

18+阅读 · 2022年4月17日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

推荐！《可解释人工智能及其军事意义》【译文】印智库ORF2022最新报告

推荐！《可解释人工智能及其军事意义》【译文】印智库ORF2022最新报告

专知

40+阅读 · 2022年11月4日

最新《可解释人工智能》概述，50页ppt

最新《可解释人工智能》概述，50页ppt

专知

12+阅读 · 2021年3月17日

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

集大成者！可解释人工智能(XAI)研究最新进展万字综述论文: 概念体系机遇和挑战—构建负责任的人工智能

专知

38+阅读 · 2019年12月27日

知识图谱在可解释人工智能中的作用，附81页ppt

知识图谱在可解释人工智能中的作用，附81页ppt

专知

89+阅读 · 2019年11月11日

论具身学习及其设计：基于具身认知的视角

论具身学习及其设计：基于具身认知的视角

MOOC

15+阅读 · 2019年2月18日

【紫冬声音】基于人体骨架的行为识别

【紫冬声音】基于人体骨架的行为识别

中国自动化学会

17+阅读 · 2019年1月30日

基于人体骨架的行为识别【附PPT与视频资料】

基于人体骨架的行为识别【附PPT与视频资料】

人工智能前沿讲习班

31+阅读 · 2019年1月15日

干货｜基于双流递归神经网络的人体骨架行为识别！

干货｜基于双流递归神经网络的人体骨架行为识别！

全球人工智能

13+阅读 · 2017年12月15日

报名 | 让机器读懂你的意图——人体姿态估计入门

报名 | 让机器读懂你的意图——人体姿态估计入门

人工智能头条

10+阅读 · 2017年9月19日

【ICCV 2017论文笔记】我们应当如何理解视频中的人类行为？

【ICCV 2017论文笔记】我们应当如何理解视频中的人类行为？

极市平台

14+阅读 · 2017年9月15日

相关论文

High-Speed Vision Improves Zero-Shot Semantic Understanding of Human Actions

Arxiv

0+阅读 · 5月1日

Action Motifs: Self-Supervised Hierarchical Representation of Human Body Movements

Arxiv

0+阅读 · 4月30日

Machine Behavior in Relational Moral Dilemmas: Moral Rightness, Predicted Human Behavior, and Model Decisions

Arxiv

0+阅读 · 4月23日

Robots that learn to evaluate models of collective behavior

Arxiv

0+阅读 · 4月8日

A Model of Understanding in Deep Learning Systems

Arxiv

0+阅读 · 4月5日

BehaviorVLM: Unified Finetuning-Free Behavioral Understanding with Vision-Language Reasoning

Arxiv

0+阅读 · 3月12日

Towards Modeling Cybersecurity Behavior of Humans in Organizations

Arxiv

0+阅读 · 3月9日

Behavior-Aware Anthropometric Scene Generation for Human-Usable 3D Layouts

Arxiv

0+阅读 · 3月3日

Understanding the Effects of AI-Assisted Critical Thinking on Human-AI Decision Making

Arxiv

0+阅读 · 3月2日

From Perception to Action: An Interactive Benchmark for Vision Reasoning

Arxiv

0+阅读 · 2月24日

相关基金

基于时空模式的复杂行为识别方法研究

国家自然科学基金

2+阅读 · 2017年12月31日

基于深度学习的复杂场景下人体行为识别研究

国家自然科学基金

9+阅读 · 2015年12月31日

基于人机交互的数据驱动式人群行为建模与仿真研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于深层特征学习的RGB-D人体行为识别方法

国家自然科学基金

4+阅读 · 2015年12月31日

主被动视角联合的细粒度行为识别

国家自然科学基金

1+阅读 · 2015年12月31日

人体行为识别的时空耦合随机图模型及其高效推理算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

通用时序逻辑表达下的视频时空行为理解研究与应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于多通道深度卷积神经网络的人体行为分析研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于集成流形学习的监控视频中人体行为识别研究

国家自然科学基金

3+阅读 · 2014年12月31日

行为轨迹数据高性能时空聚类及社会分析

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员