In this paper, we develop a stratification-based semantics for Signal Temporal Logic (STL) in which each atomic predicate is interpreted as a membership test in a stratified space. This perspective reveals a novel correspondence principle between stratification theory and STL, showing that most STL formulas can be viewed as inducing a stratification of space-time. The significance of this interpretation is twofold. First, it offers a fresh theoretical framework for analyzing the structure of the embedding space generated by deep reinforcement learning (DRL) and relates it to the geometry of the ambient decision space. Second, it provides a principled framework that both enables the reuse of existing high-dimensional analysis tools and motivates the creation of novel computational techniques. To ground the theory, we (1) illustrate the role of stratification theory in Minigrid games and (2) apply numerical techniques to the latent embeddings of a DRL agent playing such a game where the robustness of STL formulas is used as the reward. In the process, we propose computationally efficient signatures that, based on preliminary evidence, appear promising for uncovering the stratification structure of such embedding spaces.


翻译:本文为信号时序逻辑(Signal Temporal Logic,STL)提出了一种基于层次(stratification-based)的语义框架,其中每个原子谓词被解释为分层空间中的隶属度测试。该视角揭示了一个分层理论与STL之间新颖的对应原理,表明大多数STL公式可视为对时空诱导分层。这一解释具有双重意义:首先,它为分析深度强化学习(DRL)生成嵌入空间的结构提供了全新理论框架,并将其与周围决策空间的几何特性相关联;其次,该框架既支持现有高维分析工具的复用,又激励了新型计算技术的创造。为夯实理论基础,我们(1)在Minigrid游戏中阐释了分层理论的作用,(2)将数值技术应用于玩该游戏的DRD智能体的潜在嵌入(latent embeddings),其中以STL公式的鲁棒性作为奖励。在此过程中,我们提出了基于初步证据显示有希望揭示此类嵌入空间分层结构的计算高效签名(efficient signatures)。

0
下载
关闭预览

相关内容

基于深度学习的时间序列分类研究综述
专知会员服务
83+阅读 · 2024年1月8日
基于深度学习的实时语义分割综述
专知会员服务
32+阅读 · 2023年11月27日
专知会员服务
41+阅读 · 2021年7月5日
【Haute-Alsace博士论文】深度学习时序分类,175页pdf
专知会员服务
103+阅读 · 2020年10月4日
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
层级强化学习概念简介
CreateAMind
21+阅读 · 2019年6月9日
R语言时间序列分析
R语言中文社区
12+阅读 · 2018年11月19日
时序异常检测算法概览
论智
29+阅读 · 2018年8月30日
深度学习文本分类方法综述(代码)
中国人工智能学会
28+阅读 · 2018年6月16日
R语言之数据分析高级方法「时间序列」
R语言中文社区
17+阅读 · 2018年4月24日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
2+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
3+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
3+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关资讯
基于模型的强化学习综述
专知
42+阅读 · 2022年7月13日
层级强化学习概念简介
CreateAMind
21+阅读 · 2019年6月9日
R语言时间序列分析
R语言中文社区
12+阅读 · 2018年11月19日
时序异常检测算法概览
论智
29+阅读 · 2018年8月30日
深度学习文本分类方法综述(代码)
中国人工智能学会
28+阅读 · 2018年6月16日
R语言之数据分析高级方法「时间序列」
R语言中文社区
17+阅读 · 2018年4月24日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员