AegisTS: A Hierarchical Agent System with Reinforcement Learning for Multivariate Time Series Data Cleaning - 专知论文

会员服务 ·

0

分层 · 系统 · 多变量 · 序列 · 多变量时间序列 ·

AegisTS: A Hierarchical Agent System with Reinforcement Learning for Multivariate Time Series Data Cleaning

翻译：AegisTS：一种融合强化学习的分层智能体系统用于多变量时间序列数据清洗

Yuhan Shi,Yuanyuan Yao,Lu Chen,Mourad Khayati,Tianyi Li

Multivariate time series (MTS) are frequently affected by co-occurring quality issues, such as missing values, outliers, and constraint violations, which significantly undermine downstream analytics. Existing cleaning approaches fix only a limited set of such issues, making them ill-suited for scenarios where multiple quality problems arise simultaneously. Furthermore, these methods commonly depend on the availability of ground truth data or domain-specific rules, both of which are rarely accessible in real-world applications. In this paper, we introduce AegisTS, an agent system with reinforcement learning designed to clean multiple data quality issues in MTS. We cast the cleaning process as a joint optimization problem that simultaneously handles quality issue order and cleaning model selection, allowing efficient navigation of the large space of possible cleaning pipelines. Our framework relies on a hierarchical agent architecture, where a high-level agent determines the order in which data quality issues should be processed, while a low-level agent identifies the most suitable cleaning method for each issue. To guide the agent toward an optimal cleaning pipeline, we propose a dual-stage reward mechanism that couples upstream (cleaning) and downstream performance, enabling effective optimization without relying on ground truth. Our experimental results show that AegisTS consistently outperforms existing methods, achieving up to 96% improvement in data cleaning quality and 27% improvement in downstream performance.

翻译：多变量时间序列（MTS）常受缺失值、异常值和约束违反等并发质量问题的影响，严重损害下游分析。现有清洗方法仅能修复此类问题的有限子集，难以应对多种质量问题同时出现的场景。此外，这些方法通常依赖真实标签数据或领域特定规则，而在实际应用中这两种资源均极少可得。本文提出AegisTS——一种基于强化学习的智能体系统，专为清洗MTS中多种数据质量问题设计。我们将清洗过程构建为联合优化问题，同步处理质量问题顺序与清洗模型选择，从而在庞大的清洗管线空间中实现高效导航。该框架采用分层智能体架构：高层智能体决定数据质量问题的处理顺序，低层智能体则为每个问题选取最适配的清洗方法。为引导智能体找到最优清洗管线，我们提出一种双重奖励机制，将上游（清洗）与下游性能耦合，无需依赖真实标签即可实现有效优化。实验结果表明，AegisTS在数据清洗质量上最高提升96%，下游性能提升27%，持续优于现有方法。

0

相关内容

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

专知会员服务

8+阅读 · 5月6日

【ICML2025】因果感知对比学习用于鲁棒的多变量时间序列异常检测

【ICML2025】因果感知对比学习用于鲁棒的多变量时间序列异常检测

专知会员服务

16+阅读 · 2025年6月8日

【KDD2024】CAFO：基于特征的时间序列分类解释

【KDD2024】CAFO：基于特征的时间序列分类解释

专知会员服务

25+阅读 · 2024年6月5日

《多智能体深度强化学习模型中动作序列的解释》AAMAS 2023

《多智能体深度强化学习模型中动作序列的解释》AAMAS 2023

专知会员服务

31+阅读 · 2023年6月18日

深度学习在时间序列异常检测中的应用综述

深度学习在时间序列异常检测中的应用综述

专知会员服务

111+阅读 · 2022年11月11日

索邦大学121页博士论文《时间序列中的无监督异常检测》

索邦大学121页博士论文《时间序列中的无监督异常检测》

专知会员服务

104+阅读 · 2022年7月25日

【Google-BryanLim等】可解释深度学习时序预测

【Google-BryanLim等】可解释深度学习时序预测

专知会员服务

64+阅读 · 2021年12月19日

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

专知会员服务

174+阅读 · 2020年5月1日

【牛津大学】深度学习时间序列预测，Time Series Forecasting With Deep Learning: A Survey

【牛津大学】深度学习时间序列预测，Time Series Forecasting With Deep Learning: A Survey

专知会员服务

142+阅读 · 2020年4月30日

【阿里巴巴-达摩院】深度学习的时间序列数据增强综述，Time Series Data Augmentation for Deep Learning: A Survey

【阿里巴巴-达摩院】深度学习的时间序列数据增强综述，Time Series Data Augmentation for Deep Learning: A Survey

专知会员服务

134+阅读 · 2020年3月2日

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

专知

14+阅读 · 2022年11月12日

莫纳什大学最新「深度学习时间序列异常检测」综述

莫纳什大学最新「深度学习时间序列异常检测」综述

专知

11+阅读 · 2022年11月11日

【ICLR2022】图神经网络复杂时间序列建模以及医疗健康应用

【ICLR2022】图神经网络复杂时间序列建模以及医疗健康应用

专知

11+阅读 · 2022年4月15日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

92+阅读 · 2019年11月20日

基于 Keras 用深度学习预测时间序列

基于 Keras 用深度学习预测时间序列

R语言中文社区

23+阅读 · 2018年7月27日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

教程 | 基于Keras的LSTM多变量时间序列预测

教程 | 基于Keras的LSTM多变量时间序列预测

机器之心

20+阅读 · 2017年10月30日

几类离散与分布型变时滞抛物系统的高精度快速算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

海量机器类终端同步入网性能分析与接入控制

国家自然科学基金

0+阅读 · 2015年12月31日

基于导向随机狼群算法的多元时间序列变量选择研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维时间序列的降维与建模

国家自然科学基金

23+阅读 · 2015年12月31日

基于强化学习的分布参数系统数据驱动控制

国家自然科学基金

7+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

多智能体系统有限时间一致性的自适应控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

时间序列异常值探测的Bayes方法及其在GNSS动态数据处理中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

ProtoX-AD: Self-Explainable Time Series Anomaly Detection and Characterization

Arxiv

0+阅读 · 6月11日

ASTER: Latent Pseudo-Anomaly Generation for Unsupervised Time-Series Anomaly Detection

Arxiv

0+阅读 · 6月11日

AeroMesa: Efficient Data Management System for Multi-Dimensional Spatio-Temporal Trajectories

Arxiv

0+阅读 · 6月8日

ProfiliTable: Profiling-Driven Tabular Data Processing via Agentic Workflows

Arxiv

0+阅读 · 6月4日

Cluster-Aware Causal Mixer for Online Anomaly Detection in Multivariate Time Series

Arxiv

0+阅读 · 6月4日

FAiT: Frequency-Aware Inverted Transformer for Multivariate Time Series Forecasting

Arxiv

0+阅读 · 5月31日

AegisTS: A Hierarchical Agent System with Reinforcement Learning for Multivariate Time Series Data Cleaning

Arxiv

0+阅读 · 5月31日

AgentDropoutV2: Optimizing Information Flow in Multi-Agent Systems via Test-Time Rectify-or-Reject Pruning

Arxiv

0+阅读 · 5月28日

AegisTS: A Hierarchical Agent System with Reinforcement Learning for Multivariate Time Series Data Cleaning

Arxiv

0+阅读 · 5月7日

A Hierarchical Agent System with Reinforcement Learning for Multivariate Time Series Data Cleaning

Arxiv

0+阅读 · 5月6日

VIP会员

文章信息

相关主题

多变量时间序列

最新内容

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

0+阅读 · 11分钟前

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

0+阅读 · 13分钟前

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

0+阅读 · 48分钟前

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

4+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

7+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

“史诗怒火”行动：现代多域作战的重要节点

“史诗怒火”行动：现代多域作战的重要节点

专知会员服务

8+阅读 · 7月30日

《下一代无线网络中的多无人机通信资源管理》

《下一代无线网络中的多无人机通信资源管理》

专知会员服务

8+阅读 · 7月30日

相关VIP内容

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

专知会员服务

8+阅读 · 5月6日

【ICML2025】因果感知对比学习用于鲁棒的多变量时间序列异常检测

【ICML2025】因果感知对比学习用于鲁棒的多变量时间序列异常检测

专知会员服务

16+阅读 · 2025年6月8日

【KDD2024】CAFO：基于特征的时间序列分类解释

【KDD2024】CAFO：基于特征的时间序列分类解释

专知会员服务

25+阅读 · 2024年6月5日

《多智能体深度强化学习模型中动作序列的解释》AAMAS 2023

《多智能体深度强化学习模型中动作序列的解释》AAMAS 2023

专知会员服务

31+阅读 · 2023年6月18日

深度学习在时间序列异常检测中的应用综述

深度学习在时间序列异常检测中的应用综述

专知会员服务

111+阅读 · 2022年11月11日

索邦大学121页博士论文《时间序列中的无监督异常检测》

索邦大学121页博士论文《时间序列中的无监督异常检测》

专知会员服务

104+阅读 · 2022年7月25日

【Google-BryanLim等】可解释深度学习时序预测

【Google-BryanLim等】可解释深度学习时序预测

专知会员服务

64+阅读 · 2021年12月19日

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

【牛津大学】深度学习时间序列预测，12页pdf, Deep Learning Time Series Forecasting

专知会员服务

174+阅读 · 2020年5月1日

【牛津大学】深度学习时间序列预测，Time Series Forecasting With Deep Learning: A Survey

【牛津大学】深度学习时间序列预测，Time Series Forecasting With Deep Learning: A Survey

专知会员服务

142+阅读 · 2020年4月30日

【阿里巴巴-达摩院】深度学习的时间序列数据增强综述，Time Series Data Augmentation for Deep Learning: A Survey

【阿里巴巴-达摩院】深度学习的时间序列数据增强综述，Time Series Data Augmentation for Deep Learning: A Survey

专知会员服务

134+阅读 · 2020年3月2日

热门VIP内容

开通专知VIP会员享更多权益服务

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

《履带式无人地面战车技术发展现状》

相关资讯

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

专知

14+阅读 · 2022年11月12日

莫纳什大学最新「深度学习时间序列异常检测」综述

莫纳什大学最新「深度学习时间序列异常检测」综述

专知

11+阅读 · 2022年11月11日

【ICLR2022】图神经网络复杂时间序列建模以及医疗健康应用

【ICLR2022】图神经网络复杂时间序列建模以及医疗健康应用

专知

11+阅读 · 2022年4月15日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

【干货书】MLOps是什么？MLOps实战：操作机器学习模型，461页pdf

专知

15+阅读 · 2022年2月16日

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

金融时序预测中的深度学习方法综述: 从2005到2019，附63页pdf下载

专知

70+阅读 · 2019年12月4日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

92+阅读 · 2019年11月20日

基于 Keras 用深度学习预测时间序列

基于 Keras 用深度学习预测时间序列

R语言中文社区

23+阅读 · 2018年7月27日

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

教你搭建多变量时间序列预测模型LSTM（附代码、数据集）

数据派THU

59+阅读 · 2017年11月6日

教程 | 基于Keras的LSTM多变量时间序列预测

教程 | 基于Keras的LSTM多变量时间序列预测

机器之心

20+阅读 · 2017年10月30日

相关论文

ProtoX-AD: Self-Explainable Time Series Anomaly Detection and Characterization

Arxiv

0+阅读 · 6月11日

ASTER: Latent Pseudo-Anomaly Generation for Unsupervised Time-Series Anomaly Detection

Arxiv

0+阅读 · 6月11日

AeroMesa: Efficient Data Management System for Multi-Dimensional Spatio-Temporal Trajectories

Arxiv

0+阅读 · 6月8日

ProfiliTable: Profiling-Driven Tabular Data Processing via Agentic Workflows

Arxiv

0+阅读 · 6月4日

Cluster-Aware Causal Mixer for Online Anomaly Detection in Multivariate Time Series

Arxiv

0+阅读 · 6月4日

FAiT: Frequency-Aware Inverted Transformer for Multivariate Time Series Forecasting

Arxiv

0+阅读 · 5月31日

AegisTS: A Hierarchical Agent System with Reinforcement Learning for Multivariate Time Series Data Cleaning

Arxiv

0+阅读 · 5月31日

AgentDropoutV2: Optimizing Information Flow in Multi-Agent Systems via Test-Time Rectify-or-Reject Pruning

Arxiv

0+阅读 · 5月28日

AegisTS: A Hierarchical Agent System with Reinforcement Learning for Multivariate Time Series Data Cleaning

Arxiv

0+阅读 · 5月7日

A Hierarchical Agent System with Reinforcement Learning for Multivariate Time Series Data Cleaning

Arxiv

0+阅读 · 5月6日

相关基金

几类离散与分布型变时滞抛物系统的高精度快速算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

海量机器类终端同步入网性能分析与接入控制

国家自然科学基金

0+阅读 · 2015年12月31日

基于导向随机狼群算法的多元时间序列变量选择研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维时间序列的降维与建模

国家自然科学基金

23+阅读 · 2015年12月31日

基于强化学习的分布参数系统数据驱动控制

国家自然科学基金

7+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

多智能体系统有限时间一致性的自适应控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

时间序列异常值探测的Bayes方法及其在GNSS动态数据处理中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于动态分层与自学习的多智能体自适应协作模型

国家自然科学基金

17+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员