A Hierarchical Agent System with Reinforcement Learning for Multivariate Time Series Data Cleaning - 专知论文

会员服务 ·

0

多元时间序列 · 序列 · 时间序列 · 分层 · 系统 ·

A Hierarchical Agent System with Reinforcement Learning for Multivariate Time Series Data Cleaning

翻译：基于强化学习的分层智能体系统用于多元时间序列数据清洗

Yuhan Shi,Yuanyuan Yao,Lu Chen,Mourad Khayati,Tianyi Li

Multivariate time series (MTS) are frequently affected by co-occurring quality issues, such as missing values, outliers, and constraint violations, which significantly undermine downstream analytics. Existing cleaning approaches fix only a limited set of such issues, making them ill-suited for scenarios where multiple quality problems arise simultaneously. Furthermore, these methods commonly depend on the availability of ground truth data or domain-specific rules, both of which are rarely accessible in real-world applications. In this paper, we introduce \sys, an agent system with reinforcement learning designed to clean multiple data quality issues in MTS. We cast the cleaning process as a joint optimization problem that simultaneously handles quality issue order and cleaning model selection, allowing efficient navigation of the large space of possible cleaning pipelines. Our framework relies on a hierarchical agent architecture, where a high-level agent determines the order in which data quality issues should be processed, while a low-level agent identifies the most suitable cleaning method for each issue. To guide the agent toward an optimal cleaning pipeline, we propose a dual-stage reward mechanism that couples upstream (cleaning) and downstream performance, enabling effective optimization without relying on ground truth. Our experimental results show that \sys consistently outperforms existing methods, achieving up to 96\% improvement in data cleaning quality and 27\% improvement in downstream performance.

翻译：多元时间序列常受缺失值、异常值和约束违规等并发质量问题的影响，这些缺陷显著损害下游分析性能。现有清洗方法仅能修复有限类型的问题，难以应对多种质量问题同时出现的场景。此外，这些方法通常依赖真实标注数据或领域特定规则，而在实际应用中两者均难以获取。本文提出\sys——一种基于强化学习的智能体系统，旨在解决多元时间序列中的多重数据质量问题。我们将清洗过程建模为联合优化问题，同步处理质量问题处理顺序与清洗模型选择，从而高效遍历可能的清洗流水线组合空间。框架采用分层智能体架构：高层智能体决定数据质量问题的处理顺序，底层智能体为每个问题选择最适清洗方法。为引导智能体生成最优清洗流水线，我们提出双阶段奖励机制，耦合上游（清洗）与下游性能指标，无需依赖真实标注即可实现有效优化。实验结果表明，\sys一致性地超越现有方法，在数据清洗质量上最高提升96%，下游性能提升27%。

0

相关内容

多元时间序列

多元时间序列

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

专知会员服务

8+阅读 · 5月6日

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

专知会员服务

24+阅读 · 2025年1月15日

基于深度学习的时间序列分类研究综述

基于深度学习的时间序列分类研究综述

专知会员服务

84+阅读 · 2024年1月8日

《多智能体深度强化学习模型中动作序列的解释》AAMAS 2023

《多智能体深度强化学习模型中动作序列的解释》AAMAS 2023

专知会员服务

31+阅读 · 2023年6月18日

深度学习在时间序列异常检测中的应用综述

深度学习在时间序列异常检测中的应用综述

专知会员服务

111+阅读 · 2022年11月11日

《时间序列的机器学习：学习任务的分类，统一框架的开发，以及算法基准测试比较》博士论文277页，伦敦大学学院

《时间序列的机器学习：学习任务的分类，统一框架的开发，以及算法基准测试比较》博士论文277页，伦敦大学学院

专知会员服务

86+阅读 · 2022年8月4日

索邦大学121页博士论文《时间序列中的无监督异常检测》

索邦大学121页博士论文《时间序列中的无监督异常检测》

专知会员服务

104+阅读 · 2022年7月25日

【干货书】基于统计和机器学习的实用时间序列分析预测，Practical Time Series Analysis Prediction with Statistics & Machine Learning

【干货书】基于统计和机器学习的实用时间序列分析预测，Practical Time Series Analysis Prediction with Statistics & Machine Learning

专知会员服务

144+阅读 · 2022年4月8日

【牛津大学】深度学习时间序列预测，Time Series Forecasting With Deep Learning: A Survey

【牛津大学】深度学习时间序列预测，Time Series Forecasting With Deep Learning: A Survey

专知会员服务

142+阅读 · 2020年4月30日

【阿里巴巴-达摩院】深度学习的时间序列数据增强综述，Time Series Data Augmentation for Deep Learning: A Survey

【阿里巴巴-达摩院】深度学习的时间序列数据增强综述，Time Series Data Augmentation for Deep Learning: A Survey

专知会员服务

134+阅读 · 2020年3月2日

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

专知

14+阅读 · 2022年11月12日

莫纳什大学最新「深度学习时间序列异常检测」综述

莫纳什大学最新「深度学习时间序列异常检测」综述

专知

11+阅读 · 2022年11月11日

【ICLR2022】图神经网络复杂时间序列建模以及医疗健康应用

【ICLR2022】图神经网络复杂时间序列建模以及医疗健康应用

专知

11+阅读 · 2022年4月15日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

92+阅读 · 2019年11月20日

基于深度学习的序列推荐系统：概念，算法与评估

基于深度学习的序列推荐系统：概念，算法与评估

专知

24+阅读 · 2019年6月6日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

基于 Keras 用深度学习预测时间序列

基于 Keras 用深度学习预测时间序列

R语言中文社区

23+阅读 · 2018年7月27日

R语言之数据分析高级方法「时间序列」

R语言之数据分析高级方法「时间序列」

R语言中文社区

17+阅读 · 2018年4月24日

基于导向随机狼群算法的多元时间序列变量选择研究

国家自然科学基金

3+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维时间序列的降维与建模

国家自然科学基金

23+阅读 · 2015年12月31日

备份系统中基于语义挖掘的多层次冗余消除关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于强化学习的分布参数系统数据驱动控制

国家自然科学基金

7+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

多智能体系统有限时间一致性的自适应控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

时间序列数据挖掘中的聚类模型与算法研究

国家自然科学基金

14+阅读 · 2008年12月31日

Hierarchical ODE: Learning Continuous-Time Physical Prototypes for Early Link Failure Detection

Arxiv

0+阅读 · 6月12日

From Verdict to Process: Agentic Reinforcement Learning for Multi-Stage Fact Verification

Arxiv

0+阅读 · 6月11日

Cluster-Aware Causal Mixer for Online Anomaly Detection in Multivariate Time Series

Arxiv

0+阅读 · 6月4日

Multi-Agent Temporal Logic Planning via Penalty Functions and Block-Coordinate Optimization

Arxiv

0+阅读 · 6月3日

AegisTS: A Hierarchical Agent System with Reinforcement Learning for Multivariate Time Series Data Cleaning

Arxiv

0+阅读 · 6月2日

AegisTS: A Hierarchical Agent System with Reinforcement Learning for Multivariate Time Series Data Cleaning

Arxiv

0+阅读 · 5月31日

An Agent-Centric Dynamical Systems Perspective on Multi-Agent Reinforcement Learning

Arxiv

0+阅读 · 5月28日

Offline Multi-agent Reinforcement Learning via Sequential Score Decomposition

Arxiv

0+阅读 · 5月28日

Meta-Modal Agent: Sequential Evidence Routing for Missing-Modality Candidate Reranking

Arxiv

0+阅读 · 5月24日

AegisTS: A Hierarchical Agent System with Reinforcement Learning for Multivariate Time Series Data Cleaning

Arxiv

0+阅读 · 5月7日

VIP会员

文章信息

相关主题

多元时间序列

最新内容

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

4+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

7+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

“史诗怒火”行动：现代多域作战的重要节点

“史诗怒火”行动：现代多域作战的重要节点

专知会员服务

8+阅读 · 7月30日

《下一代无线网络中的多无人机通信资源管理》

《下一代无线网络中的多无人机通信资源管理》

专知会员服务

8+阅读 · 7月30日

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

《高分辨率模拟下的聚合战斗建模：以“会战交锋”场景为例》

专知会员服务

9+阅读 · 7月30日

《人机协同在安全关键型操作决策中的应用》120页

《人机协同在安全关键型操作决策中的应用》120页

专知会员服务

8+阅读 · 7月30日

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

网络防御与空中力量网络防护：21世纪空中力量历史与理论的启示

专知会员服务

6+阅读 · 7月30日

相关VIP内容

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

【ICML spotlight 2026】HELIX：通过可学习特征身份嵌入实现时间序列插补的混合编码框架

专知会员服务

8+阅读 · 5月6日

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

【HKU博士论文】深度学习方法在时间序列正常性建模与生成预测中的应用

专知会员服务

24+阅读 · 2025年1月15日

基于深度学习的时间序列分类研究综述

基于深度学习的时间序列分类研究综述

专知会员服务

84+阅读 · 2024年1月8日

《多智能体深度强化学习模型中动作序列的解释》AAMAS 2023

《多智能体深度强化学习模型中动作序列的解释》AAMAS 2023

专知会员服务

31+阅读 · 2023年6月18日

深度学习在时间序列异常检测中的应用综述

深度学习在时间序列异常检测中的应用综述

专知会员服务

111+阅读 · 2022年11月11日

《时间序列的机器学习：学习任务的分类，统一框架的开发，以及算法基准测试比较》博士论文277页，伦敦大学学院

《时间序列的机器学习：学习任务的分类，统一框架的开发，以及算法基准测试比较》博士论文277页，伦敦大学学院

专知会员服务

86+阅读 · 2022年8月4日

索邦大学121页博士论文《时间序列中的无监督异常检测》

索邦大学121页博士论文《时间序列中的无监督异常检测》

专知会员服务

104+阅读 · 2022年7月25日

【干货书】基于统计和机器学习的实用时间序列分析预测，Practical Time Series Analysis Prediction with Statistics & Machine Learning

【干货书】基于统计和机器学习的实用时间序列分析预测，Practical Time Series Analysis Prediction with Statistics & Machine Learning

专知会员服务

144+阅读 · 2022年4月8日

【牛津大学】深度学习时间序列预测，Time Series Forecasting With Deep Learning: A Survey

【牛津大学】深度学习时间序列预测，Time Series Forecasting With Deep Learning: A Survey

专知会员服务

142+阅读 · 2020年4月30日

【阿里巴巴-达摩院】深度学习的时间序列数据增强综述，Time Series Data Augmentation for Deep Learning: A Survey

【阿里巴巴-达摩院】深度学习的时间序列数据增强综述，Time Series Data Augmentation for Deep Learning: A Survey

专知会员服务

134+阅读 · 2020年3月2日

热门VIP内容

开通专知VIP会员享更多权益服务

隐身技术前沿综述：物理机理、工程实践与战略展望

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

相关资讯

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

【2022新书】机器学习在金融时间序列分析与预测中的应用，385页pdf

专知

14+阅读 · 2022年11月12日

莫纳什大学最新「深度学习时间序列异常检测」综述

莫纳什大学最新「深度学习时间序列异常检测」综述

专知

11+阅读 · 2022年11月11日

【ICLR2022】图神经网络复杂时间序列建模以及医疗健康应用

【ICLR2022】图神经网络复杂时间序列建模以及医疗健康应用

专知

11+阅读 · 2022年4月15日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

开源新书《时间序列分析，数据/方法/应用》，6章110页pdf带你了解最新进展，附下载

专知

92+阅读 · 2019年11月20日

基于深度学习的序列推荐系统：概念，算法与评估

基于深度学习的序列推荐系统：概念，算法与评估

专知

24+阅读 · 2019年6月6日

用深度学习揭示数据的因果关系

用深度学习揭示数据的因果关系

专知

28+阅读 · 2019年5月18日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

基于 Keras 用深度学习预测时间序列

基于 Keras 用深度学习预测时间序列

R语言中文社区

23+阅读 · 2018年7月27日

R语言之数据分析高级方法「时间序列」

R语言之数据分析高级方法「时间序列」

R语言中文社区

17+阅读 · 2018年4月24日

相关论文

Hierarchical ODE: Learning Continuous-Time Physical Prototypes for Early Link Failure Detection

Arxiv

0+阅读 · 6月12日

From Verdict to Process: Agentic Reinforcement Learning for Multi-Stage Fact Verification

Arxiv

0+阅读 · 6月11日

Cluster-Aware Causal Mixer for Online Anomaly Detection in Multivariate Time Series

Arxiv

0+阅读 · 6月4日

Multi-Agent Temporal Logic Planning via Penalty Functions and Block-Coordinate Optimization

Arxiv

0+阅读 · 6月3日

AegisTS: A Hierarchical Agent System with Reinforcement Learning for Multivariate Time Series Data Cleaning

Arxiv

0+阅读 · 6月2日

AegisTS: A Hierarchical Agent System with Reinforcement Learning for Multivariate Time Series Data Cleaning

Arxiv

0+阅读 · 5月31日

An Agent-Centric Dynamical Systems Perspective on Multi-Agent Reinforcement Learning

Arxiv

0+阅读 · 5月28日

Offline Multi-agent Reinforcement Learning via Sequential Score Decomposition

Arxiv

0+阅读 · 5月28日

Meta-Modal Agent: Sequential Evidence Routing for Missing-Modality Candidate Reranking

Arxiv

0+阅读 · 5月24日

AegisTS: A Hierarchical Agent System with Reinforcement Learning for Multivariate Time Series Data Cleaning

Arxiv

0+阅读 · 5月7日

相关基金

基于导向随机狼群算法的多元时间序列变量选择研究

国家自然科学基金

3+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向安全关键系统的时间可预测多核代码生成方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

高维时间序列的降维与建模

国家自然科学基金

23+阅读 · 2015年12月31日

备份系统中基于语义挖掘的多层次冗余消除关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于强化学习的分布参数系统数据驱动控制

国家自然科学基金

7+阅读 · 2015年12月31日

面向大规模多步学习问题的学习分类元系统技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

多智能体系统有限时间一致性的自适应控制研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多智能体强化学习的多机器人系统研究

国家自然科学基金

50+阅读 · 2009年12月31日

时间序列数据挖掘中的聚类模型与算法研究

国家自然科学基金

14+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员