Root cause analysis for enterprise database incidents is often a manual and time consuming process that requires operators to inspect logs, performance metrics, and workload behavior. Existing approaches commonly focus on a single source of evidence, which limits their ability to capture the broader operational context behind incidents such as CPU saturation, I/O bottlenecks, lock contention, deadlocks, and slow query execution. This paper presents a multimodal machine learning framework for workload-aware root cause analysis in enterprise database environments. The proposed approach combines workload characteristics, system telemetry, and operational signals from compute, storage, and accelerator oriented datasets. Engineered workload aware features are used to classify workload behavior and support downstream diagnosis of likely incident causes. The framework evaluates Random Forest, LightGBM, and feedforward neural network models for workload classification and root cause analysis support. Experimental results show that workload aware feature engineering improves workload separability, with LightGBM providing the strongest balance of predictive performance and interpretability. The results suggest that combining multimodal telemetry with workload context can provide a practical foundation for automated and explainable root cause analysis systems.


翻译:企业数据库事件的根因分析通常是一个耗时且需手动操作的过程,要求运维人员检查日志、性能指标和工作负载行为。现有方法通常仅关注单一证据源,导致其难以捕捉事件背后更广泛的运维上下文,例如CPU饱和、I/O瓶颈、锁竞争、死锁及慢查询执行等。本文提出了一种面向企业数据库环境的工作负载感知根因分析多模态机器学习框架。该方案融合了工作负载特征、系统遥测数据以及来自计算、存储和加速器导向数据集的运维信号。通过设计工作负载感知特征来分类工作负载行为,并支持对事件可能原因的后续诊断。该框架评估了随机森林、LightGBM和前馈神经网络模型在工作负载分类及根因分析支持方面的性能。实验结果表明,工作负载感知特征工程有效提升了工作负载的可分离性,其中LightGBM在预测性能与可解释性之间取得了最佳平衡。结果证实,将多模态遥测数据与工作负载上下文相结合,可为自动化且可解释的根因分析系统提供实用基础。

0
下载
关闭预览

相关内容

【KDD2023】增量式因果图学习用于在线无监督根源分析
专知会员服务
21+阅读 · 2023年5月20日
智能数据库学习型索引研究综述
专知会员服务
23+阅读 · 2023年1月14日
专知会员服务
38+阅读 · 2021年10月19日
基于机器学习的数据库技术综述
专知会员服务
55+阅读 · 2021年1月2日
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
【知识图谱】基于知识图谱的用户画像技术
产业智能官
103+阅读 · 2019年1月9日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
【干货分享】AIOps之根因分析
腾讯大讲堂
11+阅读 · 2018年4月10日
【入门】数据分析六部曲
36大数据
18+阅读 · 2017年12月6日
基于机器学习的KPI自动化异常检测系统
运维帮
13+阅读 · 2017年8月16日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
5+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关VIP内容
【KDD2023】增量式因果图学习用于在线无监督根源分析
专知会员服务
21+阅读 · 2023年5月20日
智能数据库学习型索引研究综述
专知会员服务
23+阅读 · 2023年1月14日
专知会员服务
38+阅读 · 2021年10月19日
基于机器学习的数据库技术综述
专知会员服务
55+阅读 · 2021年1月2日
相关资讯
用深度学习揭示数据的因果关系
专知
28+阅读 · 2019年5月18日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
【知识图谱】基于知识图谱的用户画像技术
产业智能官
103+阅读 · 2019年1月9日
【大数据】海量数据分析能力形成和大数据关键技术
产业智能官
17+阅读 · 2018年10月29日
【干货分享】AIOps之根因分析
腾讯大讲堂
11+阅读 · 2018年4月10日
【入门】数据分析六部曲
36大数据
18+阅读 · 2017年12月6日
基于机器学习的KPI自动化异常检测系统
运维帮
13+阅读 · 2017年8月16日
相关基金
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员