Learned database components, which deeply integrate machine learning into their design, have been extensively studied in recent years. Given the dynamism of databases, where data and workloads continuously drift, it is crucial for learned database components to remain effective and efficient in the face of data and workload drift. Robustness, therefore, is a key factor in assessing their practical applicability. Although recent works examine learned database components under specific drift, they fail to enable systematic performance evaluations across a broad range of drift or under customized drift as needed. This paper presents NeurBench, a new benchmark suite that supports evaluating learned database components under measurable and controllable data and workload drift. We quantify diverse types of drift by introducing a key concept called the drift factor. Building on this formulation, we propose a drift-aware data and workload generation framework that effectively simulates real-world drift while preserving inherent correlations. Experimental results demonstrate the effectiveness of NeurBench in generating realistic data and workload drift, while providing insights into the performance of representative learned database components under different drift scenarios.


翻译:学习型数据库组件,其设计深度融合机器学习技术,近年来得到了广泛研究。鉴于数据库具备动态特性,其中的数据和工作负载持续发生漂移,学习型数据库组件必须能在数据和负载漂移面前保持有效性和高效性。因此,鲁棒性是评估其实际应用可行性的关键因素。尽管近期研究在特定漂移下考察了学习型数据库组件,但未能实现系统性地跨多种漂移类型、或根据需求定制漂移的性能评估。本文提出NeurBench,这是一个新型基准测试套件,支持在可度量、可控的数据和工作负载漂移条件下评估学习型数据库组件。我们通过引入一个核心概念——漂移因子,来量化不同类型的漂移。基于此公式化表达,我们提出了一个具备漂移感知能力的数据与工作负载生成框架,该框架能在有效模拟真实世界漂移的同时,保持数据间固有的关联性。实验结果表明,NeurBench在生成逼真的数据与工作负载漂移方面效果显著,并为不同漂移场景下代表性学习型数据库组件的性能提供了深入洞察。

0
下载
关闭预览

相关内容

数据库( Database )或数据库管理系统( Database management systems )是按照数据结构来组织、存储和管理数据的仓库。目前数据管理不再仅仅是存储和管理数据,而转变成用户所需要的各种数据管理的方式。
智能数据库学习型索引研究综述
专知会员服务
23+阅读 · 2023年1月14日
基于机器学习的数据库技术综述
专知会员服务
55+阅读 · 2021年1月2日
深度学习模型可解释性的研究进展
专知
26+阅读 · 2020年8月1日
孟小峰:机器学习与数据库技术融合
计算机研究与发展
14+阅读 · 2018年9月6日
谷歌推出新型数据增强算法:AutoAugment
论智
20+阅读 · 2018年6月6日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
最新内容
认知战与交战性质的改变:神经战略视角
专知会员服务
5+阅读 · 5月8日
人工智能如何变革军事C5ISR作战
专知会员服务
12+阅读 · 5月8日
相关基金
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员