Although an increasing number of databases now embrace shared-storage architectures, current storage-disaggregated systems have yet to strike an optimal balance between cost and performance. In high-concurrency read/write scenarios, B+-tree-based shared storage struggles to efficiently absorb frequent in-place updates. Existing LSM-tree-backed disaggregated storage designs are hindered by the intricate implementation of cross-node shared-log mechanisms, where no satisfactory solution yet exists. This paper presents OceanBase Bacchus, an LSM-tree architecture tailored for object storage provided by cloud vendors. The system sustains high-performance reads and writes while rendering compute nodes stateless through shared service-oriented PALF (Paxos-backed Append-only Log File system) logging and asynchronous background services. We employ a Shared Block Cache Service to flexibly utilize cache resources. Our design places log synchronization into a shared service, providing a novel solution for log sharing in storage-compute-separated databases. The architecture decouples functionality across modules, enabling elastic scaling where compute, cache, and storage resources can be resized rapidly and independently. Through experimental evaluation using multiple benchmark tests, including SysBench and TPC-H, we confirm that OceanBase Bacchus achieves performance comparable to or superior to that of HBase in OLTP scenarios and significantly outperforms StarRocks in OLAP workloads. Leveraging Bacchus's support for multi-cloud deployment and consistent performance, we not only retain high availability and competitive performance but also achieve substantial reductions in storage costs by 59% in OLTP scenarios and 89% in OLAP scenarios.


翻译:尽管越来越多的数据库开始采用共享存储架构,但当前存算分离系统尚未在成本与性能之间达到最优平衡。在高并发读写场景下,基于B+树的共享存储难以有效吸收频繁的原位更新。现有基于LSM树的存算分离存储设计受限于跨节点共享日志机制的复杂实现,目前尚无令人满意的解决方案。本文提出OceanBase Bacchus,一种专为云服务商提供的对象存储设计的LSM树架构。该系统通过共享服务化的PALF(基于Paxos的仅追加日志文件系统)日志记录与异步后台服务,在维持高性能读写的同时实现计算节点的无状态化。我们采用共享块缓存服务以灵活利用缓存资源。本设计将日志同步功能置于共享服务中,为存算分离数据库的日志共享问题提供了创新解决方案。该架构实现了模块间的功能解耦,支持计算、缓存与存储资源能够快速独立弹性伸缩的弹性扩展能力。通过SysBench、TPC-H等多基准测试的实验评估,我们证实OceanBase Bacchus在OLTP场景中达到或超越HBase的性能水平,在OLAP工作负载中显著优于StarRocks。依托Bacchus对多云部署与稳定性能的支持,我们不仅保持了高可用性与有竞争力的性能,更在OLTP场景中实现存储成本降低59%,在OLAP场景中降低89%。

0
下载
关闭预览

相关内容

国家标准《信息技术云计算参考架构》
专知会员服务
37+阅读 · 2024年5月24日
智能数据库学习型索引研究综述
专知会员服务
23+阅读 · 2023年1月14日
华为发布业界首个《云原生数据库白皮书》,25页pdf
专知会员服务
51+阅读 · 2022年8月20日
《分布式云发展白皮书》重磅发布(附下载),47页pdf
专知会员服务
90+阅读 · 2022年6月25日
分布式系统稳定性建设指南2022年(100页pdf)
专知会员服务
26+阅读 · 2022年6月24日
阿里云发布《中国云原生数据湖应用洞察白皮书》
专知会员服务
43+阅读 · 2022年4月15日
面向端边云协同架构的区块链技术综述
专知会员服务
49+阅读 · 2021年12月24日
专知会员服务
18+阅读 · 2020年11月8日
分布式核心技术知识图谱,带走不谢
架构师之路
12+阅读 · 2019年9月23日
工行基于MySQL构建分布式架构的转型之路
炼数成金订阅号
15+阅读 · 2019年5月16日
使用 Canal 实现数据异构
性能与架构
20+阅读 · 2019年3月4日
干货 | 双11总峰值超8亿OPS 阿里分布式NoSQL如何岿然不动稳如山?
阿里巴巴数据库技术
10+阅读 · 2018年12月12日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
VIP会员
最新内容
超越网格:作战环境对炮兵的影响
专知会员服务
2+阅读 · 5月31日
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
6+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
7+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
19+阅读 · 5月30日
基于声学的无人机检测技术综述
专知会员服务
11+阅读 · 5月30日
《当代混合战争分析框架:俄乌战争经验教训》
专知会员服务
10+阅读 · 5月30日
相关VIP内容
国家标准《信息技术云计算参考架构》
专知会员服务
37+阅读 · 2024年5月24日
智能数据库学习型索引研究综述
专知会员服务
23+阅读 · 2023年1月14日
华为发布业界首个《云原生数据库白皮书》,25页pdf
专知会员服务
51+阅读 · 2022年8月20日
《分布式云发展白皮书》重磅发布(附下载),47页pdf
专知会员服务
90+阅读 · 2022年6月25日
分布式系统稳定性建设指南2022年(100页pdf)
专知会员服务
26+阅读 · 2022年6月24日
阿里云发布《中国云原生数据湖应用洞察白皮书》
专知会员服务
43+阅读 · 2022年4月15日
面向端边云协同架构的区块链技术综述
专知会员服务
49+阅读 · 2021年12月24日
专知会员服务
18+阅读 · 2020年11月8日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员