Linux is the foundation of the digital age, accounting for the majority of the cloud and mobile OS markets. Any device that runs Linux uses the Linux page cache, a central pillar in OS and application performance, serving to reduce extraneous disk access. Many page cache eviction policies have been developed but remain bound by the rigidity of heuristics. The rise of AI-driven tools in recent years, melded with the ever-increasing variety of workloads for Linux devices, sets the stage for machine-learning-driven cache eviction policies. Promising research has been done in this field, but only in the field of user-space applications such as CDNs. We develop LearnedCache, an eBPF-integrated single-layer perceptron-based cache eviction policy for the Linux page cache, trained on real kernel data from diverse workloads. We demonstrate median AUCs of nearly 80% over multiple linear models modeling page reuse time, then take a step further by embedding these models inside the Linux kernel for real-time performance evaluation. Through statistical testing over 50 paired trials against a baseline of FIFO for each workload, LearnedCache reveals that machine-learning-derived cache eviction policies are practical in the Linux kernel under representative empirical workloads and are able to surpass conventional FIFO by statistically significant margins of up to 10% in insertion rate, a frequency-adjusted derivation of cache hit rate, in specific workloads while incurring minimal overhead.


翻译:Linux是数字时代的基石,占据了云和移动操作系统市场的主要份额。任何运行Linux的设备都使用Linux页面缓存,这是操作系统和应用程序性能的核心支柱,旨在减少不必要的磁盘访问。虽然已开发出许多页面缓存驱逐策略,但它们仍受限于启发式方法的僵化性。近年来人工智能驱动工具的兴起,以及Linux设备工作负载多样性的持续增加,为机器学习驱动的缓存驱逐策略奠定了基础。该领域虽已有前景可观的研究,但仅限于CDN等用户空间应用。我们开发了LearnedCache——一种基于eBPF集成的单层感知器的Linux页面缓存驱逐策略,使用来自多样化工作负载的真实内核数据进行训练。我们证明了在多个建模页面重用时间的线性模型上,中位AUC接近80%,并进一步将这些模型嵌入Linux内核以实现实时性能评估。通过在每个工作负载上基于FIFO基线进行的50组配对试验的统计测试,LearnedCache表明在代表性经验工作负载下,机器学习派生的缓存驱逐策略在Linux内核中具有实用性,能够在特定工作负载中以统计显著的优势(插入率提升高达10%,这是缓存命中率的频率调整衍生指标)超越传统FIFO,同时仅引入极小的开销。

0
下载
关闭预览

相关内容

Linux 是一系列类 Unix 计算机操作系统的统称。该操作系统的核心为 Linux 内核。Linux 操作系统也是软件和开放源代码发展中最著名的例子之一。
AIGC数据存储技术研究报告
专知会员服务
30+阅读 · 2025年1月21日
【硬核书】Linux核心编程|Linux Kernel Programming,741页pdf
专知会员服务
80+阅读 · 2021年3月26日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
82+阅读 · 2020年7月26日
分布式核心技术知识图谱,带走不谢
架构师之路
12+阅读 · 2019年9月23日
OpenCV4系统化学习路线图与教程
计算机视觉战队
18+阅读 · 2019年3月29日
OpenCV 4 系统化学习路线图与教程
计算机视觉life
21+阅读 · 2019年3月24日
被动DNS,一个被忽视的安全利器
运维帮
11+阅读 · 2019年3月8日
【边缘智能】边缘计算驱动的深度学习加速技术
产业智能官
20+阅读 · 2019年2月8日
如何设计基于深度学习的图像压缩算法
论智
41+阅读 · 2018年4月26日
并行算法演进,从MapReduce到MPI
凡人机器学习
10+阅读 · 2017年11月5日
今日头条推荐系统架构演进之路
QCon
32+阅读 · 2017年6月21日
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
VIP会员
最新内容
学习数据的几何:形状空间分析数学综述
专知会员服务
6+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
7+阅读 · 6月17日
从燃煤战舰到算法战争:水面指挥的永恒要求
专知会员服务
4+阅读 · 6月17日
相关资讯
分布式核心技术知识图谱,带走不谢
架构师之路
12+阅读 · 2019年9月23日
OpenCV4系统化学习路线图与教程
计算机视觉战队
18+阅读 · 2019年3月29日
OpenCV 4 系统化学习路线图与教程
计算机视觉life
21+阅读 · 2019年3月24日
被动DNS,一个被忽视的安全利器
运维帮
11+阅读 · 2019年3月8日
【边缘智能】边缘计算驱动的深度学习加速技术
产业智能官
20+阅读 · 2019年2月8日
如何设计基于深度学习的图像压缩算法
论智
41+阅读 · 2018年4月26日
并行算法演进,从MapReduce到MPI
凡人机器学习
10+阅读 · 2017年11月5日
今日头条推荐系统架构演进之路
QCon
32+阅读 · 2017年6月21日
相关基金
国家自然科学基金
17+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员