The scientific community increasingly relies on machine learning (ML) for near-sensor processing, leveraging its strengths in tasks such as pattern recognition, anomaly detection, and real-time decision-making. These deployments demand accelerators that combine extremely high performance with programmability, ease of integration, and straightforward verification. We present cgra4ml, an open-source, modular framework that generates parameterizable CGRA accelerators in synthesizable SystemVerilog RTL, tailored to common ML compute patterns found in scientific applications. The framework supports seamless system integration through AXI-compliant interfaces and open-source DMA components, and it includes automatic firmware generation for programming the accelerator. A comprehensive verification suite and a runtime firmware stack further support deployment across diverse SoC platforms. cgra4ml provides a modular, full-stack infrastructure, including a Python API, SystemVerilog hardware, TCL toolflows, and a C runtime, which facilitates easy integration and experimentation, allowing scientists to focus on innovation rather than dealing with the intricacies of hardware design and optimization. We demonstrate the effectiveness of cgra4ml to implement common scientific edge neural networks using ASIC and FPGA design flows.


翻译:科学界日益依赖机器学习(ML)进行近传感器处理,发挥其在模式识别、异常检测和实时决策等任务中的优势。这些部署需要兼具极高性能、可编程性、易于集成和便捷验证的加速器。我们提出cgra4ml——一个开源模块化框架,可在可综合SystemVerilog RTL中生成参数化的CGRA加速器,并针对科学应用中常见的ML计算模式进行定制。该框架通过兼容AXI的接口和开源DMA组件支持无缝系统集成,并包含用于编程加速器的自动固件生成。一套全面的验证套件和运行时固件栈进一步支持其在多样化SoC平台上的部署。cgra4ml提供模块化全栈基础设施,包括Python API、SystemVerilog硬件、TCL工具流和C运行时库,便于集成和实验,使科学家能够专注于创新而非应对硬件设计与优化的复杂性。我们通过ASIC和FPGA设计流程展示了cgra4ml在实现常见科学边缘神经网络方面的有效性。

0
下载
关闭预览

相关内容

TinyML 与 LargeML 的融合:面向 6G 及未来的综述
专知会员服务
23+阅读 · 2025年5月25日
【AI4Science】《人工智能科学:深度学习革命》2023新书,
专知会员服务
214+阅读 · 2023年6月15日
专知会员服务
125+阅读 · 2021年6月19日
概述自动机器学习(AutoML)
人工智能学家
19+阅读 · 2019年8月11日
PlaNet 简介:用于强化学习的深度规划网络
谷歌开发者
13+阅读 · 2019年3月16日
【边缘智能】边缘计算驱动的深度学习加速技术
产业智能官
20+阅读 · 2019年2月8日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
Arxiv
0+阅读 · 3月2日
VIP会员
相关主题
最新内容
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
1+阅读 · 今天14:04
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
5+阅读 · 今天13:49
基于声学的无人机检测技术综述
专知会员服务
3+阅读 · 今天13:37
《当代混合战争分析框架:俄乌战争经验教训》
专知会员服务
4+阅读 · 今天13:11
战略前沿人工智能的再思考(中文)
专知会员服务
7+阅读 · 5月29日
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
5+阅读 · 5月29日
“史诗怒火行动”中美军损失的作战飞机
专知会员服务
6+阅读 · 5月29日
ICML 2026 | 理解上下文持续学习中的泛化与遗忘
专知会员服务
5+阅读 · 5月28日
相关VIP内容
TinyML 与 LargeML 的融合:面向 6G 及未来的综述
专知会员服务
23+阅读 · 2025年5月25日
【AI4Science】《人工智能科学:深度学习革命》2023新书,
专知会员服务
214+阅读 · 2023年6月15日
专知会员服务
125+阅读 · 2021年6月19日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
17+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员