Neuro-symbolic AI is gaining traction in domains such as large language models, scientific discovery, and autonomous systems due to its ability to combine perception with structured reasoning. However, its deployment is often constrained by high memory demands, diverse computation patterns, and complex hardware requirements. Existing hardware platforms struggle with large on-chip memory overheads, frequent pipeline stalls, limited I/O bandwidth, and inefficient handling of nonlinear operations. To address these key computational bottlenecks, we propose Overmind, a unified neuro-symbolic architecture with cross-layer optimizations. Overmind tackles these core bottlenecks through Padé approximations for universal nonlinear functions, preemptive memory bypass that eliminates costly on-chip caches, and a complete software stack that optimizes model deployment. By reconfiguring the Padé orders for approximating nonlinear functions, we also demonstrate adaptive accuracy-performance scaling. Overmind achieves an energy efficiency of 8.1 TOPS/W and a throughput of 410 GOPS for mixed neuro-symbolic workloads with minimal model accuracy loss. Compared to existing solutions, Overmind improves performance and efficiency with significantly fewer hardware resources.


翻译:摘要:神经符号人工智能正因其融合感知与结构化推理的能力,在大型语言模型、科学发现及自主系统等领域获得广泛应用。然而,其部署常受限于高内存需求、多样化计算模式及复杂硬件要求。现有硬件平台面临片上内存开销大、流水线频繁停顿、输入输出带宽受限以及非线性运算处理效率低下等挑战。为解决这些核心计算瓶颈,我们提出Overmind——一种采用跨层优化的统一神经符号架构。该架构通过以下机制突破关键瓶颈:基于Padé逼近的通用非线性函数处理、通过抢占式内存旁路消除高成本片上缓存,以及优化模型部署的完整软件栈。通过重构非线性函数逼近的Padé阶数,我们实现了自适应精度-性能缩放。Overmind在混合神经符号工作负载下可实现8.1 TOPS/W的能效比与410 GOPS的吞吐量,同时保持极低模型精度损失。与现有方案相比,Overmind以显著更少的硬件资源实现了性能与效率的双重提升。

0
下载
关闭预览

相关内容

NSR综述:生成式人工智能 | 赫然、曹杰、谭铁牛
专知会员服务
37+阅读 · 2025年3月10日
神经形态器件的特性与发展
专知会员服务
22+阅读 · 2024年2月22日
神经网络加速器架构概述
专知会员服务
37+阅读 · 2022年4月23日
深度神经网络 FPGA 设计进展、实现与展望
专知会员服务
59+阅读 · 2022年3月26日
深度神经网络FPGA设计进展、实现与展望
专知会员服务
36+阅读 · 2022年3月21日
混合增强视觉认知架构及其关键技术进展
专知会员服务
46+阅读 · 2021年11月20日
轻量化神经网络卷积设计研究进展
专知会员服务
58+阅读 · 2021年10月24日
轻量级神经网络架构综述
专知会员服务
97+阅读 · 2020年4月29日
硬件加速神经网络综述
计算机研究与发展
26+阅读 · 2019年2月1日
类脑计算的前沿论文,看我们推荐的这7篇
人工智能前沿讲习班
21+阅读 · 2019年1月7日
综述AI未来:神经科学启发的类脑计算
人工智能学家
11+阅读 · 2018年4月24日
CCCF专栏文章:人机共融智能
中国计算机学会
15+阅读 · 2017年12月21日
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
最新内容
综述 | 世界动作模型:少做梦,多行动
专知会员服务
4+阅读 · 6月23日
美以伊冲突:无人机与人工智能的运用
专知会员服务
7+阅读 · 6月23日
《特种部队在透明战场中的生存力》最新报告
专知会员服务
4+阅读 · 6月23日
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关VIP内容
NSR综述:生成式人工智能 | 赫然、曹杰、谭铁牛
专知会员服务
37+阅读 · 2025年3月10日
神经形态器件的特性与发展
专知会员服务
22+阅读 · 2024年2月22日
神经网络加速器架构概述
专知会员服务
37+阅读 · 2022年4月23日
深度神经网络 FPGA 设计进展、实现与展望
专知会员服务
59+阅读 · 2022年3月26日
深度神经网络FPGA设计进展、实现与展望
专知会员服务
36+阅读 · 2022年3月21日
混合增强视觉认知架构及其关键技术进展
专知会员服务
46+阅读 · 2021年11月20日
轻量化神经网络卷积设计研究进展
专知会员服务
58+阅读 · 2021年10月24日
轻量级神经网络架构综述
专知会员服务
97+阅读 · 2020年4月29日
相关资讯
相关基金
国家自然科学基金
7+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员