Overmind NSA: A Unified Neuro-Symbolic Computing Architecture with Approximate Nonlinear Activations and Preemptive Memory Bypass - 专知论文

会员服务 ·

0

内存 · 神经符号 · 融合 · 近似 · 精度 ·

Overmind NSA: A Unified Neuro-Symbolic Computing Architecture with Approximate Nonlinear Activations and Preemptive Memory Bypass

翻译：标题：Overmind NSA：融合近似非线性激活与抢占式内存旁路的统一神经符号计算架构

Weilun Wang,Zirui Wang,Wantong Li

from arxiv, Accepted to DAC 2026

Neuro-symbolic AI is gaining traction in domains such as large language models, scientific discovery, and autonomous systems due to its ability to combine perception with structured reasoning. However, its deployment is often constrained by high memory demands, diverse computation patterns, and complex hardware requirements. Existing hardware platforms struggle with large on-chip memory overheads, frequent pipeline stalls, limited I/O bandwidth, and inefficient handling of nonlinear operations. To address these key computational bottlenecks, we propose Overmind, a unified neuro-symbolic architecture with cross-layer optimizations. Overmind tackles these core bottlenecks through Padé approximations for universal nonlinear functions, preemptive memory bypass that eliminates costly on-chip caches, and a complete software stack that optimizes model deployment. By reconfiguring the Padé orders for approximating nonlinear functions, we also demonstrate adaptive accuracy-performance scaling. Overmind achieves an energy efficiency of 8.1 TOPS/W and a throughput of 410 GOPS for mixed neuro-symbolic workloads with minimal model accuracy loss. Compared to existing solutions, Overmind improves performance and efficiency with significantly fewer hardware resources.

翻译：摘要：神经符号人工智能正因其融合感知与结构化推理的能力，在大型语言模型、科学发现及自主系统等领域获得广泛应用。然而，其部署常受限于高内存需求、多样化计算模式及复杂硬件要求。现有硬件平台面临片上内存开销大、流水线频繁停顿、输入输出带宽受限以及非线性运算处理效率低下等挑战。为解决这些核心计算瓶颈，我们提出Overmind——一种采用跨层优化的统一神经符号架构。该架构通过以下机制突破关键瓶颈：基于Padé逼近的通用非线性函数处理、通过抢占式内存旁路消除高成本片上缓存，以及优化模型部署的完整软件栈。通过重构非线性函数逼近的Padé阶数，我们实现了自适应精度-性能缩放。Overmind在混合神经符号工作负载下可实现8.1 TOPS/W的能效比与410 GOPS的吞吐量，同时保持极低模型精度损失。与现有方案相比，Overmind以显著更少的硬件资源实现了性能与效率的双重提升。

0

相关内容

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

专知会员服务

15+阅读 · 2025年3月25日

NSR综述：生成式人工智能 | 赫然、曹杰、谭铁牛

NSR综述：生成式人工智能 | 赫然、曹杰、谭铁牛

专知会员服务

37+阅读 · 2025年3月10日

神经形态器件的特性与发展

神经形态器件的特性与发展

专知会员服务

22+阅读 · 2024年2月22日

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知会员服务

89+阅读 · 2023年4月6日

神经网络加速器架构概述

神经网络加速器架构概述

专知会员服务

37+阅读 · 2022年4月23日

深度神经网络 FPGA 设计进展、实现与展望

深度神经网络 FPGA 设计进展、实现与展望

专知会员服务

59+阅读 · 2022年3月26日

深度神经网络FPGA设计进展、实现与展望

深度神经网络FPGA设计进展、实现与展望

专知会员服务

36+阅读 · 2022年3月21日

混合增强视觉认知架构及其关键技术进展

混合增强视觉认知架构及其关键技术进展

专知会员服务

46+阅读 · 2021年11月20日

轻量化神经网络卷积设计研究进展

轻量化神经网络卷积设计研究进展

专知会员服务

58+阅读 · 2021年10月24日

轻量级神经网络架构综述

轻量级神经网络架构综述

专知会员服务

97+阅读 · 2020年4月29日

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

最新《图卷积神经网络》中文综述论文，26页pdf，计算机学报-中科院计算所

最新《图卷积神经网络》中文综述论文，26页pdf，计算机学报-中科院计算所

专知

36+阅读 · 2020年5月19日

结合符号主义和深度学习，DeepMind提出新型端到端神经网络架构 PrediNet

结合符号主义和深度学习，DeepMind提出新型端到端神经网络架构 PrediNet

机器之心

12+阅读 · 2019年5月29日

【新书推荐】复旦邱锡鹏教授发布最全深度学习教材《神经网络与机器学习》

【新书推荐】复旦邱锡鹏教授发布最全深度学习教材《神经网络与机器学习》

专知

12+阅读 · 2019年4月8日

硬件加速神经网络综述

硬件加速神经网络综述

计算机研究与发展

26+阅读 · 2019年2月1日

类脑计算的前沿论文，看我们推荐的这7篇

类脑计算的前沿论文，看我们推荐的这7篇

人工智能前沿讲习班

21+阅读 · 2019年1月7日

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

机器之心

13+阅读 · 2018年9月1日

【一文看懂】深度神经网络加速和压缩新进展年度报告

【一文看懂】深度神经网络加速和压缩新进展年度报告

新智元

10+阅读 · 2018年5月18日

综述AI未来：神经科学启发的类脑计算

综述AI未来：神经科学启发的类脑计算

人工智能学家

11+阅读 · 2018年4月24日

CCCF专栏文章：人机共融智能

CCCF专栏文章：人机共融智能

中国计算机学会

15+阅读 · 2017年12月21日

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

高性能微电极阵列传感器构建及用于神经元原位培养和实时监测研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向人类工作记忆改善的脑电复杂网络信息反馈非线性计算模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于不完全测量信息的随机忆阻神经网络的参数与状态估计问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

一对多联想记忆中的细胞神经网络建模及参数获取方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

非凸非光滑优化的神经网络设计及其关键问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

HAAS: A Policy-Aware Framework for Adaptive Task Allocation Between Humans and Artificial Intelligence Systems

Arxiv

0+阅读 · 5月4日

Algorithm-hardware co-design of neuromorphic networks with dual memory pathways

Arxiv

0+阅读 · 5月2日

NeuroRing: Scaling Spiking Neural Networks via Multi-FPGA Bidirectional Ring Topologies and Stream-Dataflow Architectures

Arxiv

0+阅读 · 4月30日

QSLM: A Performance- and Memory-aware Quantization Framework with Tiered Search Strategy for Spike-driven Language Models

Arxiv

0+阅读 · 4月21日

A Case for Hypergraphs to Model and Map SNNs on Neuromorphic Hardware

Arxiv

0+阅读 · 4月21日

HiPreNets: High-Precision Neural Networks through Progressive Training

Arxiv

0+阅读 · 4月17日

Tensor Memory Engine: On-the-fly Data Reorganization for Ideal Locality

Arxiv

0+阅读 · 4月14日

ReMoGen: Real-time Human Interaction-to-Reaction Generation via Modular Learning from Diverse Data

Arxiv

0+阅读 · 4月1日

A Unified Memory Perspective for Probabilistic Trustworthy AI

Arxiv

0+阅读 · 3月26日

Characterization of Off-wafer Pulse Communication in BrainScaleS Neuromorphic System

Arxiv

0+阅读 · 3月25日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

2+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

4+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

7+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

4+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

6+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

5+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

3+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

8+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

6+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

9+阅读 · 6月22日

相关VIP内容

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

【斯坦福博士论文】时序平滑性假设下的深度神经网络自适应与正则化方法

专知会员服务

15+阅读 · 2025年3月25日

NSR综述：生成式人工智能 | 赫然、曹杰、谭铁牛

NSR综述：生成式人工智能 | 赫然、曹杰、谭铁牛

专知会员服务

37+阅读 · 2025年3月10日

神经形态器件的特性与发展

神经形态器件的特性与发展

专知会员服务

22+阅读 · 2024年2月22日

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知会员服务

89+阅读 · 2023年4月6日

神经网络加速器架构概述

神经网络加速器架构概述

专知会员服务

37+阅读 · 2022年4月23日

深度神经网络 FPGA 设计进展、实现与展望

深度神经网络 FPGA 设计进展、实现与展望

专知会员服务

59+阅读 · 2022年3月26日

深度神经网络FPGA设计进展、实现与展望

深度神经网络FPGA设计进展、实现与展望

专知会员服务

36+阅读 · 2022年3月21日

混合增强视觉认知架构及其关键技术进展

混合增强视觉认知架构及其关键技术进展

专知会员服务

46+阅读 · 2021年11月20日

轻量化神经网络卷积设计研究进展

轻量化神经网络卷积设计研究进展

专知会员服务

58+阅读 · 2021年10月24日

轻量级神经网络架构综述

轻量级神经网络架构综述

专知会员服务

97+阅读 · 2020年4月29日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

最新《图卷积神经网络》中文综述论文，26页pdf，计算机学报-中科院计算所

最新《图卷积神经网络》中文综述论文，26页pdf，计算机学报-中科院计算所

专知

36+阅读 · 2020年5月19日

结合符号主义和深度学习，DeepMind提出新型端到端神经网络架构 PrediNet

结合符号主义和深度学习，DeepMind提出新型端到端神经网络架构 PrediNet

机器之心

12+阅读 · 2019年5月29日

【新书推荐】复旦邱锡鹏教授发布最全深度学习教材《神经网络与机器学习》

【新书推荐】复旦邱锡鹏教授发布最全深度学习教材《神经网络与机器学习》

专知

12+阅读 · 2019年4月8日

硬件加速神经网络综述

硬件加速神经网络综述

计算机研究与发展

26+阅读 · 2019年2月1日

类脑计算的前沿论文，看我们推荐的这7篇

类脑计算的前沿论文，看我们推荐的这7篇

人工智能前沿讲习班

21+阅读 · 2019年1月7日

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

机器之心

13+阅读 · 2018年9月1日

【一文看懂】深度神经网络加速和压缩新进展年度报告

【一文看懂】深度神经网络加速和压缩新进展年度报告

新智元

10+阅读 · 2018年5月18日

综述AI未来：神经科学启发的类脑计算

综述AI未来：神经科学启发的类脑计算

人工智能学家

11+阅读 · 2018年4月24日

CCCF专栏文章：人机共融智能

CCCF专栏文章：人机共融智能

中国计算机学会

15+阅读 · 2017年12月21日

相关论文

HAAS: A Policy-Aware Framework for Adaptive Task Allocation Between Humans and Artificial Intelligence Systems

Arxiv

0+阅读 · 5月4日

Algorithm-hardware co-design of neuromorphic networks with dual memory pathways

Arxiv

0+阅读 · 5月2日

NeuroRing: Scaling Spiking Neural Networks via Multi-FPGA Bidirectional Ring Topologies and Stream-Dataflow Architectures

Arxiv

0+阅读 · 4月30日

QSLM: A Performance- and Memory-aware Quantization Framework with Tiered Search Strategy for Spike-driven Language Models

Arxiv

0+阅读 · 4月21日

A Case for Hypergraphs to Model and Map SNNs on Neuromorphic Hardware

Arxiv

0+阅读 · 4月21日

HiPreNets: High-Precision Neural Networks through Progressive Training

Arxiv

0+阅读 · 4月17日

Tensor Memory Engine: On-the-fly Data Reorganization for Ideal Locality

Arxiv

0+阅读 · 4月14日

ReMoGen: Real-time Human Interaction-to-Reaction Generation via Modular Learning from Diverse Data

Arxiv

0+阅读 · 4月1日

A Unified Memory Perspective for Probabilistic Trustworthy AI

Arxiv

0+阅读 · 3月26日

Characterization of Off-wafer Pulse Communication in BrainScaleS Neuromorphic System

Arxiv

0+阅读 · 3月25日

相关基金

基于深度学习技术的视神经系统研究

国家自然科学基金

7+阅读 · 2017年12月31日

循环神经网络多模态深度模型联想记忆功能研究

国家自然科学基金

6+阅读 · 2017年12月31日

高性能微电极阵列传感器构建及用于神经元原位培养和实时监测研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向人类工作记忆改善的脑电复杂网络信息反馈非线性计算模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于不完全测量信息的随机忆阻神经网络的参数与状态估计问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

一对多联想记忆中的细胞神经网络建模及参数获取方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

面向类脑计算存储器的调制编码理论及方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

非凸非光滑优化的神经网络设计及其关键问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员