A Comparative Analysis of ARM and x86-64 Laptop-Class Processors: Architecture, Assembly-Level Performance, and Energy Efficiency - 专知论文

会员服务 ·

0

分析 · 能效 · 系统 · ARM · 笔记本电脑 ·

A Comparative Analysis of ARM and x86-64 Laptop-Class Processors: Architecture, Assembly-Level Performance, and Energy Efficiency

翻译：ARM与x86-64笔记本级处理器比较分析：架构、汇编级性能与能效

Mustafa Mert Özyılmaz

from arxiv, 13 pages, 3 figures. submitted to Transactions on Computer Science and Applications TCSA

ARM-based and x86-64 laptop processors differ not only in instruction-set design, but also in memory hierarchy, core organization, system integration, and power-management mechanisms. This study presents a combined architectural and experimental comparison of an Apple M3 system and an AMD Ryzen 7 3750H system. The architectural analysis contrasts AArch64's fixed-width load-store design with the variable-length, memory-operand-rich x86-64 instruction model, and discusses how register organization, calling conventions, heterogeneous core organization, memory behavior, and low-power mechanisms shape observed performance and energy characteristics. The experimental part uses two native assembly benchmarks: a recursive Fibonacci workload and an integer matrix-multiplication workload. The analysis combines repeated timing measurements, processor-energy measurements, and cross-platform microarchitectural counter measurements from matched portable-C profiling runs. The Ryzen platform is decisively faster on the branch-heavy Fibonacci benchmark, while matrix multiplication shows no meaningful timing advantage for either platform in the present measurements. In contrast, the Apple platform is markedly more energy-efficient, reducing energy-to-solution by approximately 5.82$\times$ on Fibonacci and 6.38$\times$ on matrix multiplication. These results are interpreted as platform-level findings rather than as pure ISA-only effects, reflecting differences in implementation, system integration, and measurement methodology in addition to instruction-set structure.

翻译：基于ARM和x86-64架构的笔记本处理器不仅在指令集设计上存在差异，还在存储层次、核心组织、系统集成以及电源管理机制方面有所不同。本研究对苹果M3系统和AMD锐龙7 3750H系统进行了架构与实验相结合的比较分析。架构分析对比了AArch64的定长加载-存储设计与x86-64可变长度、富含内存操作数的指令模型，并讨论了寄存器组织、调用约定、异构核心组织、内存行为及低功耗机制如何影响观测到的性能和能耗特征。实验部分采用两种原生汇编程序：递归斐波那契负载和整数矩阵乘法负载。分析结合了重复计时测量、处理器能耗测量以及通过匹配的便携式C语言性能分析运行获得的跨平台微架构计数器测量结果。在分支密集的斐波那契基准测试中，锐龙平台明显更快，而矩阵乘法在当前测量中未显示出任一一方具有显著的时间优势。相比之下，苹果平台的能效明显更高，在斐波那契测试中能效提升约5.82倍，在矩阵乘法测试中提升约6.38倍。这些结果被解释为平台层面的发现，而非纯ISA效应，反映了除指令集结构外，实现方式、系统集成及测量方法上的差异。

0

相关内容

【报告】解析英伟达成长的核心战略：研发为底、生态为径、AI为翼

【报告】解析英伟达成长的核心战略：研发为底、生态为径、AI为翼

专知会员服务

48+阅读 · 2023年5月25日

片上系统SOC芯片研究框架，93页ppt

片上系统SOC芯片研究框架，93页ppt

专知会员服务

108+阅读 · 2022年9月12日

《信息安全技术安全处理器技术规范》国家标准意见稿，54页pdf

《信息安全技术安全处理器技术规范》国家标准意见稿，54页pdf

专知会员服务

26+阅读 · 2022年3月6日

「AI芯片/GPU/NPU/DSP专用处理器」技术特征比较分析最新2022综述论文

「AI芯片/GPU/NPU/DSP专用处理器」技术特征比较分析最新2022综述论文

专知会员服务

65+阅读 · 2022年3月6日

龙芯团队胡伟武老师等出品！《计算机体系结构基础》免费书开源

龙芯团队胡伟武老师等出品！《计算机体系结构基础》免费书开源

专知会员服务

90+阅读 · 2021年11月7日

中科院计算所牵头发布《专⽤数据处理器DPU技术白皮书》，94页pdf

中科院计算所牵头发布《专⽤数据处理器DPU技术白皮书》，94页pdf

专知会员服务

91+阅读 · 2021年10月24日

处理器芯片敏捷设计方法：问题与挑战

专知会员服务

19+阅读 · 2021年6月29日

中科大《计算机体系结构》2021课程，附课件

中科大《计算机体系结构》2021课程，附课件

专知会员服务

77+阅读 · 2021年4月4日

【硬核书】Linux核心编程|Linux Kernel Programming，741页pdf

【硬核书】Linux核心编程|Linux Kernel Programming，741页pdf

专知会员服务

80+阅读 · 2021年3月26日

机器学习如何用于芯片系统设计？Jeff Dean推荐Google最新《机器学习系统芯片设计》70页ppt为你讲解

机器学习如何用于芯片系统设计？Jeff Dean推荐Google最新《机器学习系统芯片设计》70页ppt为你讲解

专知会员服务

61+阅读 · 2020年5月31日

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

【硬核书】Linux核心编程|Linux Kernel Programming，741页pdf

【硬核书】Linux核心编程|Linux Kernel Programming，741页pdf

专知

13+阅读 · 2021年3月26日

推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享

推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享

深度学习与NLP

40+阅读 · 2019年9月13日

参数少一半，效果还更好，天津大学和微软提出Transformer压缩模型

参数少一半，效果还更好，天津大学和微软提出Transformer压缩模型

机器之心

15+阅读 · 2019年7月13日

6000星人气深度学习资源！架构模型技巧全都有，图灵奖得主LeCun推荐

6000星人气深度学习资源！架构模型技巧全都有，图灵奖得主LeCun推荐

量子位

13+阅读 · 2019年6月18日

可能是最全的中美科技公司薪资职级对比，国外大厂是这样留住人才的...

可能是最全的中美科技公司薪资职级对比，国外大厂是这样留住人才的...

九章算法

18+阅读 · 2019年6月6日

【综述】IBM 自动机器学习网络架构搜索最新综述，附45页全文下载

【综述】IBM 自动机器学习网络架构搜索最新综述，附45页全文下载

专知

20+阅读 · 2019年5月8日

TensorFlow GPU基准测试：2080 Ti vs V100 vs 1080 Ti vs Titan V

TensorFlow GPU基准测试：2080 Ti vs V100 vs 1080 Ti vs Titan V

论智

12+阅读 · 2018年10月14日

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

机器之心

13+阅读 · 2018年9月1日

经验 | Pytorch还是Tensorflow？英伟达工程师帮你总结了

经验 | Pytorch还是Tensorflow？英伟达工程师帮你总结了

AI100

10+阅读 · 2017年10月27日

异构众核处理器非对称片上互连网络研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非易失内存设备的数据读写性能优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

“非对称多通道”异质、异构内存系统架构及“启发式”混合内存资源管理机制的研究

国家自然科学基金

0+阅读 · 2015年12月31日

嵌入式异构多核系统应用程序自动并行化过程关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向高性能异构众核架构的大规模CFD并行算法与应用

国家自然科学基金

0+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向可重构多核处理器系统的分层次自适应优化机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

CPU和GPU混合体系结构上生物网络比对并行算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据计算的高吞吐量众核处理器关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

ARM: An AutoRegressive Large Multimodal Model with Unified Discrete Representations

Arxiv

0+阅读 · 6月9日

ABI: A tightly integrated, unified, sparsity-aware, reconfigurable, compute near-register file/cache GPU architecture with light-weight softmax for deep learning, linear algebra, and Ising compute

Arxiv

0+阅读 · 5月24日

DCC: Data-Centric Compilation of Machine Learning Kernels for Processing-In-Memory Architectures

Arxiv

0+阅读 · 5月22日

ArcLight: A Lightweight LLM Inference Architecture for Many-Core CPUs

Arxiv

0+阅读 · 5月13日

CCX: Enabling Unmodified Intel SGX Applications on Arm CCA

Arxiv

0+阅读 · 5月8日

KEET: Explaining Performance of GPU Kernels Using LLM Agents

Arxiv

0+阅读 · 5月6日

Modernizing Amdahl's Law: How AI Scaling Laws Shape Computer Architecture

Arxiv

0+阅读 · 4月8日

Modernizing Amdahl's Law: How AI Scaling Laws Shape Computer Architecture

Arxiv

0+阅读 · 3月30日

Hardware-Agnostic and Insightful Efficiency Metrics for Accelerated Systems: Definition and Implementation within TALP

Arxiv

0+阅读 · 3月27日

Modernizing Amdahl's Law: How AI Scaling Laws Shape Computer Architecture

Arxiv

0+阅读 · 3月21日

VIP会员

文章信息

相关主题

笔记本电脑

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

2+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

4+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

7+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

4+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

6+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

5+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

3+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

8+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

6+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

9+阅读 · 6月22日

相关VIP内容

【报告】解析英伟达成长的核心战略：研发为底、生态为径、AI为翼

【报告】解析英伟达成长的核心战略：研发为底、生态为径、AI为翼

专知会员服务

48+阅读 · 2023年5月25日

片上系统SOC芯片研究框架，93页ppt

片上系统SOC芯片研究框架，93页ppt

专知会员服务

108+阅读 · 2022年9月12日

《信息安全技术安全处理器技术规范》国家标准意见稿，54页pdf

《信息安全技术安全处理器技术规范》国家标准意见稿，54页pdf

专知会员服务

26+阅读 · 2022年3月6日

「AI芯片/GPU/NPU/DSP专用处理器」技术特征比较分析最新2022综述论文

「AI芯片/GPU/NPU/DSP专用处理器」技术特征比较分析最新2022综述论文

专知会员服务

65+阅读 · 2022年3月6日

龙芯团队胡伟武老师等出品！《计算机体系结构基础》免费书开源

龙芯团队胡伟武老师等出品！《计算机体系结构基础》免费书开源

专知会员服务

90+阅读 · 2021年11月7日

中科院计算所牵头发布《专⽤数据处理器DPU技术白皮书》，94页pdf

中科院计算所牵头发布《专⽤数据处理器DPU技术白皮书》，94页pdf

专知会员服务

91+阅读 · 2021年10月24日

处理器芯片敏捷设计方法：问题与挑战

专知会员服务

19+阅读 · 2021年6月29日

中科大《计算机体系结构》2021课程，附课件

中科大《计算机体系结构》2021课程，附课件

专知会员服务

77+阅读 · 2021年4月4日

【硬核书】Linux核心编程|Linux Kernel Programming，741页pdf

【硬核书】Linux核心编程|Linux Kernel Programming，741页pdf

专知会员服务

80+阅读 · 2021年3月26日

机器学习如何用于芯片系统设计？Jeff Dean推荐Google最新《机器学习系统芯片设计》70页ppt为你讲解

机器学习如何用于芯片系统设计？Jeff Dean推荐Google最新《机器学习系统芯片设计》70页ppt为你讲解

专知会员服务

61+阅读 · 2020年5月31日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

【ChatGPT系列报告】ChatGPT：存算一体，算力的下一极，47页ppt

专知

14+阅读 · 2023年4月6日

【硬核书】Linux核心编程|Linux Kernel Programming，741页pdf

【硬核书】Linux核心编程|Linux Kernel Programming，741页pdf

专知

13+阅读 · 2021年3月26日

推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享

推荐系统原理、工程、大厂(Youtube、BAT、TMB)架构干活分享

深度学习与NLP

40+阅读 · 2019年9月13日

参数少一半，效果还更好，天津大学和微软提出Transformer压缩模型

参数少一半，效果还更好，天津大学和微软提出Transformer压缩模型

机器之心

15+阅读 · 2019年7月13日

6000星人气深度学习资源！架构模型技巧全都有，图灵奖得主LeCun推荐

6000星人气深度学习资源！架构模型技巧全都有，图灵奖得主LeCun推荐

量子位

13+阅读 · 2019年6月18日

可能是最全的中美科技公司薪资职级对比，国外大厂是这样留住人才的...

可能是最全的中美科技公司薪资职级对比，国外大厂是这样留住人才的...

九章算法

18+阅读 · 2019年6月6日

【综述】IBM 自动机器学习网络架构搜索最新综述，附45页全文下载

【综述】IBM 自动机器学习网络架构搜索最新综述，附45页全文下载

专知

20+阅读 · 2019年5月8日

TensorFlow GPU基准测试：2080 Ti vs V100 vs 1080 Ti vs Titan V

TensorFlow GPU基准测试：2080 Ti vs V100 vs 1080 Ti vs Titan V

论智

12+阅读 · 2018年10月14日

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

专栏 | 神经网络架构搜索（NAS）综述（附AutoML资料推荐）

机器之心

13+阅读 · 2018年9月1日

经验 | Pytorch还是Tensorflow？英伟达工程师帮你总结了

经验 | Pytorch还是Tensorflow？英伟达工程师帮你总结了

AI100

10+阅读 · 2017年10月27日

相关论文

ARM: An AutoRegressive Large Multimodal Model with Unified Discrete Representations

Arxiv

0+阅读 · 6月9日

ABI: A tightly integrated, unified, sparsity-aware, reconfigurable, compute near-register file/cache GPU architecture with light-weight softmax for deep learning, linear algebra, and Ising compute

Arxiv

0+阅读 · 5月24日

DCC: Data-Centric Compilation of Machine Learning Kernels for Processing-In-Memory Architectures

Arxiv

0+阅读 · 5月22日

ArcLight: A Lightweight LLM Inference Architecture for Many-Core CPUs

Arxiv

0+阅读 · 5月13日

CCX: Enabling Unmodified Intel SGX Applications on Arm CCA

Arxiv

0+阅读 · 5月8日

KEET: Explaining Performance of GPU Kernels Using LLM Agents

Arxiv

0+阅读 · 5月6日

Modernizing Amdahl's Law: How AI Scaling Laws Shape Computer Architecture

Arxiv

0+阅读 · 4月8日

Modernizing Amdahl's Law: How AI Scaling Laws Shape Computer Architecture

Arxiv

0+阅读 · 3月30日

Hardware-Agnostic and Insightful Efficiency Metrics for Accelerated Systems: Definition and Implementation within TALP

Arxiv

0+阅读 · 3月27日

Modernizing Amdahl's Law: How AI Scaling Laws Shape Computer Architecture

Arxiv

0+阅读 · 3月21日

相关基金

异构众核处理器非对称片上互连网络研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于非易失内存设备的数据读写性能优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

“非对称多通道”异质、异构内存系统架构及“启发式”混合内存资源管理机制的研究

国家自然科学基金

0+阅读 · 2015年12月31日

嵌入式异构多核系统应用程序自动并行化过程关键技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向高性能异构众核架构的大规模CFD并行算法与应用

国家自然科学基金

0+阅读 · 2015年12月31日

神经形态多核处理器的架构模型研究

国家自然科学基金

3+阅读 · 2015年12月31日

面向可重构多核处理器系统的分层次自适应优化机制研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的高时效并行计算机系统结构与技术

国家自然科学基金

0+阅读 · 2014年12月31日

CPU和GPU混合体系结构上生物网络比对并行算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据计算的高吞吐量众核处理器关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员