GEMM-GS: Accelerating 3D Gaussian Splatting on Tensor Cores with GEMM-Compatible Blending - 专知论文

会员服务 ·

0

张量核 · 融合 · 3D · GPU · 融合技术 ·

GEMM-GS: Accelerating 3D Gaussian Splatting on Tensor Cores with GEMM-Compatible Blending

翻译：GEMM-GS：基于张量核心的3D高斯泼溅加速方法及其GEMM兼容融合技术

Haomin Li,Bowen Zhu,Fangxin Liu,Zongwu Wang,Xinran Liang,Li Jiang,Haibing Guan

from arxiv, Accepted by the 63rd Design Automation Conference (DAC 2026)

Neural Radiance Fields (NeRF) enables 3D scene reconstruction from several 2D images but incurs high rendering latency via its point-sampling design. 3D Gaussian Splatting (3DGS) improves on NeRF with explicit scene representation and an optimized pipeline yet still fails to meet practical real-time demands. Existing acceleration works overlook the evolving Tensor Cores of modern GPUs because 3DGS pipeline lacks General Matrix Multiplication (GEMM) operations. This paper proposes GEMM-GS, an acceleration approach utilizing tensor cores on GPUs via GEMM-friendly blending transformation. It equivalently reformulates the 3DGS blending process into a GEMM-compatible form to utilize Tensor Cores. A high-performance CUDA kernel is designed, integrating a three-stage double-buffered pipeline that overlaps computation and memory access. Extensive experiments show that GEMM-GS achieves $1.42\times$ speedup over vanilla 3DGS and provides an additional $1.47\times$ speedup on average when combining with existing acceleration approaches. Code is released at https://github.com/shieldforever/GEMM-GS.

翻译：神经辐射场（NeRF）能够从多张二维图像重建三维场景，但其点采样机制导致渲染延迟较高。3D高斯泼溅（3DGS）通过显式场景表示与优化管线改进NeRF，仍难以满足实际实时需求。现有加速工作忽视现代GPU不断演进的张量核心，因为3DGS管线缺乏通用矩阵乘法（GEMM）运算。本文提出GEMM-GS，一种通过GEMM友好型融合变换利用GPU张量核心的加速方法。该方法将3DGS融合过程等价重构为GEMM兼容形式以利用张量核心，并设计高性能CUDA内核，集成三阶段双缓冲流水线以重叠计算与内存访问。大量实验表明，GEMM-GS相较原始3DGS实现1.42倍加速，而与现有加速方法结合时平均额外获得1.47倍加速。代码已开源发布于https://github.com/shieldforever/GEMM-GS。

0

相关内容

张量核

综述｜学习式3D表征最新进展与趋势

综述｜学习式3D表征最新进展与趋势

专知会员服务

9+阅读 · 6月5日

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

专知会员服务

13+阅读 · 2月8日

三维高斯泼溅应用综述：分割、编辑与生成

三维高斯泼溅应用综述：分割、编辑与生成

专知会员服务

17+阅读 · 2025年8月14日

【CVPR2025】DIFIX3D+：通过单步扩散模型改进3D重建

【CVPR2025】DIFIX3D+：通过单步扩散模型改进3D重建

专知会员服务

11+阅读 · 2025年3月4日

【AAAI2025】FatesGS：基于深度特征一致性的高斯溅射法进行快速精确的稀疏视角表面重建

【AAAI2025】FatesGS：基于深度特征一致性的高斯溅射法进行快速精确的稀疏视角表面重建

专知会员服务

10+阅读 · 2025年1月9日

机器人中的三维高斯溅射：综述

机器人中的三维高斯溅射：综述

专知会员服务

29+阅读 · 2024年10月17日

神经辐射场加速算法综述

神经辐射场加速算法综述

专知会员服务

22+阅读 · 2024年6月1日

【CVPR2024】VastGaussian: 用于大型场景重建的巨大三维高斯

【CVPR2024】VastGaussian: 用于大型场景重建的巨大三维高斯

专知会员服务

25+阅读 · 2024年3月3日

什么是3D高斯喷溅(Gaussian Splatting，GS)技术？复旦等最新《3D高斯作为新视觉时代》综述，详述3DGS技术

什么是3D高斯喷溅(Gaussian Splatting，GS)技术？复旦等最新《3D高斯作为新视觉时代》综述，详述3DGS技术

专知会员服务

44+阅读 · 2024年2月18日

什么是神经辐射场？滑铁卢大学最新《神经辐射场NeRF在3D视觉》综述，阐述NeRF的方法与应用体系

什么是神经辐射场？滑铁卢大学最新《神经辐射场NeRF在3D视觉》综述，阐述NeRF的方法与应用体系

专知会员服务

78+阅读 · 2022年10月5日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

三维重建 3D reconstruction 有哪些实用算法？

三维重建 3D reconstruction 有哪些实用算法？

极市平台

13+阅读 · 2020年2月23日

密歇根大学最新28页综述论文《GANs生成式对抗网络综述：算法、理论与应用》，带你全面了解GAN技术趋势

密歇根大学最新28页综述论文《GANs生成式对抗网络综述：算法、理论与应用》，带你全面了解GAN技术趋势

极市平台

19+阅读 · 2020年2月17日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

【干货】5个最新图像合成GAN架构解读：核心理念、关键成就、商业化路径

【干货】5个最新图像合成GAN架构解读：核心理念、关键成就、商业化路径

GAN生成式对抗网络

12+阅读 · 2019年3月17日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

ESRGAN：基于GAN的增强超分辨率方法（附代码解析）

ESRGAN：基于GAN的增强超分辨率方法（附代码解析）

PaperWeekly

18+阅读 · 2019年1月18日

计算机视觉方向简介 | 深度相机室内实时稠密三维重建

计算机视觉方向简介 | 深度相机室内实时稠密三维重建

计算机视觉life

17+阅读 · 2018年5月23日

基于加速网的光电混合三维互连架构设计方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

有序Si纳米线Ge/Si量子点复合结构的溅射制备及其性能研究

国家自然科学基金

0+阅读 · 2015年12月31日

用于微流体驱动的微纳米多级沟槽结构的飞秒激光制备技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于3D稀疏表示的多模态神经导航关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

使用GPU加速银道面尘埃辐射图像的高分辨率模拟与多参数反演

国家自然科学基金

0+阅读 · 2015年12月31日

基于人类3D视觉感应的2D到3D视频转换关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

低beta射频超导加速腔场致发射研究

国家自然科学基金

0+阅读 · 2015年12月31日

超高深宽比的太赫兹全金属光栅微加工关键问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

大视场综合孔径成像优化的研究

国家自然科学基金

1+阅读 · 2015年12月31日

Accelerating 3D Gaussian Splatting using Tensor Cores

Arxiv

0+阅读 · 5月20日

2D-SuGaR: Surface-Aware Gaussian Splatting for Geometrically Accurate Mesh Reconstruction

Arxiv

0+阅读 · 5月1日

Faster 3D Gaussian Splatting Convergence via Structure-Aware Densification

Arxiv

0+阅读 · 4月30日

RMGS-SLAM: Real-time Multi-sensor Gaussian Splatting SLAM

Arxiv

0+阅读 · 4月21日

Matrix-Free 3D SIMP Topology Optimization with Fused Gather-GEMM-Scatter Kernels

Arxiv

0+阅读 · 4月20日

Neural Gabor Splatting: Enhanced Gaussian Splatting with Neural Gabor for High-frequency Surface Reconstruction

Arxiv

0+阅读 · 4月17日

AnchorSplat: Feed-Forward 3D Gaussian Splatting with 3D Geometric Priors

Arxiv

0+阅读 · 4月9日

A Survey on 3D Gaussian Splatting

Arxiv

0+阅读 · 4月9日

GEMM-GS: Accelerating 3D Gaussian Splatting on Tensor Cores with GEMM-Compatible Blending

Arxiv

0+阅读 · 4月6日

FACT-GS: Frequency-Aligned Complexity-Aware Texture Reparameterization for 2D Gaussian Splatting

Arxiv

0+阅读 · 4月2日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

综述｜学习式3D表征最新进展与趋势

综述｜学习式3D表征最新进展与趋势

专知会员服务

9+阅读 · 6月5日

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

迈向下一代 SLAM：基于 3DGS 的 SLAM 技术综述——聚焦性能、鲁棒性及未来方向

专知会员服务

13+阅读 · 2月8日

三维高斯泼溅应用综述：分割、编辑与生成

三维高斯泼溅应用综述：分割、编辑与生成

专知会员服务

17+阅读 · 2025年8月14日

【CVPR2025】DIFIX3D+：通过单步扩散模型改进3D重建

【CVPR2025】DIFIX3D+：通过单步扩散模型改进3D重建

专知会员服务

11+阅读 · 2025年3月4日

【AAAI2025】FatesGS：基于深度特征一致性的高斯溅射法进行快速精确的稀疏视角表面重建

【AAAI2025】FatesGS：基于深度特征一致性的高斯溅射法进行快速精确的稀疏视角表面重建

专知会员服务

10+阅读 · 2025年1月9日

机器人中的三维高斯溅射：综述

机器人中的三维高斯溅射：综述

专知会员服务

29+阅读 · 2024年10月17日

神经辐射场加速算法综述

神经辐射场加速算法综述

专知会员服务

22+阅读 · 2024年6月1日

【CVPR2024】VastGaussian: 用于大型场景重建的巨大三维高斯

【CVPR2024】VastGaussian: 用于大型场景重建的巨大三维高斯

专知会员服务

25+阅读 · 2024年3月3日

什么是3D高斯喷溅(Gaussian Splatting，GS)技术？复旦等最新《3D高斯作为新视觉时代》综述，详述3DGS技术

什么是3D高斯喷溅(Gaussian Splatting，GS)技术？复旦等最新《3D高斯作为新视觉时代》综述，详述3DGS技术

专知会员服务

44+阅读 · 2024年2月18日

什么是神经辐射场？滑铁卢大学最新《神经辐射场NeRF在3D视觉》综述，阐述NeRF的方法与应用体系

什么是神经辐射场？滑铁卢大学最新《神经辐射场NeRF在3D视觉》综述，阐述NeRF的方法与应用体系

专知会员服务

78+阅读 · 2022年10月5日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

三维重建 3D reconstruction 有哪些实用算法？

三维重建 3D reconstruction 有哪些实用算法？

极市平台

13+阅读 · 2020年2月23日

密歇根大学最新28页综述论文《GANs生成式对抗网络综述：算法、理论与应用》，带你全面了解GAN技术趋势

密歇根大学最新28页综述论文《GANs生成式对抗网络综述：算法、理论与应用》，带你全面了解GAN技术趋势

极市平台

19+阅读 · 2020年2月17日

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

【综述】3D数据分类深度学习方法综述，25页论文带你全面了解最新进展

中国人工智能学会

20+阅读 · 2019年7月17日

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

【泡泡点云时空】跟踪与三角测量中一种通过兴趣点网络进行多视图2D/3D刚性配准的方法

泡泡机器人SLAM

17+阅读 · 2019年7月8日

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

【学界】DeepMind论文：深度压缩感知，新框架提升GAN性能

GAN生成式对抗网络

14+阅读 · 2019年5月23日

【干货】5个最新图像合成GAN架构解读：核心理念、关键成就、商业化路径

【干货】5个最新图像合成GAN架构解读：核心理念、关键成就、商业化路径

GAN生成式对抗网络

12+阅读 · 2019年3月17日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

ESRGAN：基于GAN的增强超分辨率方法（附代码解析）

ESRGAN：基于GAN的增强超分辨率方法（附代码解析）

PaperWeekly

18+阅读 · 2019年1月18日

计算机视觉方向简介 | 深度相机室内实时稠密三维重建

计算机视觉方向简介 | 深度相机室内实时稠密三维重建

计算机视觉life

17+阅读 · 2018年5月23日

相关论文

Accelerating 3D Gaussian Splatting using Tensor Cores

Arxiv

0+阅读 · 5月20日

2D-SuGaR: Surface-Aware Gaussian Splatting for Geometrically Accurate Mesh Reconstruction

Arxiv

0+阅读 · 5月1日

Faster 3D Gaussian Splatting Convergence via Structure-Aware Densification

Arxiv

0+阅读 · 4月30日

RMGS-SLAM: Real-time Multi-sensor Gaussian Splatting SLAM

Arxiv

0+阅读 · 4月21日

Matrix-Free 3D SIMP Topology Optimization with Fused Gather-GEMM-Scatter Kernels

Arxiv

0+阅读 · 4月20日

Neural Gabor Splatting: Enhanced Gaussian Splatting with Neural Gabor for High-frequency Surface Reconstruction

Arxiv

0+阅读 · 4月17日

AnchorSplat: Feed-Forward 3D Gaussian Splatting with 3D Geometric Priors

Arxiv

0+阅读 · 4月9日

A Survey on 3D Gaussian Splatting

Arxiv

0+阅读 · 4月9日

GEMM-GS: Accelerating 3D Gaussian Splatting on Tensor Cores with GEMM-Compatible Blending

Arxiv

0+阅读 · 4月6日

FACT-GS: Frequency-Aligned Complexity-Aware Texture Reparameterization for 2D Gaussian Splatting

Arxiv

0+阅读 · 4月2日

相关基金

基于加速网的光电混合三维互连架构设计方法研究

国家自然科学基金

0+阅读 · 2017年12月31日

有序Si纳米线Ge/Si量子点复合结构的溅射制备及其性能研究

国家自然科学基金

0+阅读 · 2015年12月31日

用于微流体驱动的微纳米多级沟槽结构的飞秒激光制备技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于3D稀疏表示的多模态神经导航关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

2D/3D视觉信息融合仿生SLAM关键问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

使用GPU加速银道面尘埃辐射图像的高分辨率模拟与多参数反演

国家自然科学基金

0+阅读 · 2015年12月31日

基于人类3D视觉感应的2D到3D视频转换关键技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

低beta射频超导加速腔场致发射研究

国家自然科学基金

0+阅读 · 2015年12月31日

超高深宽比的太赫兹全金属光栅微加工关键问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

大视场综合孔径成像优化的研究

国家自然科学基金

1+阅读 · 2015年12月31日

微信扫码咨询专知VIP会员