GPU-friendly, Parallel, and (Almost-)In-Place Construction of Left-Balanced k-d Trees - 专知论文

会员服务 ·

0

并行 · 构建 · GPU · 并行排序 · 数据点 ·

2023 年 4 月 4 日

GPU-friendly, Parallel, and (Almost-)In-Place Construction of Left-Balanced k-d Trees

翻译：GPU友好的、并行的、（几乎）原位的左平衡k-d树构建

We present an algorithm that allows for building left-balanced and complete k-d trees over k-dimensional points in a trivially parallel and GPU friendly way. Our algorithm requires exactly one int per data point as temporary storage, and uses O(log N) iterations, each of which performs one parallel sort, and one trivially parallel CUDA per-node update kernel.

翻译：我们提出了一种算法，能够以简单并行且GPU友好的方式构建覆盖k维点的左平衡且完整的k-d树。该算法每个数据点仅需一个整数作为临时存储，并执行O(log N)次迭代，每次迭代包含一次并行排序和一次简单并行的CUDA逐节点更新内核。

0

相关内容

用ChatGPT训练羊驼：「白泽」开源，轻松构建专属模型，可在线试玩

用ChatGPT训练羊驼：「白泽」开源，轻松构建专属模型，可在线试玩

专知会员服务

69+阅读 · 2023年4月5日

高效可扩展图神经网络的研究进展，Recent Advances in Efficient and Scalable Graph Neural Networks

高效可扩展图神经网络的研究进展，Recent Advances in Efficient and Scalable Graph Neural Networks

专知会员服务

78+阅读 · 2022年3月15日

不可错过！哈佛大学《高级算法课程》课件与视频放出！CS 224: Advanced Algorithms

不可错过！哈佛大学《高级算法课程》课件与视频放出！CS 224: Advanced Algorithms

专知会员服务

35+阅读 · 2022年1月23日

内存瓶颈和计算负载问题一举突破？韩松团队提出MUCNetV2：解锁MCU端新纪录！

内存瓶颈和计算负载问题一举突破？韩松团队提出MUCNetV2：解锁MCU端新纪录！

专知会员服务

13+阅读 · 2021年11月6日

如何快速构建你的GNN？tf_geometric：基于TensorFlow的友好高效的图神经网络（GNN）库，能够帮到你！

如何快速构建你的GNN？tf_geometric：基于TensorFlow的友好高效的图神经网络（GNN）库，能够帮到你！

专知会员服务

27+阅读 · 2021年8月10日

tf_geometric — 基于TensorFlow的友好高效的图神经网络（GNN）库

tf_geometric — 基于TensorFlow的友好高效的图神经网络（GNN）库

专知会员服务

26+阅读 · 2021年8月9日

【CVPR2020】实例感知、上下文聚焦和内存有效的弱监督目标检测，Instance-aware, Context-focused, and Memory-efficient Weakly Supervised Object Detection

【CVPR2020】实例感知、上下文聚焦和内存有效的弱监督目标检测，Instance-aware, Context-focused, and Memory-efficient Weakly Supervised Object Detection

专知会员服务

34+阅读 · 2020年4月11日

【2020新书】算法与数据结构实战，286页pdf，Algorithms Data Structures in Action

【2020新书】算法与数据结构实战，286页pdf，Algorithms Data Structures in Action

专知会员服务

107+阅读 · 2020年2月22日

【O'Reilly AI Conference 2019】部署大规模分布式数据（How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE))，HPE BlueData，Thomas Phelan

【O'Reilly AI Conference 2019】部署大规模分布式数据（How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE))，HPE BlueData，Thomas Phelan

专知会员服务

19+阅读 · 2019年11月5日

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

专知会员服务

84+阅读 · 2019年10月9日

TensorFlow 2.9 新增功能

TensorFlow 2.9 新增功能

TensorFlow

7+阅读 · 2022年6月23日

PyTorch Parallel Training（单机多卡并行、混合精度、同步BN训练指南文档）

PyTorch Parallel Training（单机多卡并行、混合精度、同步BN训练指南文档）

CVer

21+阅读 · 2020年6月20日

图神经网络库PyTorch geometric

图神经网络库PyTorch geometric

图与推荐

17+阅读 · 2020年3月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

TensorFlow 2.0新特性之Ragged Tensor

TensorFlow 2.0新特性之Ragged Tensor

深度学习每日摘要

18+阅读 · 2019年4月5日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

PyTorch：60分钟入门学习

PyTorch：60分钟入门学习

全球人工智能

14+阅读 · 2018年5月18日

可解释的CNN

可解释的CNN

CreateAMind

18+阅读 · 2017年10月5日

教程 | 如何从TensorFlow转入PyTorch

教程 | 如何从TensorFlow转入PyTorch

深度学习世界

38+阅读 · 2017年9月30日

【推荐】深度学习目标检测概览

【推荐】深度学习目标检测概览

机器学习研究会

10+阅读 · 2017年9月1日

四阶微分方程的谱和谱元方法

国家自然科学基金

0+阅读 · 2014年12月31日

含边界层与界面层的输运方程数值算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

强磁场下低活化钢中合金碳化物(Fe,Cr)xCy析出的热力学机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

数据并行与线程并行合一的可伸缩处理器体系结构

国家自然科学基金

2+阅读 · 2013年12月31日

非线性Cahn-Hilliard型方程自适应高阶稳定数值方法分析

国家自然科学基金

0+阅读 · 2013年12月31日

基于通量观测矩阵的地表能量平衡闭合研究

国家自然科学基金

0+阅读 · 2013年12月31日

Maxwell方程的局部保结构算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

计算力学基本计算及可视化工具程序包的开发与集成

国家自然科学基金

2+阅读 · 2012年12月31日

遍历哈密顿系统的谱理论

国家自然科学基金

0+阅读 · 2009年12月31日

表面疏水型微通道反应器内气液两相流动特性与气液传质的实验研究及数值模拟

国家自然科学基金

0+阅读 · 2009年12月31日

Efficient algorithms for computing rank-revealing factorizations on a GPU

Arxiv

0+阅读 · 2023年5月21日

Implicit Bias of Gradient Descent for Logistic Regression at the Edge of Stability

Arxiv

0+阅读 · 2023年5月19日

Nonconvex Robust High-Order Tensor Completion Using Randomized Low-Rank Approximation

Arxiv

0+阅读 · 2023年5月19日

Constrained Environment Optimization for Prioritized Multi-Agent Navigation

Arxiv

0+阅读 · 2023年5月18日

Communication-Efficient Triangle Counting

Arxiv

0+阅读 · 2023年5月18日

AdaTask: A Task-aware Adaptive Learning Rate Approach to Multi-task Learning

Arxiv

0+阅读 · 2023年5月18日

Boost Vision Transformer with GPU-Friendly Sparsity and Quantization

Arxiv

0+阅读 · 2023年5月18日

An extended version of the Ordered Median Tree Location Problem including appendices and detailed computational results

Arxiv

0+阅读 · 2023年5月17日

SMORE: Knowledge Graph Completion and Multi-hop Reasoning in Massive Knowledge Graphs

SMORE: Knowledge Graph Completion and Multi-hop Reasoning in Massive Knowledge Graphs

Arxiv

19+阅读 · 2021年10月28日

Tensor Decompositions for temporal knowledge base completion

Arxiv

10+阅读 · 2020年4月10日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

1+阅读 · 今天14:40

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

1+阅读 · 今天14:36

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

7+阅读 · 今天2:06

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

5+阅读 · 今天1:37

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

3+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

5+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

5+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

7+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

6+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

5+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

4+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

用ChatGPT训练羊驼：「白泽」开源，轻松构建专属模型，可在线试玩

用ChatGPT训练羊驼：「白泽」开源，轻松构建专属模型，可在线试玩

专知会员服务

69+阅读 · 2023年4月5日

高效可扩展图神经网络的研究进展，Recent Advances in Efficient and Scalable Graph Neural Networks

高效可扩展图神经网络的研究进展，Recent Advances in Efficient and Scalable Graph Neural Networks

专知会员服务

78+阅读 · 2022年3月15日

不可错过！哈佛大学《高级算法课程》课件与视频放出！CS 224: Advanced Algorithms

不可错过！哈佛大学《高级算法课程》课件与视频放出！CS 224: Advanced Algorithms

专知会员服务

35+阅读 · 2022年1月23日

内存瓶颈和计算负载问题一举突破？韩松团队提出MUCNetV2：解锁MCU端新纪录！

内存瓶颈和计算负载问题一举突破？韩松团队提出MUCNetV2：解锁MCU端新纪录！

专知会员服务

13+阅读 · 2021年11月6日

如何快速构建你的GNN？tf_geometric：基于TensorFlow的友好高效的图神经网络（GNN）库，能够帮到你！

如何快速构建你的GNN？tf_geometric：基于TensorFlow的友好高效的图神经网络（GNN）库，能够帮到你！

专知会员服务

27+阅读 · 2021年8月10日

tf_geometric — 基于TensorFlow的友好高效的图神经网络（GNN）库

tf_geometric — 基于TensorFlow的友好高效的图神经网络（GNN）库

专知会员服务

26+阅读 · 2021年8月9日

【CVPR2020】实例感知、上下文聚焦和内存有效的弱监督目标检测，Instance-aware, Context-focused, and Memory-efficient Weakly Supervised Object Detection

【CVPR2020】实例感知、上下文聚焦和内存有效的弱监督目标检测，Instance-aware, Context-focused, and Memory-efficient Weakly Supervised Object Detection

专知会员服务

34+阅读 · 2020年4月11日

【2020新书】算法与数据结构实战，286页pdf，Algorithms Data Structures in Action

【2020新书】算法与数据结构实战，286页pdf，Algorithms Data Structures in Action

专知会员服务

107+阅读 · 2020年2月22日

【O'Reilly AI Conference 2019】部署大规模分布式数据（How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE))，HPE BlueData，Thomas Phelan

【O'Reilly AI Conference 2019】部署大规模分布式数据（How to deploy large-scale distributed data analytics and machine learning on containers (sponsored by HPE))，HPE BlueData，Thomas Phelan

专知会员服务

19+阅读 · 2019年11月5日

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

【CMU卡内基梅隆大学】深度学习在计算机视觉的应用：方法，解释，因果与公平性

专知会员服务

84+阅读 · 2019年10月9日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

TensorFlow 2.9 新增功能

TensorFlow 2.9 新增功能

TensorFlow

7+阅读 · 2022年6月23日

PyTorch Parallel Training（单机多卡并行、混合精度、同步BN训练指南文档）

PyTorch Parallel Training（单机多卡并行、混合精度、同步BN训练指南文档）

CVer

21+阅读 · 2020年6月20日

图神经网络库PyTorch geometric

图神经网络库PyTorch geometric

图与推荐

17+阅读 · 2020年3月22日

Transferring Knowledge across Learning Processes

Transferring Knowledge across Learning Processes

CreateAMind

29+阅读 · 2019年5月18日

TensorFlow 2.0新特性之Ragged Tensor

TensorFlow 2.0新特性之Ragged Tensor

深度学习每日摘要

18+阅读 · 2019年4月5日

A Technical Overview of AI & ML in 2018 & Trends for 2019

A Technical Overview of AI & ML in 2018 & Trends for 2019

待字闺中

18+阅读 · 2018年12月24日

PyTorch：60分钟入门学习

PyTorch：60分钟入门学习

全球人工智能

14+阅读 · 2018年5月18日

可解释的CNN

可解释的CNN

CreateAMind

18+阅读 · 2017年10月5日

教程 | 如何从TensorFlow转入PyTorch

教程 | 如何从TensorFlow转入PyTorch

深度学习世界

38+阅读 · 2017年9月30日

【推荐】深度学习目标检测概览

【推荐】深度学习目标检测概览

机器学习研究会

10+阅读 · 2017年9月1日

相关论文

Efficient algorithms for computing rank-revealing factorizations on a GPU

Arxiv

0+阅读 · 2023年5月21日

Implicit Bias of Gradient Descent for Logistic Regression at the Edge of Stability

Arxiv

0+阅读 · 2023年5月19日

Nonconvex Robust High-Order Tensor Completion Using Randomized Low-Rank Approximation

Arxiv

0+阅读 · 2023年5月19日

Constrained Environment Optimization for Prioritized Multi-Agent Navigation

Arxiv

0+阅读 · 2023年5月18日

Communication-Efficient Triangle Counting

Arxiv

0+阅读 · 2023年5月18日

AdaTask: A Task-aware Adaptive Learning Rate Approach to Multi-task Learning

Arxiv

0+阅读 · 2023年5月18日

Boost Vision Transformer with GPU-Friendly Sparsity and Quantization

Arxiv

0+阅读 · 2023年5月18日

An extended version of the Ordered Median Tree Location Problem including appendices and detailed computational results

Arxiv

0+阅读 · 2023年5月17日

SMORE: Knowledge Graph Completion and Multi-hop Reasoning in Massive Knowledge Graphs

SMORE: Knowledge Graph Completion and Multi-hop Reasoning in Massive Knowledge Graphs

Arxiv

19+阅读 · 2021年10月28日

Tensor Decompositions for temporal knowledge base completion

Arxiv

10+阅读 · 2020年4月10日

相关基金

四阶微分方程的谱和谱元方法

国家自然科学基金

0+阅读 · 2014年12月31日

含边界层与界面层的输运方程数值算法研究

国家自然科学基金

0+阅读 · 2013年12月31日

强磁场下低活化钢中合金碳化物(Fe,Cr)xCy析出的热力学机制研究

国家自然科学基金

0+阅读 · 2013年12月31日

数据并行与线程并行合一的可伸缩处理器体系结构

国家自然科学基金

2+阅读 · 2013年12月31日

非线性Cahn-Hilliard型方程自适应高阶稳定数值方法分析

国家自然科学基金

0+阅读 · 2013年12月31日

基于通量观测矩阵的地表能量平衡闭合研究

国家自然科学基金

0+阅读 · 2013年12月31日

Maxwell方程的局部保结构算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

计算力学基本计算及可视化工具程序包的开发与集成

国家自然科学基金

2+阅读 · 2012年12月31日

遍历哈密顿系统的谱理论

国家自然科学基金

0+阅读 · 2009年12月31日

表面疏水型微通道反应器内气液两相流动特性与气液传质的实验研究及数值模拟

国家自然科学基金

0+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员