Enhancing Indoor Occupancy Prediction via Sparse Query-Based Multi-Level Consistent Knowledge Distillation - 专知论文

会员服务 ·

0

稀疏 · 多层级 · 知识 · 蒸馏 · 一致 ·

Enhancing Indoor Occupancy Prediction via Sparse Query-Based Multi-Level Consistent Knowledge Distillation

翻译：基于稀疏查询的多层级一致性知识蒸馏增强室内占用预测

Xiang Li,Yupeng Zheng,Pengfei Li,Yilun Chen,Ya-Qin Zhang,Wenchao Ding

from arxiv, Accepted by RA-L

Occupancy prediction provides critical geometric and semantic understanding for robotics but faces efficiency-accuracy trade-offs. Current dense methods suffer computational waste on empty voxels, while sparse query-based approaches lack robustness in diverse and complex indoor scenes. In this paper, we propose DiScene, a novel sparse query-based framework that leverages multi-level distillation to achieve efficient and robust occupancy prediction. In particular, our method incorporates two key innovations: (1) a Multi-level Consistent Knowledge Distillation strategy, which transfers hierarchical representations from large teacher models to lightweight students through coordinated alignment across four levels, including encoder-level feature alignment, query-level feature matching, prior-level spatial guidance, and anchor-level high-confidence knowledge transfer and (2) a Teacher-Guided Initialization policy, employing optimized parameter warm-up to accelerate model convergence. Validated on the Occ-Scannet benchmark, DiScene achieves 23.2 FPS without depth priors while outperforming our baseline method, OPUS, by 36.1% and even better than the depth-enhanced version, OPUS†. With depth integration, DiScene† attains new SOTA performance, surpassing EmbodiedOcc by 3.7% with 1.62$\times$ faster inference speed. Furthermore, experiments on the Occ3D-nuScenes benchmark and in-the-wild scenarios demonstrate the versatility of our approach in various environments. Code and models can be accessed at https://github.com/getterupper/DiScene.

翻译：占用预测为机器人学提供关键的几何与语义理解，但面临效率与精度的权衡。当前稠密方法在空体素上存在计算浪费，而基于稀疏查询的方法在多样复杂室内场景中缺乏鲁棒性。本文提出DiScene，一种新颖的基于稀疏查询的框架，利用多层级蒸馏实现高效鲁棒的占用预测。具体而言，我们的方法包含两项关键创新：(1) 多层级一致性知识蒸馏策略，通过四个层级的协调对齐将大型教师模型的层次化表征迁移至轻量级学生模型，包括编码器级特征对齐、查询级特征匹配、先验级空间引导以及锚点级高置信度知识迁移；(2) 教师引导初始化策略，采用优化参数预热以加速模型收敛。在Occ-Scannet基准测试中验证，DiScene在无深度先验条件下达到23.2 FPS，同时超越基线方法OPUS 36.1%，甚至优于深度增强版本OPUS†。结合深度信息后，DiScene†取得新的SOTA性能，以1.62倍推理速度超越EmbodiedOcc 3.7%。此外，在Occ3D-nuScenes基准测试及实际场景中的实验证明了该方法在多样化环境中的泛化能力。代码与模型可通过 https://github.com/getterupper/DiScene 获取。

0

相关内容

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

专知会员服务

14+阅读 · 2月26日

大型语言模型的知识蒸馏与数据集蒸馏：新兴趋势、挑战与未来方向

大型语言模型的知识蒸馏与数据集蒸馏：新兴趋势、挑战与未来方向

专知会员服务

46+阅读 · 2025年4月26日

【博士论文】利用图结构加速稀疏计算

【博士论文】利用图结构加速稀疏计算

专知会员服务

18+阅读 · 2025年3月6日

基于大语言模型的时序知识图谱推理模型蒸馏方法

基于大语言模型的时序知识图谱推理模型蒸馏方法

专知会员服务

38+阅读 · 2025年1月10日

【干货书】系统与控制的稀疏性方法,214页pdf

【干货书】系统与控制的稀疏性方法,214页pdf

专知会员服务

40+阅读 · 2023年5月19日

《用于改善国防后勤流程的新型预测性维护方法》附论文与PPT，2022年北约“评估新兴技术对军事后勤的影响”研讨会

《用于改善国防后勤流程的新型预测性维护方法》附论文与PPT，2022年北约“评估新兴技术对军事后勤的影响”研讨会

专知会员服务

47+阅读 · 2022年9月12日

深度学习中知识蒸馏研究综述

深度学习中知识蒸馏研究综述

专知会员服务

109+阅读 · 2022年8月13日

「知识蒸馏」最新2022研究综述

「知识蒸馏」最新2022研究综述

专知会员服务

123+阅读 · 2022年3月20日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知会员服务

96+阅读 · 2020年3月25日

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知

18+阅读 · 2022年11月18日

论文浅尝 - CIKM2020 | 用于推荐系统的多模态知识图谱

论文浅尝 - CIKM2020 | 用于推荐系统的多模态知识图谱

开放知识图谱

12+阅读 · 2020年12月17日

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

深度强化学习实验室

43+阅读 · 2020年7月6日

模型压缩 | 知识蒸馏经典解读

模型压缩 | 知识蒸馏经典解读

AINLP

11+阅读 · 2020年5月31日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知

41+阅读 · 2020年3月25日

论文浅尝 | 如何利用外部知识提高预训练模型在阅读理解任务中的性能

论文浅尝 | 如何利用外部知识提高预训练模型在阅读理解任务中的性能

开放知识图谱

10+阅读 · 2019年10月29日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

稀疏性的3个优势 -《稀疏统计学习及其应用》

稀疏性的3个优势 -《稀疏统计学习及其应用》

遇见数学

15+阅读 · 2018年10月24日

半监督多任务学习：Semisupervised Multitask Learning

半监督多任务学习：Semisupervised Multitask Learning

我爱读PAMI

18+阅读 · 2018年4月29日

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

科技创新与创业

17+阅读 · 2017年11月17日

井震联合数据驱动下，多智能技术融合的煤层气储层参数预测与评价

国家自然科学基金

2+阅读 · 2015年12月31日

基于渐进结构化学习的高维信息稀疏表示理论与技术

国家自然科学基金

0+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

稀疏性多维联合优化在线视觉跟踪方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

结合图像块联合聚类加权和混合分类器的非对齐稀疏表示识别方法

国家自然科学基金

1+阅读 · 2015年12月31日

考虑缓冲区大小及在制品数量的多工序生产系统预测维护方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

稀疏优化问题的理论与方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于字典学习的小样本高光谱遥感图像稀疏表示分类精度研究与应用

国家自然科学基金

3+阅读 · 2014年12月31日

The Wisdom of Many Queries: Complexity-Diversity Principle for Dense Retriever Training

Arxiv

0+阅读 · 3月16日

SVD Contextual Sparsity Predictors for Fast LLM Inference

Arxiv

0+阅读 · 3月14日

IndexCache: Accelerating Sparse Attention via Cross-Layer Index Reuse

Arxiv

0+阅读 · 3月12日

Predictive Distributions and the Transition from Sparse to Dense Functional Data

Arxiv

0+阅读 · 3月12日

Sparse Offline Reinforcement Learning with Corruption Robustness

Arxiv

0+阅读 · 3月7日

Sparsification Under Siege: Dual-Level Defense Against Poisoning in Communication-Efficient Federated Learning

Arxiv

0+阅读 · 2月28日

Less is More: Convergence Benefits of Fewer Data Weight Updates over Longer Horizon

Arxiv

0+阅读 · 2月23日

Accelerating Large-Scale Dataset Distillation via Exploration-Exploitation Optimization

Arxiv

0+阅读 · 2月17日

Accelerating Diffusion Planners in Offline RL via Reward-Aware Consistency Trajectory Distillation

Arxiv

0+阅读 · 2月6日

SPOT-Occ: Sparse Prototype-guided Transformer for Camera-based 3D Occupancy Prediction

Arxiv

0+阅读 · 2月4日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

专知会员服务

0+阅读 · 今天15:55

GNN跨域综述：从消息传递到图基础模型

GNN跨域综述：从消息传递到图基础模型

专知会员服务

0+阅读 · 今天15:53

无人机自主控制与人工智能：系统性综述

无人机自主控制与人工智能：系统性综述

专知会员服务

11+阅读 · 今天7:25

巡飞弹与反无人机系统——现代战场的两大支柱

巡飞弹与反无人机系统——现代战场的两大支柱

专知会员服务

3+阅读 · 今天6:54

《打造“黄金舰队”》57页报告

《打造“黄金舰队”》57页报告

专知会员服务

3+阅读 · 今天6:52

《北约数字教官网络发展路径》128页报告

《北约数字教官网络发展路径》128页报告

专知会员服务

2+阅读 · 今天6:33

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

ECCV 2026 | MIMFlow：MIM与归一化流统一图像生成

专知会员服务

7+阅读 · 6月25日

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

超越自回归边界：扩散模型、世界模型与SSM如何重塑代码智能

专知会员服务

6+阅读 · 6月25日

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

重塑决策优势：美军作战艺术与多域作战中联盟联合全域指挥控制（CJADC2）体系的融合

专知会员服务

10+阅读 · 6月25日

网状网络及其在军事领域的运用

网状网络及其在军事领域的运用

专知会员服务

8+阅读 · 6月25日

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

《意识即战场——全球安全体系中认知战的演进：乌克兰构建认知作战体系的展望》

专知会员服务

8+阅读 · 6月25日

无美国参与的欧洲战争方式（万字长文）

无美国参与的欧洲战争方式（万字长文）

专知会员服务

8+阅读 · 6月25日

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

重构“下一场战争”的制胜理论：超越兰彻斯特方程与现代系统

专知会员服务

10+阅读 · 6月25日

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

《国防工业中基于模型定义的实施：产品定义数字化转型的战略路径》90页

专知会员服务

9+阅读 · 6月25日

《国防领域敏感性分析白皮书》

《国防领域敏感性分析白皮书》

专知会员服务

9+阅读 · 6月25日

相关VIP内容

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

【CMU博士论文】可靠轨迹预测的分层基石：数据、评估与方法

专知会员服务

14+阅读 · 2月26日

大型语言模型的知识蒸馏与数据集蒸馏：新兴趋势、挑战与未来方向

大型语言模型的知识蒸馏与数据集蒸馏：新兴趋势、挑战与未来方向

专知会员服务

46+阅读 · 2025年4月26日

【博士论文】利用图结构加速稀疏计算

【博士论文】利用图结构加速稀疏计算

专知会员服务

18+阅读 · 2025年3月6日

基于大语言模型的时序知识图谱推理模型蒸馏方法

基于大语言模型的时序知识图谱推理模型蒸馏方法

专知会员服务

38+阅读 · 2025年1月10日

【干货书】系统与控制的稀疏性方法,214页pdf

【干货书】系统与控制的稀疏性方法,214页pdf

专知会员服务

40+阅读 · 2023年5月19日

《用于改善国防后勤流程的新型预测性维护方法》附论文与PPT，2022年北约“评估新兴技术对军事后勤的影响”研讨会

《用于改善国防后勤流程的新型预测性维护方法》附论文与PPT，2022年北约“评估新兴技术对军事后勤的影响”研讨会

专知会员服务

47+阅读 · 2022年9月12日

深度学习中知识蒸馏研究综述

深度学习中知识蒸馏研究综述

专知会员服务

109+阅读 · 2022年8月13日

「知识蒸馏」最新2022研究综述

「知识蒸馏」最新2022研究综述

专知会员服务

123+阅读 · 2022年3月20日

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

【清华大学】Delta调优:预训练语言模型参数有效方法的综合研究，Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models

专知会员服务

26+阅读 · 2022年3月15日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知会员服务

96+阅读 · 2020年3月25日

热门VIP内容

开通专知VIP会员享更多权益服务

GNN跨域综述：从消息传递到图基础模型

巡飞弹与反无人机系统——现代战场的两大支柱

ICML 2026 | 自回归Boltzmann生成器重塑分子采样

无人机自主控制与人工智能：系统性综述

相关资讯

「知识增强预训练语言模型」最新研究综述

「知识增强预训练语言模型」最新研究综述

专知

18+阅读 · 2022年11月18日

论文浅尝 - CIKM2020 | 用于推荐系统的多模态知识图谱

论文浅尝 - CIKM2020 | 用于推荐系统的多模态知识图谱

开放知识图谱

12+阅读 · 2020年12月17日

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

深度强化学习实验室

43+阅读 · 2020年7月6日

模型压缩 | 知识蒸馏经典解读

模型压缩 | 知识蒸馏经典解读

AINLP

11+阅读 · 2020年5月31日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知

41+阅读 · 2020年3月25日

论文浅尝 | 如何利用外部知识提高预训练模型在阅读理解任务中的性能

论文浅尝 | 如何利用外部知识提高预训练模型在阅读理解任务中的性能

开放知识图谱

10+阅读 · 2019年10月29日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

稀疏性的3个优势 -《稀疏统计学习及其应用》

稀疏性的3个优势 -《稀疏统计学习及其应用》

遇见数学

15+阅读 · 2018年10月24日

半监督多任务学习：Semisupervised Multitask Learning

半监督多任务学习：Semisupervised Multitask Learning

我爱读PAMI

18+阅读 · 2018年4月29日

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

科技创新与创业

17+阅读 · 2017年11月17日

相关论文

The Wisdom of Many Queries: Complexity-Diversity Principle for Dense Retriever Training

Arxiv

0+阅读 · 3月16日

SVD Contextual Sparsity Predictors for Fast LLM Inference

Arxiv

0+阅读 · 3月14日

IndexCache: Accelerating Sparse Attention via Cross-Layer Index Reuse

Arxiv

0+阅读 · 3月12日

Predictive Distributions and the Transition from Sparse to Dense Functional Data

Arxiv

0+阅读 · 3月12日

Sparse Offline Reinforcement Learning with Corruption Robustness

Arxiv

0+阅读 · 3月7日

Sparsification Under Siege: Dual-Level Defense Against Poisoning in Communication-Efficient Federated Learning

Arxiv

0+阅读 · 2月28日

Less is More: Convergence Benefits of Fewer Data Weight Updates over Longer Horizon

Arxiv

0+阅读 · 2月23日

Accelerating Large-Scale Dataset Distillation via Exploration-Exploitation Optimization

Arxiv

0+阅读 · 2月17日

Accelerating Diffusion Planners in Offline RL via Reward-Aware Consistency Trajectory Distillation

Arxiv

0+阅读 · 2月6日

SPOT-Occ: Sparse Prototype-guided Transformer for Camera-based 3D Occupancy Prediction

Arxiv

0+阅读 · 2月4日

相关基金

井震联合数据驱动下，多智能技术融合的煤层气储层参数预测与评价

国家自然科学基金

2+阅读 · 2015年12月31日

基于渐进结构化学习的高维信息稀疏表示理论与技术

国家自然科学基金

0+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

稀疏性多维联合优化在线视觉跟踪方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

结合图像块联合聚类加权和混合分类器的非对齐稀疏表示识别方法

国家自然科学基金

1+阅读 · 2015年12月31日

考虑缓冲区大小及在制品数量的多工序生产系统预测维护方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

动态群稀疏约束场景知识建模的感兴趣监控目标超分辨率重建

国家自然科学基金

1+阅读 · 2014年12月31日

稀疏优化问题的理论与方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于字典学习的小样本高光谱遥感图像稀疏表示分类精度研究与应用

国家自然科学基金

3+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员