SAM-Deep-EIoU: Selective Mask Propagation for Multi-Object Tracking - 专知论文

会员服务 ·

0

跟踪器 · 视频 · 视频目标分割 · 目标分割 · 分割 ·

SAM-Deep-EIoU: Selective Mask Propagation for Multi-Object Tracking

翻译：SAM-Deep-EIoU：面向多目标跟踪的选择性掩码传播

Alexander Holmberg

Multi-object tracking has a heavy-tailed difficulty distribution: most frames are easy for a lightweight base tracker, while a small fraction are intrinsically hard. Video object segmentation (VOS) models can often preserve identity through the hard frames where the base tracker fails, but they are much more expensive in compute and memory. We propose selective mask propagation, a tracking algorithm that dispatches from a base tracker to a VOS model only on windows where an assignment-uncertainty signal fires. The base tracker's output is modified only when the VOS model makes a confident prediction that contradicts the base tracker's identity assignment; weak or inconclusive predictions preserve the base output. The method is training-free, treats both the base tracker and the VOS model as black boxes, and can benefit from replacing the VOS component with a more capable model. On DanceTrack, selective mask propagation improves three different base trackers. On SportsMOT, where identity preservation is central to sports analytics, SAM3-Deep-EIoU with global track association achieves state-of-the-art performance on the benchmark with 86.8 HOTA.

翻译：多目标跟踪任务存在重尾难度分布：绝大多数帧对轻量级基础跟踪器是容易的，而少量帧则本质困难。视频目标分割模型通常能在基础跟踪器失效的困难帧中保持身份一致性，但其计算和内存开销显著更高。我们提出选择性掩码传播算法，该算法仅在触发赋值不确定性信号的窗口上，从基础跟踪器切换至视频目标分割模型。仅当视频目标分割模型做出的置信预测与基础跟踪器的身份赋值相矛盾时，基础跟踪器的输出才被修改；若预测较弱或不确定则保留基础输出。该方法无需训练，将基础跟踪器和视频目标分割模型均视为黑箱，且可通过替换为更强大的视频目标分割模型来提升性能。在DanceTrack数据集上，选择性掩码传播改进了三种不同基础跟踪器。在身份保持性对运动分析至关重要的SportsMOT数据集中，结合全局轨迹关联的SAM3-Deep-EIoU以86.8 HOTA达到了基准测试的最优性能。

0

相关内容

跟踪器

军事目标分类《利用相邻视频帧提高卷积神经网络在压力环境下的分类鲁棒性》美陆军2023最新报告

军事目标分类《利用相邻视频帧提高卷积神经网络在压力环境下的分类鲁棒性》美陆军2023最新报告

专知会员服务

27+阅读 · 2023年9月7日

《以目标为中心的概率多假设跟踪》49页技术报告，美海军水下作战中心部

《以目标为中心的概率多假设跟踪》49页技术报告，美海军水下作战中心部

专知会员服务

30+阅读 · 2022年12月22日

《基于信息的分布式多传感器多目标跟踪》美国空军研究实验室2022最新报告

《基于信息的分布式多传感器多目标跟踪》美国空军研究实验室2022最新报告

专知会员服务

126+阅读 · 2022年12月1日

浙大最新《多目标跟踪MOT嵌入》方法研究进展综述，20页pdf涵盖314篇综述文献阐述最新方法与数据集

浙大最新《多目标跟踪MOT嵌入》方法研究进展综述，20页pdf涵盖314篇综述文献阐述最新方法与数据集

专知会员服务

24+阅读 · 2022年5月31日

【AI+军事】洛马AI中心paper速读：基于深度学习的多目标跟踪、轨迹预测，Multi-Object Tracking with Deep Learning Ensemble for Unmanned Aerial System Applications

【AI+军事】洛马AI中心paper速读：基于深度学习的多目标跟踪、轨迹预测，Multi-Object Tracking with Deep Learning Ensemble for Unmanned Aerial System Applications

专知会员服务

66+阅读 · 2022年3月22日

基于深度学习的视觉多目标跟踪算法综述

专知会员服务

50+阅读 · 2021年4月15日

【CMU】基于图神经网络的联合检测与多目标跟踪

【CMU】基于图神经网络的联合检测与多目标跟踪

专知会员服务

59+阅读 · 2020年6月24日

【视频目标检测与跟踪：综述论文】Video Object Segmentation and Tracking: A Survey

专知会员服务

66+阅读 · 2020年6月4日

【目标跟踪 | 2019最新综述】多目标追踪综述，附38页PDF，185篇参考文献，Deep Learning in Video Multi-Object Tracking: A Survey

【目标跟踪 | 2019最新综述】多目标追踪综述，附38页PDF，185篇参考文献，Deep Learning in Video Multi-Object Tracking: A Survey

专知会员服务

93+阅读 · 2019年11月15日

深度学习视频中多目标跟踪：论文综述

深度学习视频中多目标跟踪：论文综述

专知会员服务

94+阅读 · 2019年10月13日

【综述】深度学习在视频多目标跟踪上的应用

【综述】深度学习在视频多目标跟踪上的应用

专知

14+阅读 · 2019年8月8日

计算机视觉方向简介 | 多目标跟踪算法（附源码）

计算机视觉方向简介 | 多目标跟踪算法（附源码）

计算机视觉life

15+阅读 · 2019年6月26日

【综述】《视频目标分割与跟踪》最新39页综述论文，带你了解视频分析进展

【综述】《视频目标分割与跟踪》最新39页综述论文，带你了解视频分析进展

专知

54+阅读 · 2019年4月24日

多目标跟踪：SORT和Deep SORT

多目标跟踪：SORT和Deep SORT

极市平台

47+阅读 · 2019年3月18日

CVPR 2019 | 惊艳的SiamMask：开源快速同时进行目标跟踪与分割算法

CVPR 2019 | 惊艳的SiamMask：开源快速同时进行目标跟踪与分割算法

AI100

14+阅读 · 2019年3月9日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

视频中的多目标跟踪【附PPT与视频资料】

视频中的多目标跟踪【附PPT与视频资料】

人工智能前沿讲习班

30+阅读 · 2018年11月29日

【论文推荐】最新六篇目标跟踪相关论文—双重Siamese网络、判别性相关滤波、多目标跟踪、深度多尺度时空判别性、综述、显著性增强

【论文推荐】最新六篇目标跟踪相关论文—双重Siamese网络、判别性相关滤波、多目标跟踪、深度多尺度时空判别性、综述、显著性增强

专知

34+阅读 · 2018年2月27日

深度学习的快速目标跟踪

深度学习的快速目标跟踪

AI研习社

13+阅读 · 2018年1月8日

【ICCV 目标跟踪性能最优】首个应用残差学习的深度目标跟踪算法

【ICCV 目标跟踪性能最优】首个应用残差学习的深度目标跟踪算法

新智元

35+阅读 · 2017年9月10日

改进智能优化策略多机动目标跟踪方法研究

国家自然科学基金

20+阅读 · 2015年12月31日

基于空间-光谱结构稀疏编码的多波段夜视目标识别技术

国家自然科学基金

1+阅读 · 2015年12月31日

视频场景下大位移运动目标的持续性跟踪方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的高频地波雷达特定目标跟踪方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于秩一张量近似的多目标跟踪

国家自然科学基金

0+阅读 · 2015年12月31日

基于多源视频的大范围场景目标跟踪

国家自然科学基金

2+阅读 · 2015年12月31日

基于随机有限集理论的复杂背景视频多目标跟踪研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于时序空间关系的目标跟踪及遮挡识别研究

国家自然科学基金

6+阅读 · 2015年12月31日

多纹理多深度的3D视频码率控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于稀疏表示的多摄像机非重叠视野域运动目标跟踪方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

GOT-JEPA: Generic Object Tracking with Model Adaptation and Occlusion Handling using Joint-Embedding Predictive Architecture

Arxiv

0+阅读 · 6月16日

LOCUS: Local Visual Cue Search for Enhancing Fine-Grained Perception in Multimodal Large Language Models

Arxiv

0+阅读 · 6月15日

CropTrack: A Tracking with Re-Identification Framework for Precision Agriculture

Arxiv

0+阅读 · 6月13日

Fully Distributed Multi-View 3D Tracking in Real-Time

Arxiv

0+阅读 · 6月12日

One Layer's Trash is Another Layer's Treasure: Adaptive Layer-wise Visual Token Selection in LVLMs

Arxiv

0+阅读 · 6月12日

Fully Distributed Multi-View 3D Tracking in Real-Time

Arxiv

0+阅读 · 6月11日

AdaCodec: A Predictive Visual Code for Video MLLMs

Arxiv

0+阅读 · 6月1日

MASQ: Accelerating Masked Diffusion via Stage-Wise Multi-Precision Quantization

Arxiv

0+阅读 · 5月22日

ReaMOT: A Benchmark and Framework for Reasoning-based Multi-Object Tracking

Arxiv

0+阅读 · 5月11日

Where to Focus: Query-Modulated Multimodal Keyframe Selection for Long Video Understanding

Arxiv

0+阅读 · 4月19日

VIP会员

文章信息

相关主题

视频目标分割

最新内容

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

1+阅读 · 今天14:40

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

1+阅读 · 今天14:36

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

7+阅读 · 今天2:06

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

5+阅读 · 今天1:37

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

3+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

5+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

5+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

7+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

7+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

4+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

6+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

6+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

5+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

4+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

6+阅读 · 6月16日

相关VIP内容

军事目标分类《利用相邻视频帧提高卷积神经网络在压力环境下的分类鲁棒性》美陆军2023最新报告

军事目标分类《利用相邻视频帧提高卷积神经网络在压力环境下的分类鲁棒性》美陆军2023最新报告

专知会员服务

27+阅读 · 2023年9月7日

《以目标为中心的概率多假设跟踪》49页技术报告，美海军水下作战中心部

《以目标为中心的概率多假设跟踪》49页技术报告，美海军水下作战中心部

专知会员服务

30+阅读 · 2022年12月22日

《基于信息的分布式多传感器多目标跟踪》美国空军研究实验室2022最新报告

《基于信息的分布式多传感器多目标跟踪》美国空军研究实验室2022最新报告

专知会员服务

126+阅读 · 2022年12月1日

浙大最新《多目标跟踪MOT嵌入》方法研究进展综述，20页pdf涵盖314篇综述文献阐述最新方法与数据集

浙大最新《多目标跟踪MOT嵌入》方法研究进展综述，20页pdf涵盖314篇综述文献阐述最新方法与数据集

专知会员服务

24+阅读 · 2022年5月31日

【AI+军事】洛马AI中心paper速读：基于深度学习的多目标跟踪、轨迹预测，Multi-Object Tracking with Deep Learning Ensemble for Unmanned Aerial System Applications

【AI+军事】洛马AI中心paper速读：基于深度学习的多目标跟踪、轨迹预测，Multi-Object Tracking with Deep Learning Ensemble for Unmanned Aerial System Applications

专知会员服务

66+阅读 · 2022年3月22日

基于深度学习的视觉多目标跟踪算法综述

专知会员服务

50+阅读 · 2021年4月15日

【CMU】基于图神经网络的联合检测与多目标跟踪

【CMU】基于图神经网络的联合检测与多目标跟踪

专知会员服务

59+阅读 · 2020年6月24日

【视频目标检测与跟踪：综述论文】Video Object Segmentation and Tracking: A Survey

专知会员服务

66+阅读 · 2020年6月4日

【目标跟踪 | 2019最新综述】多目标追踪综述，附38页PDF，185篇参考文献，Deep Learning in Video Multi-Object Tracking: A Survey

【目标跟踪 | 2019最新综述】多目标追踪综述，附38页PDF，185篇参考文献，Deep Learning in Video Multi-Object Tracking: A Survey

专知会员服务

93+阅读 · 2019年11月15日

深度学习视频中多目标跟踪：论文综述

深度学习视频中多目标跟踪：论文综述

专知会员服务

94+阅读 · 2019年10月13日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

相关资讯

【综述】深度学习在视频多目标跟踪上的应用

【综述】深度学习在视频多目标跟踪上的应用

专知

14+阅读 · 2019年8月8日

计算机视觉方向简介 | 多目标跟踪算法（附源码）

计算机视觉方向简介 | 多目标跟踪算法（附源码）

计算机视觉life

15+阅读 · 2019年6月26日

【综述】《视频目标分割与跟踪》最新39页综述论文，带你了解视频分析进展

【综述】《视频目标分割与跟踪》最新39页综述论文，带你了解视频分析进展

专知

54+阅读 · 2019年4月24日

多目标跟踪：SORT和Deep SORT

多目标跟踪：SORT和Deep SORT

极市平台

47+阅读 · 2019年3月18日

CVPR 2019 | 惊艳的SiamMask：开源快速同时进行目标跟踪与分割算法

CVPR 2019 | 惊艳的SiamMask：开源快速同时进行目标跟踪与分割算法

AI100

14+阅读 · 2019年3月9日

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

CVPR 2019：中科院、牛津等提出SiamMask网络，视频跟踪最高精度

新智元

11+阅读 · 2019年3月8日

视频中的多目标跟踪【附PPT与视频资料】

视频中的多目标跟踪【附PPT与视频资料】

人工智能前沿讲习班

30+阅读 · 2018年11月29日

【论文推荐】最新六篇目标跟踪相关论文—双重Siamese网络、判别性相关滤波、多目标跟踪、深度多尺度时空判别性、综述、显著性增强

【论文推荐】最新六篇目标跟踪相关论文—双重Siamese网络、判别性相关滤波、多目标跟踪、深度多尺度时空判别性、综述、显著性增强

专知

34+阅读 · 2018年2月27日

深度学习的快速目标跟踪

深度学习的快速目标跟踪

AI研习社

13+阅读 · 2018年1月8日

【ICCV 目标跟踪性能最优】首个应用残差学习的深度目标跟踪算法

【ICCV 目标跟踪性能最优】首个应用残差学习的深度目标跟踪算法

新智元

35+阅读 · 2017年9月10日

相关论文

GOT-JEPA: Generic Object Tracking with Model Adaptation and Occlusion Handling using Joint-Embedding Predictive Architecture

Arxiv

0+阅读 · 6月16日

LOCUS: Local Visual Cue Search for Enhancing Fine-Grained Perception in Multimodal Large Language Models

Arxiv

0+阅读 · 6月15日

CropTrack: A Tracking with Re-Identification Framework for Precision Agriculture

Arxiv

0+阅读 · 6月13日

Fully Distributed Multi-View 3D Tracking in Real-Time

Arxiv

0+阅读 · 6月12日

One Layer's Trash is Another Layer's Treasure: Adaptive Layer-wise Visual Token Selection in LVLMs

Arxiv

0+阅读 · 6月12日

Fully Distributed Multi-View 3D Tracking in Real-Time

Arxiv

0+阅读 · 6月11日

AdaCodec: A Predictive Visual Code for Video MLLMs

Arxiv

0+阅读 · 6月1日

MASQ: Accelerating Masked Diffusion via Stage-Wise Multi-Precision Quantization

Arxiv

0+阅读 · 5月22日

ReaMOT: A Benchmark and Framework for Reasoning-based Multi-Object Tracking

Arxiv

0+阅读 · 5月11日

Where to Focus: Query-Modulated Multimodal Keyframe Selection for Long Video Understanding

Arxiv

0+阅读 · 4月19日

相关基金

改进智能优化策略多机动目标跟踪方法研究

国家自然科学基金

20+阅读 · 2015年12月31日

基于空间-光谱结构稀疏编码的多波段夜视目标识别技术

国家自然科学基金

1+阅读 · 2015年12月31日

视频场景下大位移运动目标的持续性跟踪方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习的高频地波雷达特定目标跟踪方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于秩一张量近似的多目标跟踪

国家自然科学基金

0+阅读 · 2015年12月31日

基于多源视频的大范围场景目标跟踪

国家自然科学基金

2+阅读 · 2015年12月31日

基于随机有限集理论的复杂背景视频多目标跟踪研究

国家自然科学基金

2+阅读 · 2015年12月31日

基于时序空间关系的目标跟踪及遮挡识别研究

国家自然科学基金

6+阅读 · 2015年12月31日

多纹理多深度的3D视频码率控制研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于稀疏表示的多摄像机非重叠视野域运动目标跟踪方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员