Autonomous agents such as indoor drones must learn new object classes in real-time while limiting catastrophic forgetting, motivating Class-Incremental Learning (CIL). However, most unmanned aerial vehicle (UAV) datasets focus on outdoor scenes and offer limited temporally coherent indoor videos. We introduce an indoor dataset of $14,400$ frames capturing inter-drone and ground vehicle footage, annotated via a semi-automatic workflow with a $98.6\%$ first-pass labeling agreement before final manual verification. Using this dataset, we benchmark 3 replay-based CIL strategies: Experience Replay (ER), Maximally Interfered Retrieval (MIR), and Forgetting-Aware Replay (FAR), using YOLOv11-nano as a resource-efficient detector for deployment-constrained UAV platforms. Under tight memory budgets ($5-10\%$ replay), FAR performs better than the rest, achieving an average accuracy (ACC, $mAP_{50-95}$ across increments) of $82.96\%$ with $5\%$ replay. Gradient-weighted class activation mapping (Grad-CAM) analysis shows attention shifts across classes in mixed scenes, which is associated with reduced localization quality for drones. The experiments further demonstrate that replay-based continual learning can be effectively applied to edge aerial systems. Overall, this work contributes an indoor UAV video dataset with preserved temporal coherence and an evaluation of replay-based CIL under limited replay budgets. Project page: https://spacetime-vision-robotics-laboratory.github.io/learning-on-the-fly-cl


翻译:室内无人机等自主智能体必须在实时学习新物体类别的同时限制灾难性遗忘,这推动了类增量学习(CIL)的研究。然而,大多数无人机(UAV)数据集聚焦于室外场景,且提供的具有时间连贯性的室内视频有限。我们引入了一个包含 $14,400$ 帧的室内数据集,其中捕捉了无人机间及地面车辆的影像,并通过一个半自动标注流程进行标注,在最终人工验证前首次标注一致性达到 $98.6\%$。利用该数据集,我们以 YOLOv11-nano 作为资源受限无人机平台部署的高效检测器,对三种基于回放的 CIL 策略进行了基准测试:经验回放(ER)、最大干扰检索(MIR)和遗忘感知回放(FAR)。在严格的内存预算下($5-10\%$ 回放),FAR 表现优于其他方法,在 $5\%$ 回放率下实现了 $82.96\%$ 的平均准确率(ACC,即跨增量步骤的 $mAP_{50-95}$)。基于梯度加权的类激活映射(Grad-CAM)分析显示了在混合场景中注意力在不同类别间的转移,这与无人机定位质量的下降相关。实验进一步证明,基于回放的持续学习可以有效地应用于边缘空中系统。总体而言,本工作贡献了一个具有时间连贯性的室内无人机视频数据集,并在有限回放预算下评估了基于回放的 CIL 方法。项目页面:https://spacetime-vision-robotics-laboratory.github.io/learning-on-the-fly-cl

0
下载
关闭预览

相关内容

数据集,又称为资料集、数据集合或资料集合,是一种由数据所组成的集合。
Data set(或dataset)是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量,如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数,该数据集的数据可能包括一个或多个成员。
基于视觉的无人机定位与导航方法研究综述
专知会员服务
21+阅读 · 2025年5月21日
《无人机辅助的天空地一体化网络:学习算法技术综述》
《面向无人水面航行器的神经网络迁移学习》最新113页
专知会员服务
22+阅读 · 2025年2月16日
《面向大范围实时目标检测的蜂群侦察无人机系统》
专知会员服务
74+阅读 · 2024年2月20日
《使用强化学习的自主无人飞行器导航:综述》
专知会员服务
84+阅读 · 2023年6月18日
MaskFusion: 多运动目标实时识别、跟踪和重建
计算机视觉life
11+阅读 · 2019年4月20日
深度学习在自动驾驶感知领域的应用
AI100
11+阅读 · 2019年3月6日
无人机飞行控制方法概述
无人机
12+阅读 · 2017年10月7日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2011年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
27+阅读 · 2011年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
18+阅读 · 2011年12月31日
国家自然科学基金
24+阅读 · 2011年12月31日
国家自然科学基金
27+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员