TETO: Tracking Events with Teacher Observation for Motion Estimation and Frame Interpolation - 专知论文

会员服务 ·

0

事件 · 运动估计 · 光流 · 预训练 · 事件相机 ·

TETO: Tracking Events with Teacher Observation for Motion Estimation and Frame Interpolation

翻译：TETO: 利用教师观察跟踪事件以实现运动估计与帧插值

Jini Yang,Eunbeen Hong,Soowon Son,Hyunkoo Lee,Sunghwan Hong,Sunok Kim,Seungryong Kim

Event cameras capture per-pixel brightness changes with microsecond resolution, offering continuous motion information lost between RGB frames. However, existing event-based motion estimators depend on large-scale synthetic data that often suffers from a significant sim-to-real gap. We propose TETO (Tracking Events with Teacher Observation), a teacher-student framework that learns event motion estimation from only $\sim$25 minutes of unannotated real-world recordings through knowledge distillation from a pretrained RGB tracker. Our motion-aware data curation and query sampling strategy maximizes learning from limited data by disentangling object motion from dominant ego-motion. The resulting estimator jointly predicts point trajectories and dense optical flow, which we leverage as explicit motion priors to condition a pretrained video diffusion transformer for frame interpolation. We achieve state-of-the-art point tracking on EVIMO2 and optical flow on DSEC using orders of magnitude less training data, and demonstrate that accurate motion estimation translates directly to superior frame interpolation quality on BS-ERGB and HQ-EVFI.

翻译：事件相机以微秒级分辨率捕捉每个像素的亮度变化，提供RGB帧间丢失的连续运动信息。然而，现有基于事件的运动估计器依赖大规模合成数据，这类数据往往存在显著的仿真到真实域差距。我们提出TETO（利用教师观察跟踪事件），一种基于教师-学生框架的方法，通过从预训练的RGB跟踪器进行知识蒸馏，仅需约25分钟无标注真实世界录音即可学习事件运动估计。我们的运动感知数据整理与查询采样策略通过解耦物体运动与主导自运动，最大化从有限数据中的学习效果。所得估计器联合预测点轨迹与密集光流，我们将其作为显式运动先验条件，用于调节预训练视频扩散Transformer以实现帧插值。在使用数量级更少的训练数据条件下，我们在EVIMO2上取得顶尖的点跟踪性能，在DSEC上获得最优光流估计，并证明精准运动估计可直接转化为BS-ERGB与HQ-EVFI上更优的帧插值质量。

0

相关内容

【ICML 2026】MotiMotion：用视觉推理增强运动可控视频生成

【ICML 2026】MotiMotion：用视觉推理增强运动可控视频生成

专知会员服务

5+阅读 · 5月23日

《基于事件相机的模拟与神经网络处理在自主空中加油中的应用》最新100页

《基于事件相机的模拟与神经网络处理在自主空中加油中的应用》最新100页

专知会员服务

12+阅读 · 5月13日

【苏黎世联邦理工2022年博士论文】《视觉 SLAM 的事件驱动特征检测和跟踪》

【苏黎世联邦理工2022年博士论文】《视觉 SLAM 的事件驱动特征检测和跟踪》

专知会员服务

23+阅读 · 2022年8月11日

【AI+军事】洛马AI中心paper速读：基于深度学习的多目标跟踪、轨迹预测，Multi-Object Tracking with Deep Learning Ensemble for Unmanned Aerial System Applications

【AI+军事】洛马AI中心paper速读：基于深度学习的多目标跟踪、轨迹预测，Multi-Object Tracking with Deep Learning Ensemble for Unmanned Aerial System Applications

专知会员服务

66+阅读 · 2022年3月22日

ACL2021 | OntoED：利用本体表示学习实现低资源的事件抽取

专知会员服务

24+阅读 · 2021年6月19日

东京大学 | TrTr：基于Transformer的目标跟踪

专知会员服务

36+阅读 · 2021年5月12日

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

专知会员服务

17+阅读 · 2021年3月24日

【视频目标检测与跟踪：综述论文】Video Object Segmentation and Tracking: A Survey

专知会员服务

66+阅读 · 2020年6月4日

【IJCAI 2019 | tutorial】事件序列的时间点过程学习, Temporal Point Processes Learning for Event Sequences (附pdf)

【IJCAI 2019 | tutorial】事件序列的时间点过程学习, Temporal Point Processes Learning for Event Sequences (附pdf)

专知会员服务

48+阅读 · 2019年11月30日

【元学习 | 论文】元学习与动态记忆为基础的原型网络的小样本突发事件检测，浙江大学，阿里巴巴

【元学习 | 论文】元学习与动态记忆为基础的原型网络的小样本突发事件检测，浙江大学，阿里巴巴

专知会员服务

57+阅读 · 2019年11月21日

【KDD2020】动态知识图谱的多事件预测

【KDD2020】动态知识图谱的多事件预测

专知

88+阅读 · 2020年8月31日

论文浅尝 | 基于事理图谱的脚本事件预测

论文浅尝 | 基于事理图谱的脚本事件预测

开放知识图谱

10+阅读 · 2019年12月10日

论文浅尝 | 采用多层注意力机制的事件检测

论文浅尝 | 采用多层注意力机制的事件检测

开放知识图谱

24+阅读 · 2019年8月24日

DLI精选课程 | 用TensorRT实现视频分析部署（内文有礼）

DLI精选课程 | 用TensorRT实现视频分析部署（内文有礼）

英伟达NVIDIA中国

11+阅读 · 2019年4月26日

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

人工智能前沿讲习班

144+阅读 · 2019年3月15日

新型相机DVS/Event-based camera的发展及应用

新型相机DVS/Event-based camera的发展及应用

计算机视觉life

16+阅读 · 2019年3月12日

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

开放知识图谱

26+阅读 · 2018年11月1日

【论文推荐】最新七篇图像分割相关论文—Attention U-Net、对抗结构匹配损失、卷积CRFs、对抗样本、弱监督分割

【论文推荐】最新七篇图像分割相关论文—Attention U-Net、对抗结构匹配损失、卷积CRFs、对抗样本、弱监督分割

专知

19+阅读 · 2018年5月31日

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

专知

13+阅读 · 2018年5月26日

赛尔原创 | 基于连通图的篇章级事件抽取与相关度计算

赛尔原创 | 基于连通图的篇章级事件抽取与相关度计算

哈工大SCIR

12+阅读 · 2018年4月23日

网络公共事件图像识别与分析关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂运动场景视频大数据中异常事件检测研究

国家自然科学基金

2+阅读 · 2015年12月31日

事件驱动下信息-物理融合系统最优状态估计理论与应用研究

国家自然科学基金

1+阅读 · 2015年12月31日

视频场景下大位移运动目标的持续性跟踪方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于压缩感知的高精度实时视觉跟踪方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

面向微博数据的位置相关事件检测和时空异常聚类模式挖掘研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向事件分析的信息意图检测、建模与群体意图推理技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

运动目标间语义关系的时空建模及可视化研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于事件驱动的稀疏信号模拟数字转换器的研究

国家自然科学基金

0+阅读 · 2014年12月31日

Bidirectional Cross-Modal Prompting for Event-Frame Asymmetric Stereo

Arxiv

0+阅读 · 4月16日

Efficient Onboard Spacecraft Pose Estimation with Event Cameras and Neuromorphic Hardware

Arxiv

0+阅读 · 4月5日

Know Your Streams: On the Conceptualization, Characterization, and Generation of Intentional Event Streams

Arxiv

0+阅读 · 4月1日

TempoControl: Temporal Attention Guidance for Text-to-Video Models

Arxiv

0+阅读 · 4月1日

From Static to Dynamic: Exploring Self-supervised Image-to-Video Representation Transfer Learning

Arxiv

0+阅读 · 3月27日

TRACE: Object Motion Editing in Videos with First-Frame Trajectory Guidance

Arxiv

0+阅读 · 3月26日

Generative Event Pretraining with Foundation Model Alignment

Arxiv

0+阅读 · 3月24日

RED: Robust Event-Guided Motion Deblurring with Modality-Specific Disentanglement

Arxiv

0+阅读 · 3月6日

Motion-aware Event Suppression for Event Cameras

Arxiv

0+阅读 · 2月27日

RoEL: Robust Event-based 3D Line Reconstruction

Arxiv

0+阅读 · 2月20日

VIP会员

文章信息

相关主题

最新内容

美国从乌克兰无人机战争中学习经验

美国从乌克兰无人机战争中学习经验

专知会员服务

5+阅读 · 6月21日

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

专知会员服务

2+阅读 · 6月21日

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

专知会员服务

2+阅读 · 6月21日

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

13+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

5+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

8+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

7+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

9+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

12+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

12+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

8+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

13+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

9+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

22+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

11+阅读 · 6月17日

相关VIP内容

【ICML 2026】MotiMotion：用视觉推理增强运动可控视频生成

【ICML 2026】MotiMotion：用视觉推理增强运动可控视频生成

专知会员服务

5+阅读 · 5月23日

《基于事件相机的模拟与神经网络处理在自主空中加油中的应用》最新100页

《基于事件相机的模拟与神经网络处理在自主空中加油中的应用》最新100页

专知会员服务

12+阅读 · 5月13日

【苏黎世联邦理工2022年博士论文】《视觉 SLAM 的事件驱动特征检测和跟踪》

【苏黎世联邦理工2022年博士论文】《视觉 SLAM 的事件驱动特征检测和跟踪》

专知会员服务

23+阅读 · 2022年8月11日

【AI+军事】洛马AI中心paper速读：基于深度学习的多目标跟踪、轨迹预测，Multi-Object Tracking with Deep Learning Ensemble for Unmanned Aerial System Applications

【AI+军事】洛马AI中心paper速读：基于深度学习的多目标跟踪、轨迹预测，Multi-Object Tracking with Deep Learning Ensemble for Unmanned Aerial System Applications

专知会员服务

66+阅读 · 2022年3月22日

ACL2021 | OntoED：利用本体表示学习实现低资源的事件抽取

专知会员服务

24+阅读 · 2021年6月19日

东京大学 | TrTr：基于Transformer的目标跟踪

专知会员服务

36+阅读 · 2021年5月12日

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

【CVPR2021】Transformer遇见跟踪器：利用时间上下文进行视觉追踪

专知会员服务

17+阅读 · 2021年3月24日

【视频目标检测与跟踪：综述论文】Video Object Segmentation and Tracking: A Survey

专知会员服务

66+阅读 · 2020年6月4日

【IJCAI 2019 | tutorial】事件序列的时间点过程学习, Temporal Point Processes Learning for Event Sequences (附pdf)

【IJCAI 2019 | tutorial】事件序列的时间点过程学习, Temporal Point Processes Learning for Event Sequences (附pdf)

专知会员服务

48+阅读 · 2019年11月30日

【元学习 | 论文】元学习与动态记忆为基础的原型网络的小样本突发事件检测，浙江大学，阿里巴巴

【元学习 | 论文】元学习与动态记忆为基础的原型网络的小样本突发事件检测，浙江大学，阿里巴巴

专知会员服务

57+阅读 · 2019年11月21日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | 面向视觉语言模型的语义鲁棒性认证

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

美国从乌克兰无人机战争中学习经验

综述 | 智能体电子设计自动化：从“交接有效性”重新理解Agentic EDA

相关资讯

【KDD2020】动态知识图谱的多事件预测

【KDD2020】动态知识图谱的多事件预测

专知

88+阅读 · 2020年8月31日

论文浅尝 | 基于事理图谱的脚本事件预测

论文浅尝 | 基于事理图谱的脚本事件预测

开放知识图谱

10+阅读 · 2019年12月10日

论文浅尝 | 采用多层注意力机制的事件检测

论文浅尝 | 采用多层注意力机制的事件检测

开放知识图谱

24+阅读 · 2019年8月24日

DLI精选课程 | 用TensorRT实现视频分析部署（内文有礼）

DLI精选课程 | 用TensorRT实现视频分析部署（内文有礼）

英伟达NVIDIA中国

11+阅读 · 2019年4月26日

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

人工智能前沿讲习班

144+阅读 · 2019年3月15日

新型相机DVS/Event-based camera的发展及应用

新型相机DVS/Event-based camera的发展及应用

计算机视觉life

16+阅读 · 2019年3月12日

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

论文浅尝 | Zero-Shot Transfer Learning for Event Extraction

开放知识图谱

26+阅读 · 2018年11月1日

【论文推荐】最新七篇图像分割相关论文—Attention U-Net、对抗结构匹配损失、卷积CRFs、对抗样本、弱监督分割

【论文推荐】最新七篇图像分割相关论文—Attention U-Net、对抗结构匹配损失、卷积CRFs、对抗样本、弱监督分割

专知

19+阅读 · 2018年5月31日

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

【论文推荐】最新十篇目标跟踪相关论文—多帧光流跟踪、动态图学习、MV-YOLO、姿态估计、深度核相关滤波、Benchmark

专知

13+阅读 · 2018年5月26日

赛尔原创 | 基于连通图的篇章级事件抽取与相关度计算

赛尔原创 | 基于连通图的篇章级事件抽取与相关度计算

哈工大SCIR

12+阅读 · 2018年4月23日

相关论文

Bidirectional Cross-Modal Prompting for Event-Frame Asymmetric Stereo

Arxiv

0+阅读 · 4月16日

Efficient Onboard Spacecraft Pose Estimation with Event Cameras and Neuromorphic Hardware

Arxiv

0+阅读 · 4月5日

Know Your Streams: On the Conceptualization, Characterization, and Generation of Intentional Event Streams

Arxiv

0+阅读 · 4月1日

TempoControl: Temporal Attention Guidance for Text-to-Video Models

Arxiv

0+阅读 · 4月1日

From Static to Dynamic: Exploring Self-supervised Image-to-Video Representation Transfer Learning

Arxiv

0+阅读 · 3月27日

TRACE: Object Motion Editing in Videos with First-Frame Trajectory Guidance

Arxiv

0+阅读 · 3月26日

Generative Event Pretraining with Foundation Model Alignment

Arxiv

0+阅读 · 3月24日

RED: Robust Event-Guided Motion Deblurring with Modality-Specific Disentanglement

Arxiv

0+阅读 · 3月6日

Motion-aware Event Suppression for Event Cameras

Arxiv

0+阅读 · 2月27日

RoEL: Robust Event-based 3D Line Reconstruction

Arxiv

0+阅读 · 2月20日

相关基金

网络公共事件图像识别与分析关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

复杂运动场景视频大数据中异常事件检测研究

国家自然科学基金

2+阅读 · 2015年12月31日

事件驱动下信息-物理融合系统最优状态估计理论与应用研究

国家自然科学基金

1+阅读 · 2015年12月31日

视频场景下大位移运动目标的持续性跟踪方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于压缩感知的高精度实时视觉跟踪方法研究

国家自然科学基金

4+阅读 · 2015年12月31日

面向社交大数据的热点事件预测

国家自然科学基金

11+阅读 · 2015年12月31日

面向微博数据的位置相关事件检测和时空异常聚类模式挖掘研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向事件分析的信息意图检测、建模与群体意图推理技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

运动目标间语义关系的时空建模及可视化研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于事件驱动的稀疏信号模拟数字转换器的研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员