It's a Matter of Time: Three Lessons on Long-Term Motion for Perception - 专知论文

会员服务 ·

0

运动表征 · 视频 · 图像信息 · 知识 · 视觉学习 ·

It's a Matter of Time: Three Lessons on Long-Term Motion for Perception

翻译：时间的重要性：长期运动对感知的三点启示

Willem Davison,Xinyue Hao,Laura Sevilla-Lara

Temporal information has long been considered to be essential for perception. While there is extensive research on the role of image information for perceptual tasks, the role of the temporal dimension remains less well understood: What can we learn about the world from long-term motion information? What properties does long-term motion information have for visual learning? We leverage recent success in point-track estimation, which offers an excellent opportunity to learn temporal representations and experiment on a variety of perceptual tasks. We draw 3 clear lessons: 1) Long-term motion representations contain information to understand actions, but also objects, materials, and spatial information, often even better than images. 2) Long-term motion representations generalize far better than image representations in low-data settings and in zero-shot tasks. 3) The very low dimensionality of motion information makes motion representations a better trade-off between GFLOPs and accuracy than standard video representations, and used together they achieve higher performance than video representations alone. We hope these insights will pave the way for the design of future models that leverage the power of long-term motion information for perception.

翻译：长期以来，时间信息一直被认为是感知的关键要素。尽管已有大量研究探讨图像信息在感知任务中的作用，但时间维度的作用仍未被充分理解：我们能从长期运动信息中获取关于世界的何种知识？长期运动信息对视觉学习具有哪些特性？我们借助近期在点轨迹估计方面取得的成功——这为学习时序表征提供了绝佳机会——在多种感知任务上进行了实验。我们得出三点明确结论：1）长期运动表征不仅包含理解动作的信息，还能表征物体、材质及空间信息，其效果通常甚至优于图像。2）在低数据场景和零样本任务中，长期运动表征的泛化能力远强于图像表征。3）运动信息的极低维度特性使其在GFLOPs与精度之间取得了比标准视频表征更优的平衡，二者结合使用时能达到比单独使用视频表征更高的性能。我们希望这些发现能为未来模型的设计指明方向，以充分发挥长期运动信息在感知任务中的潜力。

0

相关内容

运动表征

稀疏点云感知的表示学习

稀疏点云感知的表示学习

专知会员服务

9+阅读 · 2月9日

【博士论文】视频理解：时间维度的深度透视

【博士论文】视频理解：时间维度的深度透视

专知会员服务

7+阅读 · 2月5日

【博士论文】视觉处理中的时域适应：人类与视觉模型带来的启示

【博士论文】视觉处理中的时域适应：人类与视觉模型带来的启示

专知会员服务

32+阅读 · 1月29日

《通用时间序列表示学习》最新2024综述

《通用时间序列表示学习》最新2024综述

专知会员服务

61+阅读 · 2024年1月15日

大模型如何建模时序？莫纳什阿里等最新《面向时间序列和时空数据的大型模型》综述与展望

大模型如何建模时序？莫纳什阿里等最新《面向时间序列和时空数据的大型模型》综述与展望

专知会员服务

85+阅读 · 2023年10月22日

时序知识图谱表示学习

时序知识图谱表示学习

专知会员服务

154+阅读 · 2022年9月17日

【TPAMI2022-清华】OANet：基于层次结构的图神经网络来学习两视图几何匹配关系建立

【TPAMI2022-清华】OANet：基于层次结构的图神经网络来学习两视图几何匹配关系建立

专知会员服务

28+阅读 · 2022年5月30日

【AAAI2021】从历史中学习：利用时间感知拷贝生成网络建模时态知识图谱

专知会员服务

26+阅读 · 2021年2月20日

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

专知会员服务

68+阅读 · 2020年11月9日

Time2Vec：学习时间的向量表示，Time2Vec: Learning a Vector Representation of Time

Time2Vec：学习时间的向量表示，Time2Vec: Learning a Vector Representation of Time

专知会员服务

36+阅读 · 2020年5月10日

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

会议交流 | 盘点知识图谱的10大热点趋势与实践探索——DataFunSummit 2022 知识图谱在线峰会

会议交流 | 盘点知识图谱的10大热点趋势与实践探索——DataFunSummit 2022 知识图谱在线峰会

开放知识图谱

13+阅读 · 2022年3月8日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

【论文笔记】通过自注意力网络的动态图表示学习

【论文笔记】通过自注意力网络的动态图表示学习

专知

90+阅读 · 2019年12月2日

三维感知与三维数据分析最新进展 - 3D传感&人工智能前沿科技论坛

三维感知与三维数据分析最新进展 - 3D传感&人工智能前沿科技论坛

AI科技评论

10+阅读 · 2019年2月2日

SkeletonNet：完整的人体三维位姿重建方法

SkeletonNet：完整的人体三维位姿重建方法

计算机视觉life

21+阅读 · 2019年1月21日

具身认知学习环境设计：特征、要素、应用及发展趋势

具身认知学习环境设计：特征、要素、应用及发展趋势

MOOC

10+阅读 · 2018年10月30日

交互设计理论：视觉感知、认知摩擦、认知负荷和情境认知

交互设计理论：视觉感知、认知摩擦、认知负荷和情境认知

人人都是产品经理

20+阅读 · 2018年5月10日

论文浅尝 | Know-Evolve: Deep Temporal Reasoning for Dynamic KG

论文浅尝 | Know-Evolve: Deep Temporal Reasoning for Dynamic KG

开放知识图谱

36+阅读 · 2018年3月30日

【深度学习】深度学习的核心：掌握训练数据的方法

【深度学习】深度学习的核心：掌握训练数据的方法

产业智能官

12+阅读 · 2018年1月14日

一些流体力学方程的长时间动力学行为

国家自然科学基金

0+阅读 · 2017年12月31日

社会化媒体上信息时空传播的可视分析

国家自然科学基金

0+阅读 · 2015年12月31日

视知觉学习中的脑功能网络变化及其与学习效果的关系

国家自然科学基金

0+阅读 · 2015年12月31日

儿童手写运动促进中英文感知的认知神经机制

国家自然科学基金

0+阅读 · 2015年12月31日

视觉质量感知的脑电时空特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于连续波四相位法的飞行时间(TOF)三维成像图像传感器研究

国家自然科学基金

1+阅读 · 2015年12月31日

无线认知传感器网络中时空相关频谱感知算法研究

国家自然科学基金

2+阅读 · 2015年12月31日

知觉学习影响视觉刺激显著性的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

运动目标间语义关系的时空建模及可视化研究

国家自然科学基金

1+阅读 · 2014年12月31日

动态网络中信息传播时间的理论分析与跨层算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

OmniStream: Mastering Perception, Reconstruction and Action in Continuous Streams

Arxiv

0+阅读 · 3月12日

Learning the action for long-time-step simulations of molecular dynamics

Arxiv

0+阅读 · 3月6日

TPK: Trustworthy Trajectory Prediction Integrating Prior Knowledge For Interpretability and Kinematic Feasibility

Arxiv

0+阅读 · 3月4日

FuXi-Linear: Unleashing the Power of Linear Attention in Long-term Time-aware Sequential Recommendation

Arxiv

0+阅读 · 2月27日

Learning Situated Awareness in the Real World

Arxiv

0+阅读 · 2月18日

Learning Proposes, Geometry Disposes: A Modular Framework for Efficient Spatial Reasoning

Arxiv

0+阅读 · 2月16日

Usage Matters: The Role of Frequency, Duration, and Experience in Presence Formation in Social Virtual Reality

Arxiv

0+阅读 · 2月13日

Temporal Slowness in Central Vision Drives Semantic Object Learning

Arxiv

0+阅读 · 2月4日

Universal Time-Series Representation Learning: A Survey

Arxiv

10+阅读 · 2024年1月8日

A Survey on Temporal Knowledge Graph Completion: Taxonomy, Progress, and Prospects

Arxiv

11+阅读 · 2023年8月4日

VIP会员

文章信息

相关主题

最新内容

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

0+阅读 · 11分钟前

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

0+阅读 · 15分钟前

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

2+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

4+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

7+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

4+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

7+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

5+阅读 · 6月23日

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

3+阅读 · 6月23日

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

6+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

8+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

6+阅读 · 6月22日

相关VIP内容

稀疏点云感知的表示学习

稀疏点云感知的表示学习

专知会员服务

9+阅读 · 2月9日

【博士论文】视频理解：时间维度的深度透视

【博士论文】视频理解：时间维度的深度透视

专知会员服务

7+阅读 · 2月5日

【博士论文】视觉处理中的时域适应：人类与视觉模型带来的启示

【博士论文】视觉处理中的时域适应：人类与视觉模型带来的启示

专知会员服务

32+阅读 · 1月29日

《通用时间序列表示学习》最新2024综述

《通用时间序列表示学习》最新2024综述

专知会员服务

61+阅读 · 2024年1月15日

大模型如何建模时序？莫纳什阿里等最新《面向时间序列和时空数据的大型模型》综述与展望

大模型如何建模时序？莫纳什阿里等最新《面向时间序列和时空数据的大型模型》综述与展望

专知会员服务

85+阅读 · 2023年10月22日

时序知识图谱表示学习

时序知识图谱表示学习

专知会员服务

154+阅读 · 2022年9月17日

【TPAMI2022-清华】OANet：基于层次结构的图神经网络来学习两视图几何匹配关系建立

【TPAMI2022-清华】OANet：基于层次结构的图神经网络来学习两视图几何匹配关系建立

专知会员服务

28+阅读 · 2022年5月30日

【AAAI2021】从历史中学习：利用时间感知拷贝生成网络建模时态知识图谱

专知会员服务

26+阅读 · 2021年2月20日

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

【牛津大学BoYang博士论文】学习重建和分割三维物体，143页pdf

专知会员服务

68+阅读 · 2020年11月9日

Time2Vec：学习时间的向量表示，Time2Vec: Learning a Vector Representation of Time

Time2Vec：学习时间的向量表示，Time2Vec: Learning a Vector Representation of Time

专知会员服务

36+阅读 · 2020年5月10日

热门VIP内容

开通专知VIP会员享更多权益服务

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

军事欺骗：供作战战术指挥官使用的工具

综述 | 世界动作模型：少做梦，多行动

相关资讯

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

【干货书】基于统计和机器学习的实用时间序列分析预测，Time Series Analysis Prediction

专知

18+阅读 · 2022年4月9日

会议交流 | 盘点知识图谱的10大热点趋势与实践探索——DataFunSummit 2022 知识图谱在线峰会

会议交流 | 盘点知识图谱的10大热点趋势与实践探索——DataFunSummit 2022 知识图谱在线峰会

开放知识图谱

13+阅读 · 2022年3月8日

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

知识图谱|最近三年知识图谱在动态以及时间预测与补全上必读的6篇论文（收藏一下）

AINLP

75+阅读 · 2020年1月14日

【论文笔记】通过自注意力网络的动态图表示学习

【论文笔记】通过自注意力网络的动态图表示学习

专知

90+阅读 · 2019年12月2日

三维感知与三维数据分析最新进展 - 3D传感&人工智能前沿科技论坛

三维感知与三维数据分析最新进展 - 3D传感&人工智能前沿科技论坛

AI科技评论

10+阅读 · 2019年2月2日

SkeletonNet：完整的人体三维位姿重建方法

SkeletonNet：完整的人体三维位姿重建方法

计算机视觉life

21+阅读 · 2019年1月21日

具身认知学习环境设计：特征、要素、应用及发展趋势

具身认知学习环境设计：特征、要素、应用及发展趋势

MOOC

10+阅读 · 2018年10月30日

交互设计理论：视觉感知、认知摩擦、认知负荷和情境认知

交互设计理论：视觉感知、认知摩擦、认知负荷和情境认知

人人都是产品经理

20+阅读 · 2018年5月10日

论文浅尝 | Know-Evolve: Deep Temporal Reasoning for Dynamic KG

论文浅尝 | Know-Evolve: Deep Temporal Reasoning for Dynamic KG

开放知识图谱

36+阅读 · 2018年3月30日

【深度学习】深度学习的核心：掌握训练数据的方法

【深度学习】深度学习的核心：掌握训练数据的方法

产业智能官

12+阅读 · 2018年1月14日

相关论文

OmniStream: Mastering Perception, Reconstruction and Action in Continuous Streams

Arxiv

0+阅读 · 3月12日

Learning the action for long-time-step simulations of molecular dynamics

Arxiv

0+阅读 · 3月6日

TPK: Trustworthy Trajectory Prediction Integrating Prior Knowledge For Interpretability and Kinematic Feasibility

Arxiv

0+阅读 · 3月4日

FuXi-Linear: Unleashing the Power of Linear Attention in Long-term Time-aware Sequential Recommendation

Arxiv

0+阅读 · 2月27日

Learning Situated Awareness in the Real World

Arxiv

0+阅读 · 2月18日

Learning Proposes, Geometry Disposes: A Modular Framework for Efficient Spatial Reasoning

Arxiv

0+阅读 · 2月16日

Usage Matters: The Role of Frequency, Duration, and Experience in Presence Formation in Social Virtual Reality

Arxiv

0+阅读 · 2月13日

Temporal Slowness in Central Vision Drives Semantic Object Learning

Arxiv

0+阅读 · 2月4日

Universal Time-Series Representation Learning: A Survey

Arxiv

10+阅读 · 2024年1月8日

A Survey on Temporal Knowledge Graph Completion: Taxonomy, Progress, and Prospects

Arxiv

11+阅读 · 2023年8月4日

相关基金

一些流体力学方程的长时间动力学行为

国家自然科学基金

0+阅读 · 2017年12月31日

社会化媒体上信息时空传播的可视分析

国家自然科学基金

0+阅读 · 2015年12月31日

视知觉学习中的脑功能网络变化及其与学习效果的关系

国家自然科学基金

0+阅读 · 2015年12月31日

儿童手写运动促进中英文感知的认知神经机制

国家自然科学基金

0+阅读 · 2015年12月31日

视觉质量感知的脑电时空特性研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于连续波四相位法的飞行时间(TOF)三维成像图像传感器研究

国家自然科学基金

1+阅读 · 2015年12月31日

无线认知传感器网络中时空相关频谱感知算法研究

国家自然科学基金

2+阅读 · 2015年12月31日

知觉学习影响视觉刺激显著性的神经机制

国家自然科学基金

1+阅读 · 2015年12月31日

运动目标间语义关系的时空建模及可视化研究

国家自然科学基金

1+阅读 · 2014年12月31日

动态网络中信息传播时间的理论分析与跨层算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员