Egocentric Natural Language Query (NLQ) grounding asks a model to localize, in a long first-person video, the temporal interval that answers a free-form text query. Existing methods fuse video appearance with the query but ignore hand motion, despite the fact that roughly 41% of Ego4D NLQ queries are answered at a moment of hand--object manipulation or their immediate outcomes.We propose a hand-trajectory encoder for converting a sequence of hand skeletons into highly-semantic hand kinematic features, which are then aligned and combined with pretrained video--text features through a cross-attention fusion strategy with adaptive gating. On the Ego4D NLQ v2 validation split, the clearest gains appear for Hand-Object Interaction queries (+2.54 R1@IoU=0.3) and Quantity/State queries (+4.32 R1@IoU=0.3), indicating that hand trajectory provides grounding cues beyond appearance alone.


翻译:自我中心自然语言查询(NLQ)定位任务要求模型在长时第一人称视频中定位出回答自由形式文本查询的时间区间。现有方法将视频外观与查询进行融合,但忽略了手部运动——尽管在Ego4D NLQ查询中,约有41%的答案出现在手-物交互操作或其即时结果中。我们提出一种手部轨迹编码器,可将手部骨架序列转换为高语义的手部运动学特征,随后通过带自适应门控的交叉注意力融合策略,将这些特征与预训练的视频-文本特征进行对齐与组合。在Ego4D NLQ v2验证集上,手-物交互查询(R1@IoU=0.3提升+2.54)和数量/状态查询(R1@IoU=0.3提升+4.32)的改进最为显著,表明手部轨迹能提供超越外观的定位线索。

0
下载
关闭预览

相关内容

南洋理工最新《视频自然语言定位》2022综述
专知会员服务
25+阅读 · 2022年1月29日
专知会员服务
65+阅读 · 2021年5月29日
基于深度学习的手语识别综述
专知会员服务
47+阅读 · 2020年5月18日
学习自然语言处理路线图
专知会员服务
140+阅读 · 2019年9月24日
金融领域自然语言处理研究资源大列表
专知
13+阅读 · 2020年2月27日
中文自然语言处理相关资料集合指南
专知
18+阅读 · 2019年3月10日
TextInfoExp:自然语言处理相关实验(基于sougou数据集)
全球人工智能
12+阅读 · 2017年11月12日
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
0+阅读 · 5月29日
VIP会员
最新内容
美国从乌克兰无人机战争中学习经验
专知会员服务
6+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
2+阅读 · 6月21日
学习数据的几何:形状空间分析数学综述
专知会员服务
9+阅读 · 6月17日
定向能反无人机系统最新发展动态
专知会员服务
11+阅读 · 6月17日
相关基金
国家自然科学基金
3+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员