The main progress for action segmentation comes from densely-annotated data for fully-supervised learning. Since manual annotation for frame-level actions is time-consuming and challenging, we propose to exploit auxiliary unlabeled videos, which are much easier to obtain, by shaping this problem as a domain adaptation (DA) problem. Although various DA techniques have been proposed in recent years, most of them have been developed only for the spatial direction. Therefore, we propose Mixed Temporal Domain Adaptation (MTDA) to jointly align frame- and video-level embedded feature spaces across domains, and further integrate with the domain attention mechanism to focus on aligning the frame-level features with higher domain discrepancy, leading to more effective domain adaptation. Finally, we evaluate our proposed methods on three challenging datasets (GTEA, 50Salads, and Breakfast), and validate that MTDA outperforms the current state-of-the-art methods on all three datasets by large margins (e.g. 6.4% gain on F1@50 and 6.8% gain on the edit score for GTEA).


翻译:行动分解的主要进展来自用于完全监督的学习的密集加注数据。 由于框架一级行动的人工说明耗费时间且具有挑战性,我们提议利用辅助性无标签视频,通过将这一问题作为一个领域适应(DA)问题来形成,这些视频更容易获得。虽然近年来提出了各种指定国家技术,但大多数都是为空间方向而开发的。因此,我们提议混合时空域适应(MTDA)联合调整跨域的框架和视频级嵌入功能空间,并进一步与域关注机制整合,侧重于使框架一级特征与更高域差异保持一致,从而更有效地进行域适应。最后,我们评估了我们提议的关于三个挑战性数据集的方法(GTEA、50Salads和Mreatef),并证实MTDA通过大利润率(例如F1@50的6.4%收益和GTEA的编辑得分6.8%)。

0
下载
关闭预览

相关内容

深度学习自然语言处理概述,216页ppt,Jindřich Helcl
专知会员服务
216+阅读 · 2020年4月26日
【深度学习视频分析/多模态学习资源大列表】
专知会员服务
92+阅读 · 2019年10月16日
已删除
将门创投
3+阅读 · 2019年5月6日
VIP会员
最新内容
《系统簇式多域作战规划范畴论框架》
专知会员服务
5+阅读 · 4月20日
高效视频扩散模型:进展与挑战
专知会员服务
2+阅读 · 4月20日
乌克兰前线的五项创新
专知会员服务
7+阅读 · 4月20日
 军事通信系统与设备的技术演进综述
专知会员服务
5+阅读 · 4月20日
《北约标准:医疗评估手册》174页
专知会员服务
5+阅读 · 4月20日
《提升生成模型的安全性与保障》博士论文
专知会员服务
5+阅读 · 4月20日
美国当前高超音速导弹发展概述
专知会员服务
4+阅读 · 4月19日
相关资讯
已删除
将门创投
3+阅读 · 2019年5月6日
Top
微信扫码咨询专知VIP会员