Reasoning over sports videos for question answering is an important task with numerous applications, such as player training and information retrieval. However, this task has not been explored due to the lack of relevant datasets and the challenging nature it presents. Most datasets for video question answering (VideoQA) focus mainly on general and coarse-grained understanding of daily-life videos, which is not applicable to sports scenarios requiring professional action understanding and fine-grained motion analysis. In this paper, we introduce the first dataset, named Sports-QA, specifically designed for the sports VideoQA task. The Sports-QA dataset includes various types of questions, such as descriptions, chronologies, causalities, and counterfactual conditions, covering multiple sports. Furthermore, to address the characteristics of the sports VideoQA task, we propose a new Auto-Focus Transformer (AFT) capable of automatically focusing on particular scales of temporal information for question answering. We conduct extensive experiments on Sports-QA, including baseline studies and the evaluation of different methods. The results demonstrate that our AFT achieves state-of-the-art performance.


翻译:基于体育视频进行推理问答是一项具有重要应用价值(如运动员训练和信息检索)的任务。然而,由于缺乏相关数据集及其固有的挑战性,该任务尚未得到充分探索。现有的大多数视频问答数据集主要关注对日常生活视频的通用、粗粒度理解,难以适用于需要专业动作理解和细粒度运动分析的体育场景。本文首次提出了专门针对体育视频问答任务的数据集,命名为Sports-QA。该数据集涵盖多种体育项目,包含描述类、时序类、因果类及反事实条件类等多种问题类型。此外,为适应体育视频问答任务的特点,我们提出了一种新型自动聚焦Transformer模型,能够自动聚焦于特定尺度的时间信息以进行问答。我们在Sports-QA上进行了大量实验,包括基线研究及多种方法的评估。结果表明,所提出的AFT模型取得了最先进的性能。

0
下载
关闭预览

相关内容

体育,又称体育运动或简称运动,是人们遵循人体的生长发育规律和身体的活动规律,通过身体锻炼、技术、训练、竞技比赛等方式达到增强体质,提高运动技术水平,丰富文化生活为目的的社会活动。 「体育」原指在学校中开展的一项促进参与者身体发展的教学活动,现在由于其广泛使用,在日常生活中已不再和运动一词做明显区分。
Video-LMM后训练:多模态大模型的视频推理深度解析
专知会员服务
14+阅读 · 2025年10月7日
【CVPR2024】Koala: 关键帧条件化长视频语言模型
专知会员服务
13+阅读 · 2024年4月21日
【CVPR2024】MoReVQA:探索视频问答的模块化推理模型
专知会员服务
18+阅读 · 2024年4月10日
深度学习在体育应用中的研究概览:感知、理解和决策
专知会员服务
39+阅读 · 2023年7月17日
【AI+体育】机器学习在体育应用概述
专知会员服务
38+阅读 · 2022年4月17日
专知会员服务
32+阅读 · 2021年3月17日
【优青论文】视觉问答技术研究
计算机研究与发展
13+阅读 · 2018年9月21日
Google & CMU:62页PPT带你理解QANet(附下载链接)
机器学习算法与Python学习
13+阅读 · 2018年7月19日
问答系统冠军之路:用CNN做问答任务的QANet
AI科技评论
18+阅读 · 2018年5月11日
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
9+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员