表格结构识别(TSR)旨在将表格图像转换为机器可读格式,其中视觉编码器提取图像特征,文本解码器生成代表表格的令牌。现有方法使用经典的卷积神经网络(CNN)主干作为视觉编码器,以及Transformer作为文本解码器。然而,这种混合的CNN-Transformer架构引入了一个复杂的视觉编码器,占据了模型总参数近一半,显著降低了训练和推理速度,并阻碍了TSR中自监督学习的潜力。在这项工作中,我们设计了一个轻量级的视觉编码器用于TSR,同时不牺牲表现力。我们发现,一个卷积干可以匹配经典CNN主干的性能,而模型更简单。卷积干在两个关键因素之间达到了最佳平衡,这两个因素对于高性能TSR至关重要:更高的接收域(RF)比率和更长的序列长度。这使得它能够“看到”表格的适当部分,并为后续的Transformer“存储”复杂的表格结构,提供足够的上下文长度。我们进行了可重现的消融研究,并在 https://github.com/poloclub/tsr-convstem 上开源了我们的代码,以提高透明度,激发创新,并在我们的领域内促进公平的比较,因为表格是表示学习的有前景的模态。

成为VIP会员查看完整内容
27

相关内容

【NeurIPS2023】稀疏保留的差分隐私大型嵌入模型训练
专知会员服务
15+阅读 · 2023年11月18日
【CVPR2022】语言引导与基于视觉的深度度量学习的集成
专知会员服务
17+阅读 · 2022年3月17日
【CVPR2022】弱监督目标定位建模为领域适应
专知会员服务
17+阅读 · 2022年3月4日
专知会员服务
13+阅读 · 2021年10月11日
专知会员服务
38+阅读 · 2021年4月25日
【SIGIR2021】基于嵌入的增量式时序知识图谱补全框架
专知会员服务
63+阅读 · 2021年4月21日
专知会员服务
20+阅读 · 2020年3月29日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Arxiv
0+阅读 · 2023年12月27日
Arxiv
176+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
501+阅读 · 2023年3月31日
Arxiv
69+阅读 · 2022年9月7日
VIP会员
最新内容
ICML 2026 | CFPO:用反事实策略优化提升多模态推理
专知会员服务
1+阅读 · 今天14:45
综述 | 世界动作模型:少做梦,多行动
专知会员服务
1+阅读 · 今天14:43
美以伊冲突:无人机与人工智能的运用
专知会员服务
3+阅读 · 今天14:31
《特种部队在透明战场中的生存力》最新报告
专知会员服务
2+阅读 · 今天14:11
《人工智能生成的零日漏洞:对未来作战的影响》
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
8+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
相关VIP内容
【NeurIPS2023】稀疏保留的差分隐私大型嵌入模型训练
专知会员服务
15+阅读 · 2023年11月18日
【CVPR2022】语言引导与基于视觉的深度度量学习的集成
专知会员服务
17+阅读 · 2022年3月17日
【CVPR2022】弱监督目标定位建模为领域适应
专知会员服务
17+阅读 · 2022年3月4日
专知会员服务
13+阅读 · 2021年10月11日
专知会员服务
38+阅读 · 2021年4月25日
【SIGIR2021】基于嵌入的增量式时序知识图谱补全框架
专知会员服务
63+阅读 · 2021年4月21日
专知会员服务
20+阅读 · 2020年3月29日
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
18+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2016年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
相关论文
微信扫码咨询专知VIP会员