SciPostLayoutTree: A Dataset for Structural Analysis of Scientific Posters - 专知论文

会员服务 ·

0

分析 · 结构 · 结构分析 · 数据集 · 包含 ·

SciPostLayoutTree: A Dataset for Structural Analysis of Scientific Posters

翻译：SciPostLayoutTree：用于科学海报结构分析的数据集

Shohei Tanaka,Atsushi Hashimoto,Yoshitaka Ushiku

Scientific posters play a vital role in academic communication by presenting ideas through visual summaries. Analyzing reading order and parent-child relations of posters is essential for building structure-aware interfaces that facilitate clear and accurate understanding of research content. Despite their prevalence in academic communication, posters remain underexplored in structural analysis research, which has primarily focused on papers. To address this gap, we constructed SciPostLayoutTree, a dataset of approximately 8,000 posters annotated with reading order and parent-child relations. Compared to an existing structural analysis dataset, SciPostLayoutTree contains more instances of spatially challenging relations, including upward, horizontal, and long-distance relations. As a solution to these challenges, we develop Layout Tree Decoder, which incorporates visual features as well as bounding box features including position and category information. The model also uses beam search to predict relations while capturing sequence-level plausibility. Experimental results demonstrate that our model improves the prediction accuracy for spatially challenging relations and establishes a solid baseline for poster structure analysis. The dataset is publicly available at https://huggingface.co/datasets/omron-sinicx/scipostlayouttree. The code is also publicly available at https://github.com/omron-sinicx/scipostlayouttree.

翻译：科学海报通过视觉摘要呈现研究思想，在学术交流中发挥着至关重要的作用。分析海报的阅读顺序与父子关系对于构建结构感知界面至关重要，这类界面有助于清晰准确地理解研究内容。尽管海报在学术交流中极为普遍，但在结构分析研究中却仍未得到充分探索，该领域主要集中于论文分析。为填补这一空白，我们构建了SciPostLayoutTree数据集，其中包含约8,000张标注了阅读顺序与父子关系的海报。与现有结构分析数据集相比，SciPostLayoutTree包含了更多空间关系具有挑战性的实例，包括向上、水平及长距离关系。针对这些挑战，我们开发了Layout Tree Decoder，该模型不仅融合了视觉特征，还整合了包含位置与类别信息的边界框特征。该模型同时采用束搜索算法在预测关系时捕获序列层面的合理性。实验结果表明，我们的模型提升了空间挑战性关系的预测准确率，并为海报结构分析建立了坚实的基线。数据集公开发布于https://huggingface.co/datasets/omron-sinicx/scipostlayouttree。代码亦公开于https://github.com/omron-sinicx/scipostlayouttree。

0

相关内容

《军事场景中的视觉分析探索》2023最新124页技术报告

《军事场景中的视觉分析探索》2023最新124页技术报告

专知会员服务

83+阅读 · 2023年3月2日

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

专知会员服务

52+阅读 · 2022年8月24日

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

专知会员服务

42+阅读 · 2022年7月7日

最新《图像描述Image Captioning》综述论文，22页pdf220篇文献

专知会员服务

43+阅读 · 2021年7月17日

中科院《科学结构图谱2021》白皮书报告，126页pdf

专知会员服务

66+阅读 · 2021年7月4日

【2020关键词提取】医学报告的关键词提取和结构化，Keyword extraction and structuralization of medical reports

【2020关键词提取】医学报告的关键词提取和结构化，Keyword extraction and structuralization of medical reports

专知会员服务

33+阅读 · 2020年5月2日

深度学习图像分割综述论文最新版，Image Segmentation Using Deep Learning: A Survey

深度学习图像分割综述论文最新版，Image Segmentation Using Deep Learning: A Survey

专知会员服务

93+阅读 · 2020年4月11日

【AAAI2020】知识图谱表示，获取和应用的综述 25页PDF A Survey on Knowledge Graphs: Representation, Acquisition and Applications

【AAAI2020】知识图谱表示，获取和应用的综述 25页PDF A Survey on Knowledge Graphs: Representation, Acquisition and Applications

专知会员服务

95+阅读 · 2020年3月29日

【报告推荐】三维及超形体分析中的几何与数据学习（Geometry and Learning from Data in 3D and Beyond - Shape Analysis）

【报告推荐】三维及超形体分析中的几何与数据学习（Geometry and Learning from Data in 3D and Beyond - Shape Analysis）

专知会员服务

23+阅读 · 2019年11月10日

从知识表示发展历史理解知识图谱，中科院自动化所模式识别国家重点实验室何世柱副研究员，第八届全国社会媒体处理大会SMP2019

从知识表示发展历史理解知识图谱，中科院自动化所模式识别国家重点实验室何世柱副研究员，第八届全国社会媒体处理大会SMP2019

专知会员服务

78+阅读 · 2019年10月24日

论文浅尝 | MCCLK: 一个用于知识感知推荐的多层次的交叉视图对比框架

论文浅尝 | MCCLK: 一个用于知识感知推荐的多层次的交叉视图对比框架

开放知识图谱

10+阅读 · 2022年8月8日

【干货书】数据科学手册，456页pdf

【干货书】数据科学手册，456页pdf

专知

15+阅读 · 2021年4月28日

【数据集】OCR_DataSet：有关OCR的数据集并统一标注格式

【数据集】OCR_DataSet：有关OCR的数据集并统一标注格式

AINLP

18+阅读 · 2020年4月10日

最新！知识图谱研究综述论文: 表示学习、知识获取与应用，25页pdf详述Knowledge Graphs技术趋势

最新！知识图谱研究综述论文: 表示学习、知识获取与应用，25页pdf详述Knowledge Graphs技术趋势

专知

91+阅读 · 2020年2月16日

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

中国人工智能学会

27+阅读 · 2019年7月24日

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

人工智能前沿讲习班

144+阅读 · 2019年3月15日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

不要担心没数据！史上最全数据集网站汇总

不要担心没数据！史上最全数据集网站汇总

数盟

14+阅读 · 2018年4月18日

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

专知

13+阅读 · 2018年1月23日

知识提取的一种应用，从上市公司年报中抽取因果关系

知识提取的一种应用，从上市公司年报中抽取因果关系

文因互联

10+阅读 · 2017年7月7日

支持产品创新设计的大数据知识萃取研究

国家自然科学基金

8+阅读 · 2015年12月31日

视觉媒体的结构感知处理与分析模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

保持结构的交互式图像及视频编辑方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

云环境下结合视觉特征的图像视频集编码与传输

国家自然科学基金

1+阅读 · 2015年12月31日

基于复杂语义的个性化图像集摘要研究

国家自然科学基金

0+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构信息网络的地理共享数据个性化检索研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于业务流程再造的科技期刊数字化出版模式研究

国家自然科学基金

0+阅读 · 2014年12月31日

上市公司文本信息分析研究：基于大数据的视角

国家自然科学基金

8+阅读 · 2014年12月31日

PAPERMIND: Benchmarking Agentic Reasoning and Critique over Scientific Papers in Multimodal LLMs

Arxiv

0+阅读 · 4月23日

The State of Scientific Poster Sharing and Reuse

Arxiv

0+阅读 · 4月22日

SciPostGen: Bridging the Gap between Scientific Papers and Poster Layouts

Arxiv

0+阅读 · 4月8日

SciGA: A Comprehensive Dataset for Designing Graphical Abstracts in Academic Papers

Arxiv

0+阅读 · 4月5日

SciNLP: A Domain-Specific Benchmark for Full-Text Scientific Entity and Relation Extraction in NLP

Arxiv

0+阅读 · 4月3日

SciEGQA: A Dataset for Scientific Evidence-Grounded Question Answering and Reasoning

Arxiv

0+阅读 · 3月30日

Linking Global Science Funding to Research Publications

Arxiv

0+阅读 · 3月25日

SciLaD: A Large-Scale, Transparent, Reproducible Dataset for Natural Scientific Language Processing

Arxiv

0+阅读 · 3月23日

Review and Analysis of Scientific Paper Embellishments

Arxiv

0+阅读 · 3月19日

TableTale: Reviving the Narrative Interplay Between Data Tables and Text in Scientific Papers

Arxiv

0+阅读 · 2月26日

VIP会员

文章信息

相关主题

最新内容

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

专知会员服务

4+阅读 · 今天14:58

《无人地面战车（UGV）的崛起》报告

《无人地面战车（UGV）的崛起》报告

专知会员服务

1+阅读 · 今天14:44

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

专知会员服务

1+阅读 · 今天14:35

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

专知会员服务

3+阅读 · 今天14:32

美陆军任务式指挥人工智能解决方案

美陆军任务式指挥人工智能解决方案

专知会员服务

3+阅读 · 今天14:17

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

专知会员服务

1+阅读 · 今天13:47

综述 | 现代智能体自我改进，从模型更新到脚手架演化

综述 | 现代智能体自我改进，从模型更新到脚手架演化

专知会员服务

1+阅读 · 今天13:43

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

专知会员服务

9+阅读 · 7月15日

五角大楼新版反无人机手册：内容解析与战略影响（附手册100页原件）

五角大楼新版反无人机手册：内容解析与战略影响（附手册100页原件）

专知会员服务

14+阅读 · 7月15日

《军事基地能源韧性与经济性权衡评估方法研究》

《军事基地能源韧性与经济性权衡评估方法研究》

专知会员服务

7+阅读 · 7月15日

ACM MM 2026 | UNIT：释放大语言模型在图持续学习中的潜力

ACM MM 2026 | UNIT：释放大语言模型在图持续学习中的潜力

专知会员服务

8+阅读 · 7月15日

综述 | 具身视觉语言导航：系统综述与真实世界评测

综述 | 具身视觉语言导航：系统综述与真实世界评测

专知会员服务

10+阅读 · 7月15日

应对第1、2类无人机威胁的推荐战术、技术与程序

应对第1、2类无人机威胁的推荐战术、技术与程序

专知会员服务

9+阅读 · 7月15日

《反制多无人机集群攻城：序贯斯塔克伯格安全博弈方法研究》59页

《反制多无人机集群攻城：序贯斯塔克伯格安全博弈方法研究》59页

专知会员服务

11+阅读 · 7月15日

博士论文 | 可扩展、自我改进的大语言模型智能体

博士论文 | 可扩展、自我改进的大语言模型智能体

专知会员服务

12+阅读 · 7月14日

相关VIP内容

《军事场景中的视觉分析探索》2023最新124页技术报告

《军事场景中的视觉分析探索》2023最新124页技术报告

专知会员服务

83+阅读 · 2023年3月2日

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

干货满满，中科院信工所于静新课帮你get学术研究与论文写作技能，附slides与视频

专知会员服务

52+阅读 · 2022年8月24日

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

上海交大最新《标签高效深度分割》研究进展综述，全面阐述无监督、粗监督、不完全监督和噪声监督的深度分割方法

专知会员服务

42+阅读 · 2022年7月7日

最新《图像描述Image Captioning》综述论文，22页pdf220篇文献

专知会员服务

43+阅读 · 2021年7月17日

中科院《科学结构图谱2021》白皮书报告，126页pdf

专知会员服务

66+阅读 · 2021年7月4日

【2020关键词提取】医学报告的关键词提取和结构化，Keyword extraction and structuralization of medical reports

【2020关键词提取】医学报告的关键词提取和结构化，Keyword extraction and structuralization of medical reports

专知会员服务

33+阅读 · 2020年5月2日

深度学习图像分割综述论文最新版，Image Segmentation Using Deep Learning: A Survey

深度学习图像分割综述论文最新版，Image Segmentation Using Deep Learning: A Survey

专知会员服务

93+阅读 · 2020年4月11日

【AAAI2020】知识图谱表示，获取和应用的综述 25页PDF A Survey on Knowledge Graphs: Representation, Acquisition and Applications

【AAAI2020】知识图谱表示，获取和应用的综述 25页PDF A Survey on Knowledge Graphs: Representation, Acquisition and Applications

专知会员服务

95+阅读 · 2020年3月29日

【报告推荐】三维及超形体分析中的几何与数据学习（Geometry and Learning from Data in 3D and Beyond - Shape Analysis）

【报告推荐】三维及超形体分析中的几何与数据学习（Geometry and Learning from Data in 3D and Beyond - Shape Analysis）

专知会员服务

23+阅读 · 2019年11月10日

从知识表示发展历史理解知识图谱，中科院自动化所模式识别国家重点实验室何世柱副研究员，第八届全国社会媒体处理大会SMP2019

从知识表示发展历史理解知识图谱，中科院自动化所模式识别国家重点实验室何世柱副研究员，第八届全国社会媒体处理大会SMP2019

专知会员服务

78+阅读 · 2019年10月24日

热门VIP内容

开通专知VIP会员享更多权益服务

《无人地面战车（UGV）的崛起》报告

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

相关资讯

论文浅尝 | MCCLK: 一个用于知识感知推荐的多层次的交叉视图对比框架

论文浅尝 | MCCLK: 一个用于知识感知推荐的多层次的交叉视图对比框架

开放知识图谱

10+阅读 · 2022年8月8日

【干货书】数据科学手册，456页pdf

【干货书】数据科学手册，456页pdf

专知

15+阅读 · 2021年4月28日

【数据集】OCR_DataSet：有关OCR的数据集并统一标注格式

【数据集】OCR_DataSet：有关OCR的数据集并统一标注格式

AINLP

18+阅读 · 2020年4月10日

最新！知识图谱研究综述论文: 表示学习、知识获取与应用，25页pdf详述Knowledge Graphs技术趋势

最新！知识图谱研究综述论文: 表示学习、知识获取与应用，25页pdf详述Knowledge Graphs技术趋势

专知

91+阅读 · 2020年2月16日

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

NLP+CV《桥接视觉与语言的研究综述》，带你全面了解视觉+语言最新应用和方法

中国人工智能学会

27+阅读 · 2019年7月24日

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

图像分割最新资料汇总（语义分割、实例分割、视频分割、医疗图像分割、自动驾驶…）

人工智能前沿讲习班

144+阅读 · 2019年3月15日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

不要担心没数据！史上最全数据集网站汇总

不要担心没数据！史上最全数据集网站汇总

数盟

14+阅读 · 2018年4月18日

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

【论文推荐】最新5篇图像分割相关论文—条件随机场和深度特征学习、移动端网络、长期视觉定位、主动学习、主动轮廓模型、生成对抗性网络

专知

13+阅读 · 2018年1月23日

知识提取的一种应用，从上市公司年报中抽取因果关系

知识提取的一种应用，从上市公司年报中抽取因果关系

文因互联

10+阅读 · 2017年7月7日

相关论文

PAPERMIND: Benchmarking Agentic Reasoning and Critique over Scientific Papers in Multimodal LLMs

Arxiv

0+阅读 · 4月23日

The State of Scientific Poster Sharing and Reuse

Arxiv

0+阅读 · 4月22日

SciPostGen: Bridging the Gap between Scientific Papers and Poster Layouts

Arxiv

0+阅读 · 4月8日

SciGA: A Comprehensive Dataset for Designing Graphical Abstracts in Academic Papers

Arxiv

0+阅读 · 4月5日

SciNLP: A Domain-Specific Benchmark for Full-Text Scientific Entity and Relation Extraction in NLP

Arxiv

0+阅读 · 4月3日

SciEGQA: A Dataset for Scientific Evidence-Grounded Question Answering and Reasoning

Arxiv

0+阅读 · 3月30日

Linking Global Science Funding to Research Publications

Arxiv

0+阅读 · 3月25日

SciLaD: A Large-Scale, Transparent, Reproducible Dataset for Natural Scientific Language Processing

Arxiv

0+阅读 · 3月23日

Review and Analysis of Scientific Paper Embellishments

Arxiv

0+阅读 · 3月19日

TableTale: Reviving the Narrative Interplay Between Data Tables and Text in Scientific Papers

Arxiv

0+阅读 · 2月26日

相关基金

支持产品创新设计的大数据知识萃取研究

国家自然科学基金

8+阅读 · 2015年12月31日

视觉媒体的结构感知处理与分析模型研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

保持结构的交互式图像及视频编辑方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

云环境下结合视觉特征的图像视频集编码与传输

国家自然科学基金

1+阅读 · 2015年12月31日

基于复杂语义的个性化图像集摘要研究

国家自然科学基金

0+阅读 · 2015年12月31日

多重排序数据的整合分析

国家自然科学基金

0+阅读 · 2015年12月31日

基于异构信息网络的地理共享数据个性化检索研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于业务流程再造的科技期刊数字化出版模式研究

国家自然科学基金

0+阅读 · 2014年12月31日

上市公司文本信息分析研究：基于大数据的视角

国家自然科学基金

8+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员