Hierarchical Catalogue Generation for Literature Review: A Benchmark - 专知论文

会员服务 ·

0

评估指标 · 综述 · 参考文献 · 分析验证 · 层次结构 ·

2023 年 4 月 10 日

Hierarchical Catalogue Generation for Literature Review: A Benchmark

翻译：面向文献综述的层级目录生成：基准测试

Kun Zhu,Xiaocheng Feng,Xiachong Feng,Yingsheng Wu,Bing Qin

Multi-document scientific summarization can extract and organize important information from an abundant collection of papers, arousing widespread attention recently. However, existing efforts focus on producing lengthy overviews lacking a clear and logical hierarchy. To alleviate this problem, we present an atomic and challenging task named Hierarchical Catalogue Generation for Literature Review (HiCatGLR), which aims to generate a hierarchical catalogue for a review paper given various references. We carefully construct a novel English Hierarchical Catalogues of Literature Reviews Dataset (HiCaD) with 13.8k literature review catalogues and 120k reference papers, where we benchmark diverse experiments via the end-to-end and pipeline methods. To accurately assess the model performance, we design evaluation metrics for similarity to ground truth from semantics and structure. Besides, our extensive analyses verify the high quality of our dataset and the effectiveness of our evaluation metrics. Furthermore, we discuss potential directions for this task to motivate future research.

翻译：多文档科学摘要能够从丰富的论文集合中提取并组织重要信息，近期引起了广泛关注。然而，现有工作侧重于生成缺乏清晰逻辑层次的长篇概述。为解决这一问题，我们提出了一项基础且具有挑战性的任务——面向文献综述的层级目录生成（HiCatGLR），旨在基于多种参考文献为综述论文生成层级目录。我们精心构建了一个新颖的英文文献综述层级目录数据集（HiCaD），包含13,800个文献综述目录和12万篇参考文献论文，并通过端到端方法与流水线方法对多种实验进行了基准测试。为准确评估模型性能，我们从语义和结构两个维度设计了与真实标签的相似度评估指标。此外，我们的广泛分析验证了数据集的高质量及评估指标的有效性。最后，我们讨论了该任务的潜在研究方向，以推动未来研究。

0

相关内容

评估指标

【牛津大学】电子医疗记录的生成式对抗网络:应用、评估措施和数据来源综述，A review of Generative Adversarial Networks for Electronic Health Records: applications, evaluation measures and data sources

【牛津大学】电子医疗记录的生成式对抗网络:应用、评估措施和数据来源综述，A review of Generative Adversarial Networks for Electronic Health Records: applications, evaluation measures and data sources

专知会员服务

24+阅读 · 2022年3月15日

UCL& UC Berkeley | 深度强化学习中的泛化研究综述

UCL& UC Berkeley | 深度强化学习中的泛化研究综述

专知会员服务

61+阅读 · 2021年11月22日

基于深度学习的数据库自然语言接口综述

专知会员服务

33+阅读 · 2021年9月27日

【CIKM2020】通过意图描述生成进行查询理解

专知会员服务

21+阅读 · 2020年9月11日

【KDD2020】现实世界超图的结构模式和生成模型，Structural Patterns and Generative Models of Real-world Hypergraphs

【KDD2020】现实世界超图的结构模式和生成模型，Structural Patterns and Generative Models of Real-world Hypergraphs

专知会员服务

37+阅读 · 2020年6月16日

【WWW 2019】异质图注意力网络，Heterogeneous Graph Attention Network

【WWW 2019】异质图注意力网络，Heterogeneous Graph Attention Network

专知会员服务

75+阅读 · 2020年6月14日

如何在交通领域构建基于图的深度学习体系结构:一个综述，How to Build a Graph-Based Deep Learning Architecture in Traffic Domain: A Survey

如何在交通领域构建基于图的深度学习体系结构:一个综述，How to Build a Graph-Based Deep Learning Architecture in Traffic Domain: A Survey

专知会员服务

51+阅读 · 2020年5月26日

运动物体检测与运动相机:一个全面的综述：Moving Objects Detection with a Moving Camera: A Comprehensive Review

运动物体检测与运动相机:一个全面的综述：Moving Objects Detection with a Moving Camera: A Comprehensive Review

专知会员服务

27+阅读 · 2020年1月17日

【论文】评估可扩展贝叶斯深度学习强大的计算机视觉的方法（Evaluating Scalable Bayesian Deep LearningMethods for Robust Computer Vision）

【论文】评估可扩展贝叶斯深度学习强大的计算机视觉的方法（Evaluating Scalable Bayesian Deep LearningMethods for Robust Computer Vision）

专知会员服务

12+阅读 · 2020年1月13日

【AAAI2020】知识图谱的生成式对抗零样本关系学习，Generative Adversarial Zero-Shot Relational Learning for Knowledge Graphs

【AAAI2020】知识图谱的生成式对抗零样本关系学习，Generative Adversarial Zero-Shot Relational Learning for Knowledge Graphs

专知会员服务

64+阅读 · 2020年1月11日

WSDM 2023 | 针对长文档场景下的跨语言摘要

WSDM 2023 | 针对长文档场景下的跨语言摘要

PaperWeekly

1+阅读 · 2022年11月26日

「多语言图像描述」最强评估基准XM3600来了！涵盖36种语言

「多语言图像描述」最强评估基准XM3600来了！涵盖36种语言

新智元

0+阅读 · 2022年10月24日

Text-to-SQL最新综述：一篇文章讲透任务方法和未来10个发展方向

Text-to-SQL最新综述：一篇文章讲透任务方法和未来10个发展方向

PaperWeekly

3+阅读 · 2022年9月30日

TACL 2022 | 跨语言摘要最新综述：典型挑战及解决方案

TACL 2022 | 跨语言摘要最新综述：典型挑战及解决方案

PaperWeekly

1+阅读 · 2022年9月14日

「基于深度学习的 SQL 生成」2022研究综述

「基于深度学习的 SQL 生成」2022研究综述

专知

0+阅读 · 2022年8月12日

IJCAI 2022 | 图结构学习最新综述：研究进展与未来展望

IJCAI 2022 | 图结构学习最新综述：研究进展与未来展望

PaperWeekly

1+阅读 · 2022年7月27日

2022最新！3篇GNN领域综述！

2022最新！3篇GNN领域综述！

图与推荐

11+阅读 · 2022年2月18日

【综述】迁移自适应学习十年进展

【综述】迁移自适应学习十年进展

专知

41+阅读 · 2019年11月26日

论文浅尝 | XQA：一个跨语言开放域问答数据集

论文浅尝 | XQA：一个跨语言开放域问答数据集

开放知识图谱

26+阅读 · 2019年9月11日

命名实体识别（NER）综述

命名实体识别（NER）综述

AI研习社

66+阅读 · 2019年1月30日

最小化加权完工时间和的在线排序研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于弱监督学习的细粒度中医临床医学实体识别方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于IFC的建筑信息模型(BIM)语义检索技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于适配体特异性诱导蛋白泛素化降解的研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于学术文献引文的自动摘要关键技术研究

国家自然科学基金

3+阅读 · 2013年12月31日

信息多样性和信息摘要的关键问题研究

国家自然科学基金

2+阅读 · 2012年12月31日

社会网络语义模型及语义搜索关键问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于潜在火环境的森林火险等级遥感评估方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

汉语文本推理的资源建设和统计分析研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于双语文档反馈的跨语言信息检索研究

国家自然科学基金

0+阅读 · 2008年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

176+阅读 · 2023年4月20日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

88+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

501+阅读 · 2023年3月31日

Self-Supervised Learning for Recommender Systems: A Survey

Arxiv

12+阅读 · 2022年3月29日

Graph Neural Networks for Natural Language Processing: A Survey

Arxiv

36+阅读 · 2021年6月10日

A Review of Graph Neural Networks and Their Applications in Power Systems

A Review of Graph Neural Networks and Their Applications in Power Systems

Arxiv

29+阅读 · 2021年1月25日

Generative Adversarial Networks in Computer Vision: A Survey and Taxonomy

Generative Adversarial Networks in Computer Vision: A Survey and Taxonomy

Arxiv

42+阅读 · 2020年12月21日

A Survey on Knowledge Graph-Based Recommender Systems

Arxiv

92+阅读 · 2020年2月28日

A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications

A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications

Arxiv

59+阅读 · 2020年1月20日

Generative Adversarial Networks: A Survey and Taxonomy

Generative Adversarial Networks: A Survey and Taxonomy

Arxiv

14+阅读 · 2019年6月4日

VIP会员

文章信息

相关主题

最新内容

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

1+阅读 · 今天14:45

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

1+阅读 · 今天14:43

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

3+阅读 · 今天14:31

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

3+阅读 · 今天14:20

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

2+阅读 · 今天14:11

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

3+阅读 · 今天14:07

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

3+阅读 · 今天14:03

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

《理解伙伴国在防务能力选择中的偏好：探索美国解决方案的替代选择》美智库200页报告

专知会员服务

2+阅读 · 今天13:59

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

ICML 2026 | 边界嵌入塑形：用自适应对比学习破解图结构纠缠

专知会员服务

5+阅读 · 6月22日

综述 | 3D场景图：开放挑战与未来方向

综述 | 3D场景图：开放挑战与未来方向

专知会员服务

8+阅读 · 6月22日

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

《国防工业6.0：全自主作战系统、量子-人工智能融合与新一代战略威慑》

专知会员服务

7+阅读 · 6月22日

21世纪的无人机战争

21世纪的无人机战争

专知会员服务

4+阅读 · 6月22日

《伊朗与以色列-美国热战及其对数字技术的影响》

《伊朗与以色列-美国热战及其对数字技术的影响》

专知会员服务

5+阅读 · 6月22日

《量子技术的军事任务技术适配与利用》

《量子技术的军事任务技术适配与利用》

专知会员服务

5+阅读 · 6月22日

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

《美国陆军军官学校（西点军校）本科生科研中生成式人工智能的使用》

专知会员服务

8+阅读 · 6月22日

相关VIP内容

【牛津大学】电子医疗记录的生成式对抗网络:应用、评估措施和数据来源综述，A review of Generative Adversarial Networks for Electronic Health Records: applications, evaluation measures and data sources

【牛津大学】电子医疗记录的生成式对抗网络:应用、评估措施和数据来源综述，A review of Generative Adversarial Networks for Electronic Health Records: applications, evaluation measures and data sources

专知会员服务

24+阅读 · 2022年3月15日

UCL& UC Berkeley | 深度强化学习中的泛化研究综述

UCL& UC Berkeley | 深度强化学习中的泛化研究综述

专知会员服务

61+阅读 · 2021年11月22日

基于深度学习的数据库自然语言接口综述

专知会员服务

33+阅读 · 2021年9月27日

【CIKM2020】通过意图描述生成进行查询理解

专知会员服务

21+阅读 · 2020年9月11日

【KDD2020】现实世界超图的结构模式和生成模型，Structural Patterns and Generative Models of Real-world Hypergraphs

【KDD2020】现实世界超图的结构模式和生成模型，Structural Patterns and Generative Models of Real-world Hypergraphs

专知会员服务

37+阅读 · 2020年6月16日

【WWW 2019】异质图注意力网络，Heterogeneous Graph Attention Network

【WWW 2019】异质图注意力网络，Heterogeneous Graph Attention Network

专知会员服务

75+阅读 · 2020年6月14日

如何在交通领域构建基于图的深度学习体系结构:一个综述，How to Build a Graph-Based Deep Learning Architecture in Traffic Domain: A Survey

如何在交通领域构建基于图的深度学习体系结构:一个综述，How to Build a Graph-Based Deep Learning Architecture in Traffic Domain: A Survey

专知会员服务

51+阅读 · 2020年5月26日

运动物体检测与运动相机:一个全面的综述：Moving Objects Detection with a Moving Camera: A Comprehensive Review

运动物体检测与运动相机:一个全面的综述：Moving Objects Detection with a Moving Camera: A Comprehensive Review

专知会员服务

27+阅读 · 2020年1月17日

【论文】评估可扩展贝叶斯深度学习强大的计算机视觉的方法（Evaluating Scalable Bayesian Deep LearningMethods for Robust Computer Vision）

【论文】评估可扩展贝叶斯深度学习强大的计算机视觉的方法（Evaluating Scalable Bayesian Deep LearningMethods for Robust Computer Vision）

专知会员服务

12+阅读 · 2020年1月13日

【AAAI2020】知识图谱的生成式对抗零样本关系学习，Generative Adversarial Zero-Shot Relational Learning for Knowledge Graphs

【AAAI2020】知识图谱的生成式对抗零样本关系学习，Generative Adversarial Zero-Shot Relational Learning for Knowledge Graphs

专知会员服务

64+阅读 · 2020年1月11日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | 世界动作模型：少做梦，多行动

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

美以伊冲突：无人机与人工智能的运用

相关资讯

WSDM 2023 | 针对长文档场景下的跨语言摘要

WSDM 2023 | 针对长文档场景下的跨语言摘要

PaperWeekly

1+阅读 · 2022年11月26日

「多语言图像描述」最强评估基准XM3600来了！涵盖36种语言

「多语言图像描述」最强评估基准XM3600来了！涵盖36种语言

新智元

0+阅读 · 2022年10月24日

Text-to-SQL最新综述：一篇文章讲透任务方法和未来10个发展方向

Text-to-SQL最新综述：一篇文章讲透任务方法和未来10个发展方向

PaperWeekly

3+阅读 · 2022年9月30日

TACL 2022 | 跨语言摘要最新综述：典型挑战及解决方案

TACL 2022 | 跨语言摘要最新综述：典型挑战及解决方案

PaperWeekly

1+阅读 · 2022年9月14日

「基于深度学习的 SQL 生成」2022研究综述

「基于深度学习的 SQL 生成」2022研究综述

专知

0+阅读 · 2022年8月12日

IJCAI 2022 | 图结构学习最新综述：研究进展与未来展望

IJCAI 2022 | 图结构学习最新综述：研究进展与未来展望

PaperWeekly

1+阅读 · 2022年7月27日

2022最新！3篇GNN领域综述！

2022最新！3篇GNN领域综述！

图与推荐

11+阅读 · 2022年2月18日

【综述】迁移自适应学习十年进展

【综述】迁移自适应学习十年进展

专知

41+阅读 · 2019年11月26日

论文浅尝 | XQA：一个跨语言开放域问答数据集

论文浅尝 | XQA：一个跨语言开放域问答数据集

开放知识图谱

26+阅读 · 2019年9月11日

命名实体识别（NER）综述

命名实体识别（NER）综述

AI研习社

66+阅读 · 2019年1月30日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

176+阅读 · 2023年4月20日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

88+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

501+阅读 · 2023年3月31日

Self-Supervised Learning for Recommender Systems: A Survey

Arxiv

12+阅读 · 2022年3月29日

Graph Neural Networks for Natural Language Processing: A Survey

Arxiv

36+阅读 · 2021年6月10日

A Review of Graph Neural Networks and Their Applications in Power Systems

A Review of Graph Neural Networks and Their Applications in Power Systems

Arxiv

29+阅读 · 2021年1月25日

Generative Adversarial Networks in Computer Vision: A Survey and Taxonomy

Generative Adversarial Networks in Computer Vision: A Survey and Taxonomy

Arxiv

42+阅读 · 2020年12月21日

A Survey on Knowledge Graph-Based Recommender Systems

Arxiv

92+阅读 · 2020年2月28日

A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications

A Review on Generative Adversarial Networks: Algorithms, Theory, and Applications

Arxiv

59+阅读 · 2020年1月20日

Generative Adversarial Networks: A Survey and Taxonomy

Generative Adversarial Networks: A Survey and Taxonomy

Arxiv

14+阅读 · 2019年6月4日

相关基金

最小化加权完工时间和的在线排序研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于弱监督学习的细粒度中医临床医学实体识别方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于IFC的建筑信息模型(BIM)语义检索技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

基于适配体特异性诱导蛋白泛素化降解的研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于学术文献引文的自动摘要关键技术研究

国家自然科学基金

3+阅读 · 2013年12月31日

信息多样性和信息摘要的关键问题研究

国家自然科学基金

2+阅读 · 2012年12月31日

社会网络语义模型及语义搜索关键问题研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于潜在火环境的森林火险等级遥感评估方法研究

国家自然科学基金

0+阅读 · 2012年12月31日

汉语文本推理的资源建设和统计分析研究

国家自然科学基金

0+阅读 · 2011年12月31日

基于双语文档反馈的跨语言信息检索研究

国家自然科学基金

0+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员