CzechTopic: A Benchmark for Zero-Shot Topic Localization in Historical Czech Documents - 专知论文

会员服务 ·

0

标注 · 基准 · 样本 · 片段 · 一致 ·

CzechTopic: A Benchmark for Zero-Shot Topic Localization in Historical Czech Documents

翻译：捷克主题：历史捷克文献中零样本主题定位的基准

Martin Kostelník,Michal Hradiš,Martin Dočekal

Topic localization aims to identify spans of text that express a given topic defined by a name and description. To study this task, we introduce a human-annotated benchmark based on Czech historical documents, containing human-defined topics together with manually annotated spans and supporting evaluation at both document and word levels. Evaluation is performed relative to human agreement rather than a single reference annotation. We evaluate a diverse range of large language models alongside BERT-based models fine-tuned on a distilled development dataset. Results reveal substantial variability among LLMs, with performance ranging from near-human topic detection to pronounced failures in span localization. While the strongest models approach human agreement, the distilled token embedding models remain competitive despite their smaller scale. The dataset and evaluation framework are publicly available at: https://github.com/dcgm/czechtopic.

翻译：主题定位旨在识别表达给定主题（由名称和描述定义）的文本片段。为研究此任务，我们引入了一个基于捷克历史文献的人工标注基准，其中包含人工定义的主题以及手动标注的文本片段，并支持在文档和词语两个层面进行评估。评估是相对于人工标注一致性而非单一参考标注进行的。我们评估了多样化的大型语言模型以及在蒸馏开发数据集上微调的基于BERT的模型。结果显示，大型语言模型之间存在显著差异，其性能范围从接近人类水平的主题检测到跨度定位的明显失败。尽管最强模型接近人类标注一致性，但蒸馏后的词嵌入模型尽管规模较小，仍保持竞争力。数据集和评估框架已在以下网址公开提供：https://github.com/dcgm/czechtopic。

0

相关内容

237页ppt《主动学习》最新概述，Stefano Teso讲授!

237页ppt《主动学习》最新概述，Stefano Teso讲授!

专知会员服务

66+阅读 · 2022年8月28日

长文档摘要如何做？莫纳什大学最新《长文档摘要》综述，39页pdf长文档摘要的实证研究:数据集、模型和指标

长文档摘要如何做？莫纳什大学最新《长文档摘要》综述，39页pdf长文档摘要的实证研究:数据集、模型和指标

专知会员服务

36+阅读 · 2022年7月10日

概率主题模型综述

专知会员服务

36+阅读 · 2021年6月16日

【论文推荐】层次知识图谱，Hierarchical Knowledge Graphs: A Novel Information Representation for Exploratory Search Tasks

【论文推荐】层次知识图谱，Hierarchical Knowledge Graphs: A Novel Information Representation for Exploratory Search Tasks

专知会员服务

49+阅读 · 2020年5月26日

基于深度学习的主题模型研究，中文综述，29页pdf，计算机学报

基于深度学习的主题模型研究，中文综述，29页pdf，计算机学报

专知会员服务

124+阅读 · 2020年5月20日

【论文推荐】 GIANT: Scalable Creation of a Web-scale Ontology，基于web本体的可扩展创建

【论文推荐】 GIANT: Scalable Creation of a Web-scale Ontology，基于web本体的可扩展创建

专知会员服务

21+阅读 · 2020年4月5日

【WWW2020-UIUC】自动主题分类法构建，Automated Topic Taxonomy Construction

【WWW2020-UIUC】自动主题分类法构建，Automated Topic Taxonomy Construction

专知会员服务

40+阅读 · 2020年3月22日

【知识图谱简史】A Brief History of Knowledge Graph's Main Ideas: A tutorial

【知识图谱简史】A Brief History of Knowledge Graph's Main Ideas: A tutorial

专知会员服务

74+阅读 · 2019年12月2日

【百度】上下文化知识图谱嵌入，CoKE: Contextualized Knowledge Graph Embedding

【百度】上下文化知识图谱嵌入，CoKE: Contextualized Knowledge Graph Embedding

专知会员服务

80+阅读 · 2019年11月8日

【视频中的零样本动作识别：综述】Zero-Shot Action Recognition in Videos: A Survey

【视频中的零样本动作识别：综述】Zero-Shot Action Recognition in Videos: A Survey

专知会员服务

39+阅读 · 2019年10月12日

【论文笔记】韩家炜团队AutoPhrase：从大量文本库中自动挖掘短语

【论文笔记】韩家炜团队AutoPhrase：从大量文本库中自动挖掘短语

专知

41+阅读 · 2019年11月2日

【综述】短文本主题建模最新综述（附17页全文下载）

【综述】短文本主题建模最新综述（附17页全文下载）

专知

33+阅读 · 2019年4月17日

一文读懂命名实体识别

一文读懂命名实体识别

人工智能头条

33+阅读 · 2019年3月29日

神圣的NLP！一文理解词性标注、依存分析和命名实体识别任务

神圣的NLP！一文理解词性标注、依存分析和命名实体识别任务

深度学习与NLP

25+阅读 · 2018年8月22日

【干货】利用NLTK和Gensim进行主题建模（附完整代码）

【干货】利用NLTK和Gensim进行主题建模（附完整代码）

专知

31+阅读 · 2018年5月6日

主题模型Topic Model知识资料全集（基础/进阶/论文/综述/代码/专家，附PDF下载）

主题模型Topic Model知识资料全集（基础/进阶/论文/综述/代码/专家，附PDF下载）

机器学习研究会

40+阅读 · 2017年11月16日

【专知荟萃16】主题模型Topic Model知识资料全集（基础/进阶/论文/综述/代码/专家，附PDF下载）

【专知荟萃16】主题模型Topic Model知识资料全集（基础/进阶/论文/综述/代码/专家，附PDF下载）

专知

21+阅读 · 2017年11月15日

专知主题链路知识推荐#3——主题模型LDA Gibbs Sampling采样讲解

专知主题链路知识推荐#3——主题模型LDA Gibbs Sampling采样讲解

专知

13+阅读 · 2017年9月18日

构建AI知识体系-专知主题知识树简介

构建AI知识体系-专知主题知识树简介

专知

339+阅读 · 2017年9月17日

专知主题链路知识推荐#1——马尔科夫链蒙特卡洛采样(附代码)

专知主题链路知识推荐#1——马尔科夫链蒙特卡洛采样(附代码)

专知

24+阅读 · 2017年9月16日

图文混合跨媒体知识单元的模糊分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于知识库构建的图像和视频角色语义关系的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于复杂语义的个性化图像集摘要研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

中文社交化短文本情感分析与话题挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于空间认知常识的定性地理信息检索研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

Benchmarking Large Language Models on Reference Extraction and Parsing in the Social Sciences and Humanities

Arxiv

0+阅读 · 3月13日

DETECT: Determining Ease and Textual Clarity of German Text Simplifications

Arxiv

0+阅读 · 3月6日

A Multilingual Human Annotated Corpus of Original and Easy-to-Read Texts to Support Access to Democratic Participatory Processes

Arxiv

0+阅读 · 3月5日

Indaleko: The Unified Personal Index

Arxiv

0+阅读 · 2月24日

TriTopic: Tri-Modal Graph-Based Topic Modeling with Iterative Refinement and Archetypes

Arxiv

0+阅读 · 2月22日

FormationEval, an open multiple-choice benchmark for petroleum geoscience

Arxiv

0+阅读 · 2月14日

Modelling and Classifying the Components of a Literature Review

Arxiv

0+阅读 · 2月9日

A Domain-Specific Curated Benchmark for Entity and Document-Level Relation Extraction

Arxiv

0+阅读 · 2月4日

CUS-QA: Local-Knowledge-Oriented Open-Ended Question Answering Dataset

Arxiv

0+阅读 · 2月2日

LLMs as Span Annotators: A Comparative Study of LLMs and Humans

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

最新内容

《低成本自杀式无人机战争的军事战略影响：以乌克兰和伊朗为案例研究》

《低成本自杀式无人机战争的军事战略影响：以乌克兰和伊朗为案例研究》

专知会员服务

0+阅读 · 16分钟前

深入Maven智能系统：Palantir基于Claude打造的军事大脑

深入Maven智能系统：Palantir基于Claude打造的军事大脑

专知会员服务

3+阅读 · 今天8:18

“Maven计划”的发展演变之“Maven智能系统”应用

“Maven计划”的发展演变之“Maven智能系统”应用

专知会员服务

1+阅读 · 今天8:03

伊朗的无人机蜂群策略如何挑战美国防御系统：人工智能驱动的无人机战争与现代冲突的转型

伊朗的无人机蜂群策略如何挑战美国防御系统：人工智能驱动的无人机战争与现代冲突的转型

专知会员服务

3+阅读 · 今天7:39

《将小型无人机系统与巡飞弹集成至连及以下级别战术机动》（美陆军最新报告中文版）

《将小型无人机系统与巡飞弹集成至连及以下级别战术机动》（美陆军最新报告中文版）

专知会员服务

2+阅读 · 今天6:58

加拿大国防部发布项目需求：用于高级态势决策的多模态人工智能

加拿大国防部发布项目需求：用于高级态势决策的多模态人工智能

专知会员服务

2+阅读 · 今天6:54

《无人机革命：来自俄乌战场的启示》（报告）

《无人机革命：来自俄乌战场的启示》（报告）

专知会员服务

4+阅读 · 今天6:48

《实现联合作战能力所需的技术》58页报告

《实现联合作战能力所需的技术》58页报告

专知会员服务

2+阅读 · 今天6:30

《算法化目标定位：人工智能在以色列加沙打击行动中的作用及其伦理影响》（中文版）

《算法化目标定位：人工智能在以色列加沙打击行动中的作用及其伦理影响》（中文版）

专知会员服务

3+阅读 · 今天6:22

以色列运用人工智能优化空袭警报系统

以色列运用人工智能优化空袭警报系统

专知会员服务

2+阅读 · 今天6:20

以色列在多条战线部署AI智能体

以色列在多条战线部署AI智能体

专知会员服务

3+阅读 · 今天6:12

《将形式化方法工具应用于电子战代码库（经验报告）》

《将形式化方法工具应用于电子战代码库（经验报告）》

专知会员服务

2+阅读 · 今天6:09

2025年大语言模型进展报告

2025年大语言模型进展报告

专知会员服务

16+阅读 · 4月25日

多智能体协作机制

多智能体协作机制

专知会员服务

14+阅读 · 4月25日

非对称优势：美海军开发低成本反无人机技术

非对称优势：美海军开发低成本反无人机技术

专知会员服务

9+阅读 · 4月25日

相关VIP内容

237页ppt《主动学习》最新概述，Stefano Teso讲授!

237页ppt《主动学习》最新概述，Stefano Teso讲授!

专知会员服务

66+阅读 · 2022年8月28日

长文档摘要如何做？莫纳什大学最新《长文档摘要》综述，39页pdf长文档摘要的实证研究:数据集、模型和指标

长文档摘要如何做？莫纳什大学最新《长文档摘要》综述，39页pdf长文档摘要的实证研究:数据集、模型和指标

专知会员服务

36+阅读 · 2022年7月10日

概率主题模型综述

专知会员服务

36+阅读 · 2021年6月16日

【论文推荐】层次知识图谱，Hierarchical Knowledge Graphs: A Novel Information Representation for Exploratory Search Tasks

【论文推荐】层次知识图谱，Hierarchical Knowledge Graphs: A Novel Information Representation for Exploratory Search Tasks

专知会员服务

49+阅读 · 2020年5月26日

基于深度学习的主题模型研究，中文综述，29页pdf，计算机学报

基于深度学习的主题模型研究，中文综述，29页pdf，计算机学报

专知会员服务

124+阅读 · 2020年5月20日

【论文推荐】 GIANT: Scalable Creation of a Web-scale Ontology，基于web本体的可扩展创建

【论文推荐】 GIANT: Scalable Creation of a Web-scale Ontology，基于web本体的可扩展创建

专知会员服务

21+阅读 · 2020年4月5日

【WWW2020-UIUC】自动主题分类法构建，Automated Topic Taxonomy Construction

【WWW2020-UIUC】自动主题分类法构建，Automated Topic Taxonomy Construction

专知会员服务

40+阅读 · 2020年3月22日

【知识图谱简史】A Brief History of Knowledge Graph's Main Ideas: A tutorial

【知识图谱简史】A Brief History of Knowledge Graph's Main Ideas: A tutorial

专知会员服务

74+阅读 · 2019年12月2日

【百度】上下文化知识图谱嵌入，CoKE: Contextualized Knowledge Graph Embedding

【百度】上下文化知识图谱嵌入，CoKE: Contextualized Knowledge Graph Embedding

专知会员服务

80+阅读 · 2019年11月8日

【视频中的零样本动作识别：综述】Zero-Shot Action Recognition in Videos: A Survey

【视频中的零样本动作识别：综述】Zero-Shot Action Recognition in Videos: A Survey

专知会员服务

39+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

深入Maven智能系统：Palantir基于Claude打造的军事大脑

伊朗的无人机蜂群策略如何挑战美国防御系统：人工智能驱动的无人机战争与现代冲突的转型

《低成本自杀式无人机战争的军事战略影响：以乌克兰和伊朗为案例研究》

“Maven计划”的发展演变之“Maven智能系统”应用

相关资讯

【论文笔记】韩家炜团队AutoPhrase：从大量文本库中自动挖掘短语

【论文笔记】韩家炜团队AutoPhrase：从大量文本库中自动挖掘短语

专知

41+阅读 · 2019年11月2日

【综述】短文本主题建模最新综述（附17页全文下载）

【综述】短文本主题建模最新综述（附17页全文下载）

专知

33+阅读 · 2019年4月17日

一文读懂命名实体识别

一文读懂命名实体识别

人工智能头条

33+阅读 · 2019年3月29日

神圣的NLP！一文理解词性标注、依存分析和命名实体识别任务

神圣的NLP！一文理解词性标注、依存分析和命名实体识别任务

深度学习与NLP

25+阅读 · 2018年8月22日

【干货】利用NLTK和Gensim进行主题建模（附完整代码）

【干货】利用NLTK和Gensim进行主题建模（附完整代码）

专知

31+阅读 · 2018年5月6日

主题模型Topic Model知识资料全集（基础/进阶/论文/综述/代码/专家，附PDF下载）

主题模型Topic Model知识资料全集（基础/进阶/论文/综述/代码/专家，附PDF下载）

机器学习研究会

40+阅读 · 2017年11月16日

【专知荟萃16】主题模型Topic Model知识资料全集（基础/进阶/论文/综述/代码/专家，附PDF下载）

【专知荟萃16】主题模型Topic Model知识资料全集（基础/进阶/论文/综述/代码/专家，附PDF下载）

专知

21+阅读 · 2017年11月15日

专知主题链路知识推荐#3——主题模型LDA Gibbs Sampling采样讲解

专知主题链路知识推荐#3——主题模型LDA Gibbs Sampling采样讲解

专知

13+阅读 · 2017年9月18日

构建AI知识体系-专知主题知识树简介

构建AI知识体系-专知主题知识树简介

专知

339+阅读 · 2017年9月17日

专知主题链路知识推荐#1——马尔科夫链蒙特卡洛采样(附代码)

专知主题链路知识推荐#1——马尔科夫链蒙特卡洛采样(附代码)

专知

24+阅读 · 2017年9月16日

相关论文

Benchmarking Large Language Models on Reference Extraction and Parsing in the Social Sciences and Humanities

Arxiv

0+阅读 · 3月13日

DETECT: Determining Ease and Textual Clarity of German Text Simplifications

Arxiv

0+阅读 · 3月6日

A Multilingual Human Annotated Corpus of Original and Easy-to-Read Texts to Support Access to Democratic Participatory Processes

Arxiv

0+阅读 · 3月5日

Indaleko: The Unified Personal Index

Arxiv

0+阅读 · 2月24日

TriTopic: Tri-Modal Graph-Based Topic Modeling with Iterative Refinement and Archetypes

Arxiv

0+阅读 · 2月22日

FormationEval, an open multiple-choice benchmark for petroleum geoscience

Arxiv

0+阅读 · 2月14日

Modelling and Classifying the Components of a Literature Review

Arxiv

0+阅读 · 2月9日

A Domain-Specific Curated Benchmark for Entity and Document-Level Relation Extraction

Arxiv

0+阅读 · 2月4日

CUS-QA: Local-Knowledge-Oriented Open-Ended Question Answering Dataset

Arxiv

0+阅读 · 2月2日

LLMs as Span Annotators: A Comparative Study of LLMs and Humans

Arxiv

0+阅读 · 2月2日

相关基金

图文混合跨媒体知识单元的模糊分类方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于知识库构建的图像和视频角色语义关系的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于复杂语义的个性化图像集摘要研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向异分布数据的主动学习方法

国家自然科学基金

12+阅读 · 2015年12月31日

中文社交化短文本情感分析与话题挖掘研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于空间认知常识的定性地理信息检索研究

国家自然科学基金

2+阅读 · 2014年12月31日

基于概率图的文本检索模型及算法研究

国家自然科学基金

2+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

面向汉语文本理解的语义计算方法

国家自然科学基金

8+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员