Zero- and Few-Shot Named-Entity Recognition: Case Study and Dataset in the Crime Domain (CrimeNER) - 专知论文

会员服务 ·

0

样本 · 实体 · 命名实体 · 实体抽取 · 识别 ·

Zero- and Few-Shot Named-Entity Recognition: Case Study and Dataset in the Crime Domain (CrimeNER)

翻译：犯罪领域零样本与少样本命名实体识别：案例研究与数据集（CrimeNER）

Miguel Lopez-Duran,Julian Fierrez,Aythami Morales,Daniel DeAlcala,Gonzalo Mancera,Javier Irigoyen,Ruben Tolosana,Oscar Delgado,Francisco Jurado,Alvaro Ortigosa

from arxiv, Sent for review at the main conference of the International Conference of Document Analysis and Recognition (ICDAR) 2026

The extraction of critical information from crime-related documents is a crucial task for law enforcement agencies. Named-Entity Recognition (NER) can perform this task in extracting information about the crime, the criminal, or law enforcement agencies involved. However, there is a considerable lack of adequately annotated data on general real-world crime scenarios. To address this issue, we present CrimeNER, a case-study of Crime-related zero- and Few-Shot NER, and a general Crime-related Named-Entity Recognition database (CrimeNERdb) consisting of more than 1.5k annotated documents for the NER task extracted from public reports on terrorist attacks and the U.S. Department of Justice's press notes. We define 5 types of coarse crime entity and a total of 22 types of fine-grained entity. We address the quality of the case-study and the annotated data with experiments on Zero and Few-Shot settings with State-of-the-Art NER models as well as generalist and commonly used Large Language Models.

翻译：从犯罪相关文档中提取关键信息是执法机构的一项重要任务。命名实体识别（NER）可通过提取犯罪、罪犯或涉案执法机构的信息来完成此任务。然而，针对一般现实犯罪场景的充分标注数据存在显著缺失。为解决这一问题，我们提出CrimeNER——一个犯罪相关零样本与少样本NER的案例研究，并构建了通用的犯罪相关命名实体识别数据库（CrimeNERdb）。该数据库包含超过1.5k份标注文档，用于NER任务，文档来源于恐怖袭击公开报告和美国司法部新闻稿。我们定义了5种粗粒度犯罪实体类型及共计22种细粒度实体类型。通过采用最先进的NER模型以及通用常用的大型语言模型，在零样本与少样本设定下进行实验，我们对案例研究与标注数据的质量进行了验证。

0

相关内容

「中文电子病历命名实体识别」的研究与进展

「中文电子病历命名实体识别」的研究与进展

专知会员服务

30+阅读 · 2022年11月5日

【KDD2021】知识增强领域自适应的少样本关系分类

专知会员服务

38+阅读 · 2021年9月15日

中文领域命名实体识别综述

专知会员服务

71+阅读 · 2021年8月20日

【ACL2020】命名实体识别即依存解析，Named Entity Recognition as Dependency Parsing

【ACL2020】命名实体识别即依存解析，Named Entity Recognition as Dependency Parsing

专知会员服务

61+阅读 · 2020年5月15日

【中科院】命名实体识别技术综述

专知会员服务

157+阅读 · 2020年4月21日

【ACL2020】TriggerNER:使用实体触发器学习作为解释用于命名实体识别

【ACL2020】TriggerNER:使用实体触发器学习作为解释用于命名实体识别

专知会员服务

23+阅读 · 2020年4月18日

【TKDE2020-南洋理工】深度学习命名实体识别最新版，207篇参考文献

【TKDE2020-南洋理工】深度学习命名实体识别最新版，207篇参考文献

专知会员服务

92+阅读 · 2020年3月17日

【论文】使用编码器进行命名实体识别（TENER: Adapting Transformer Encoder for Named Entity Recognition）

【论文】使用编码器进行命名实体识别（TENER: Adapting Transformer Encoder for Named Entity Recognition）

专知会员服务

52+阅读 · 2019年12月28日

【AAAI2020论文-清华大学】Enhanced Meta-Learning for Cross-lingual Named Entity Recognition with Minimal Resources，最小资源增强的元学习跨语言命名实体识别

【AAAI2020论文-清华大学】Enhanced Meta-Learning for Cross-lingual Named Entity Recognition with Minimal Resources，最小资源增强的元学习跨语言命名实体识别

专知会员服务

31+阅读 · 2019年11月17日

【视频中的零样本动作识别：综述】Zero-Shot Action Recognition in Videos: A Survey

【视频中的零样本动作识别：综述】Zero-Shot Action Recognition in Videos: A Survey

专知会员服务

39+阅读 · 2019年10月12日

【中科院】命名实体识别技术综述

【中科院】命名实体识别技术综述

专知

16+阅读 · 2020年4月21日

NLP命名实体识别开源实战教程 | 深度应用

NLP命名实体识别开源实战教程 | 深度应用

AI100

15+阅读 · 2019年8月18日

面向新闻媒体的命名实体识别技术

面向新闻媒体的命名实体识别技术

PaperWeekly

18+阅读 · 2019年4月17日

一文读懂命名实体识别

一文读懂命名实体识别

人工智能头条

33+阅读 · 2019年3月29日

南洋理工最新《命名实体识别深度学习方法》综述论文，25页pdf

南洋理工最新《命名实体识别深度学习方法》综述论文，25页pdf

专知

46+阅读 · 2018年12月28日

专栏 | 用神经推理来帮助命名实体识别

专栏 | 用神经推理来帮助命名实体识别

机器之心

15+阅读 · 2018年11月8日

基于Lattice LSTM的命名实体识别

基于Lattice LSTM的命名实体识别

微信AI

48+阅读 · 2018年10月19日

命名实体识别从数据集到算法实现

命名实体识别从数据集到算法实现

专知

56+阅读 · 2018年6月28日

笔记 | Deep active learning for named entity recognition

笔记 | Deep active learning for named entity recognition

黑龙江大学自然语言处理实验室

24+阅读 · 2018年5月27日

【论文推荐】最新五篇命名实体识别（NER）相关论文—对抗学习、语料库、深度多任务学习、先验知识、跨语言语义

【论文推荐】最新五篇命名实体识别（NER）相关论文—对抗学习、语料库、深度多任务学习、先验知识、跨语言语义

专知

37+阅读 · 2018年2月21日

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

抽样环境下基于流记录的行为特征分析与多分类器识别模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于弱监督学习的细粒度中医临床医学实体识别方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于大数据分析的犯罪模式挖掘与犯罪预测研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向异构信息网络中实体归类的模糊聚类

国家自然科学基金

1+阅读 · 2015年12月31日

面向事件分析的信息意图检测、建模与群体意图推理技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于案事件流数据的犯罪行为时空分析研究

国家自然科学基金

3+阅读 · 2014年12月31日

Named Entity Recognition of Historical Texts via Large Language Model

Arxiv

0+阅读 · 4月28日

SAKE: Self-aware Knowledge Exploitation-Exploration for Grounded Multimodal Named Entity Recognition

Arxiv

0+阅读 · 4月22日

SciNLP: A Domain-Specific Benchmark for Full-Text Scientific Entity and Relation Extraction in NLP

Arxiv

0+阅读 · 4月3日

ENEIDE: A High Quality Silver Standard Dataset for Named Entity Recognition and Linking in Historical Italian

Arxiv

0+阅读 · 3月31日

Clinical named entity recognition in the Portuguese language: a benchmark of modern BERT models and LLMs

Arxiv

0+阅读 · 3月27日

CodeNER: Code Prompting for Named Entity Recognition

Arxiv

0+阅读 · 3月26日

CaseLinker: An Open-Source System for Cross-Case Analysis of Internet Crimes Against Children Reports

Arxiv

0+阅读 · 3月20日

Learning Nested Named Entity Recognition from Flat Annotations

Arxiv

0+阅读 · 2月28日

A Dataset for Named Entity Recognition and Relation Extraction from Art-historical Image Descriptions

Arxiv

0+阅读 · 2月22日

A Survey on Deep Learning for Named Entity Recognition

A Survey on Deep Learning for Named Entity Recognition

Arxiv

73+阅读 · 2018年12月22日

VIP会员

文章信息

相关主题

最新内容

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

专知会员服务

0+阅读 · 今天15:52

《边缘端实时无线感知赋能现场多机器人部署》200页

《边缘端实时无线感知赋能现场多机器人部署》200页

专知会员服务

2+阅读 · 今天15:32

战力倍增器：自主武器系统与乌克兰及加沙冲突

战力倍增器：自主武器系统与乌克兰及加沙冲突

专知会员服务

1+阅读 · 今天15:24

人工智能赋能战场情报：提速决策进程

人工智能赋能战场情报：提速决策进程

专知会员服务

0+阅读 · 今天15:15

《拥抱新兴技术：面向未来军官的教育革新》

《拥抱新兴技术：面向未来军官的教育革新》

专知会员服务

2+阅读 · 今天15:11

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

专知会员服务

0+阅读 · 今天14:43

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

专知会员服务

0+阅读 · 今天14:40

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

《火线上的后勤保障：对抗环境下的随机规划模型研究——俄乌场景案例分析》99页

专知会员服务

11+阅读 · 7月16日

《无人地面战车（UGV）的崛起》报告

《无人地面战车（UGV）的崛起》报告

专知会员服务

7+阅读 · 7月16日

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

《无人机参数化与集群飞行创新项目的监控流程管理：模型、策略及自适应解决方案》

专知会员服务

6+阅读 · 7月16日

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

《美军开放式任务系统（OMS）定义与文档（D&D）——Java关键抽象层（CAL）接口生成规范》47页标准

专知会员服务

12+阅读 · 7月16日

美陆军任务式指挥人工智能解决方案

美陆军任务式指挥人工智能解决方案

专知会员服务

11+阅读 · 7月16日

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

ICML 2026 | 理论级自动形式化：从孤立命题到统一形式化知识库

专知会员服务

8+阅读 · 7月16日

综述 | 现代智能体自我改进，从模型更新到脚手架演化

综述 | 现代智能体自我改进，从模型更新到脚手架演化

专知会员服务

14+阅读 · 7月16日

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

美国陆军宣布“项目融合-顶点6”：现代化进程的关键里程碑

专知会员服务

13+阅读 · 7月15日

相关VIP内容

「中文电子病历命名实体识别」的研究与进展

「中文电子病历命名实体识别」的研究与进展

专知会员服务

30+阅读 · 2022年11月5日

【KDD2021】知识增强领域自适应的少样本关系分类

专知会员服务

38+阅读 · 2021年9月15日

中文领域命名实体识别综述

专知会员服务

71+阅读 · 2021年8月20日

【ACL2020】命名实体识别即依存解析，Named Entity Recognition as Dependency Parsing

【ACL2020】命名实体识别即依存解析，Named Entity Recognition as Dependency Parsing

专知会员服务

61+阅读 · 2020年5月15日

【中科院】命名实体识别技术综述

专知会员服务

157+阅读 · 2020年4月21日

【ACL2020】TriggerNER:使用实体触发器学习作为解释用于命名实体识别

【ACL2020】TriggerNER:使用实体触发器学习作为解释用于命名实体识别

专知会员服务

23+阅读 · 2020年4月18日

【TKDE2020-南洋理工】深度学习命名实体识别最新版，207篇参考文献

【TKDE2020-南洋理工】深度学习命名实体识别最新版，207篇参考文献

专知会员服务

92+阅读 · 2020年3月17日

【论文】使用编码器进行命名实体识别（TENER: Adapting Transformer Encoder for Named Entity Recognition）

【论文】使用编码器进行命名实体识别（TENER: Adapting Transformer Encoder for Named Entity Recognition）

专知会员服务

52+阅读 · 2019年12月28日

【AAAI2020论文-清华大学】Enhanced Meta-Learning for Cross-lingual Named Entity Recognition with Minimal Resources，最小资源增强的元学习跨语言命名实体识别

【AAAI2020论文-清华大学】Enhanced Meta-Learning for Cross-lingual Named Entity Recognition with Minimal Resources，最小资源增强的元学习跨语言命名实体识别

专知会员服务

31+阅读 · 2019年11月17日

【视频中的零样本动作识别：综述】Zero-Shot Action Recognition in Videos: A Survey

【视频中的零样本动作识别：综述】Zero-Shot Action Recognition in Videos: A Survey

专知会员服务

39+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《边缘端实时无线感知赋能现场多机器人部署》200页

人工智能赋能战场情报：提速决策进程

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

战力倍增器：自主武器系统与乌克兰及加沙冲突

相关资讯

【中科院】命名实体识别技术综述

【中科院】命名实体识别技术综述

专知

16+阅读 · 2020年4月21日

NLP命名实体识别开源实战教程 | 深度应用

NLP命名实体识别开源实战教程 | 深度应用

AI100

15+阅读 · 2019年8月18日

面向新闻媒体的命名实体识别技术

面向新闻媒体的命名实体识别技术

PaperWeekly

18+阅读 · 2019年4月17日

一文读懂命名实体识别

一文读懂命名实体识别

人工智能头条

33+阅读 · 2019年3月29日

南洋理工最新《命名实体识别深度学习方法》综述论文，25页pdf

南洋理工最新《命名实体识别深度学习方法》综述论文，25页pdf

专知

46+阅读 · 2018年12月28日

专栏 | 用神经推理来帮助命名实体识别

专栏 | 用神经推理来帮助命名实体识别

机器之心

15+阅读 · 2018年11月8日

基于Lattice LSTM的命名实体识别

基于Lattice LSTM的命名实体识别

微信AI

48+阅读 · 2018年10月19日

命名实体识别从数据集到算法实现

命名实体识别从数据集到算法实现

专知

56+阅读 · 2018年6月28日

笔记 | Deep active learning for named entity recognition

笔记 | Deep active learning for named entity recognition

黑龙江大学自然语言处理实验室

24+阅读 · 2018年5月27日

【论文推荐】最新五篇命名实体识别（NER）相关论文—对抗学习、语料库、深度多任务学习、先验知识、跨语言语义

【论文推荐】最新五篇命名实体识别（NER）相关论文—对抗学习、语料库、深度多任务学习、先验知识、跨语言语义

专知

37+阅读 · 2018年2月21日

相关论文

Named Entity Recognition of Historical Texts via Large Language Model

Arxiv

0+阅读 · 4月28日

SAKE: Self-aware Knowledge Exploitation-Exploration for Grounded Multimodal Named Entity Recognition

Arxiv

0+阅读 · 4月22日

SciNLP: A Domain-Specific Benchmark for Full-Text Scientific Entity and Relation Extraction in NLP

Arxiv

0+阅读 · 4月3日

ENEIDE: A High Quality Silver Standard Dataset for Named Entity Recognition and Linking in Historical Italian

Arxiv

0+阅读 · 3月31日

Clinical named entity recognition in the Portuguese language: a benchmark of modern BERT models and LLMs

Arxiv

0+阅读 · 3月27日

CodeNER: Code Prompting for Named Entity Recognition

Arxiv

0+阅读 · 3月26日

CaseLinker: An Open-Source System for Cross-Case Analysis of Internet Crimes Against Children Reports

Arxiv

0+阅读 · 3月20日

Learning Nested Named Entity Recognition from Flat Annotations

Arxiv

0+阅读 · 2月28日

A Dataset for Named Entity Recognition and Relation Extraction from Art-historical Image Descriptions

Arxiv

0+阅读 · 2月22日

A Survey on Deep Learning for Named Entity Recognition

A Survey on Deep Learning for Named Entity Recognition

Arxiv

73+阅读 · 2018年12月22日

相关基金

面向跨领域异构数据的患者相似性学习方法及应用

国家自然科学基金

23+阅读 · 2016年12月31日

面向知识库的实体链接技术研究

国家自然科学基金

13+阅读 · 2015年12月31日

抽样环境下基于流记录的行为特征分析与多分类器识别模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于弱监督学习的细粒度中医临床医学实体识别方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

多标记文本数据流分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于大数据分析的犯罪模式挖掘与犯罪预测研究

国家自然科学基金

7+阅读 · 2015年12月31日

面向异构信息网络中实体归类的模糊聚类

国家自然科学基金

1+阅读 · 2015年12月31日

面向事件分析的信息意图检测、建模与群体意图推理技术研究

国家自然科学基金

12+阅读 · 2014年12月31日

基于案事件流数据的犯罪行为时空分析研究

国家自然科学基金

3+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员