Warning: This paper discusses topics of suicide and suicidal ideation, which may be distressing to some readers. The National Violent Death Reporting System (NVDRS) documents information about suicides in the United States, including free text narratives (e.g., circumstances surrounding a suicide). In a demanding public health data pipeline, annotators manually extract structured information from death investigation records following extensive guidelines developed painstakingly by experts. In this work, we facilitate data-driven insights from the NVDRS data to support the development of novel suicide interventions by investigating the value of language models (LMs) as efficient assistants to these (a) data annotators and (b) experts. We find that LM predictions match existing data annotations about 85% of the time across 50 NVDRS variables. In the cases where the LM disagrees with existing annotations, expert review reveals that LM assistants can surface annotation discrepancies 38% of the time. Finally, we introduce a human-in-the-loop algorithm to assist experts in efficiently building and refining guidelines for annotating new variables by allowing them to focus only on providing feedback for incorrect LM predictions. We apply our algorithm to a real-world case study for a new variable that characterizes victim interactions with lawyers and demonstrate that it achieves comparable annotation quality with a laborious manual approach. Our findings provide evidence that LMs can serve as effective assistants to public health researchers who handle sensitive data in high-stakes scenarios.


翻译:警示:本文讨论自杀及自杀意念相关话题,可能对部分读者造成困扰。美国国家暴力死亡报告系统(NVDRS)记录了美国境内自杀事件的相关信息,包括自由文本叙述(如自杀事件发生的情境)。在要求严格的数据处理流程中,标注人员需根据专家精心制定的详细指南,从死亡调查记录中手动提取结构化信息。本研究通过探究语言模型(LMs)作为高效辅助工具对(a)数据标注人员和(b)专家两类角色的支持价值,促进从NVDRS数据中获取数据驱动的洞察,从而助力新型自杀干预措施的开发。我们发现,在涉及50个NVDRS变量的场景中,语言模型的预测结果与现有数据标注的一致率约为85%。当语言模型与现有标注存在分歧时,专家复核表明语言模型辅助工具能在38%的情况下揭示标注差异。最后,我们提出了一种人机协同算法,通过仅需专家对语言模型错误预测结果进行反馈的方式,高效协助专家构建和完善新变量的标注指南。将该算法应用于描述受害者与律师互动情况的新变量实际案例研究中,我们证明其标注质量可与耗时的人工方法相媲美。研究结果表明,语言模型可作为处理高风险场景中敏感数据的公共卫生研究人员的有效辅助工具。

0
下载
关闭预览

相关内容

大型语言模型在预测和异常检测中的应用综述
专知会员服务
70+阅读 · 2024年2月19日
预训练语言模型的应用综述
专知会员服务
36+阅读 · 2023年1月23日
专知会员服务
61+阅读 · 2021年5月28日
专知会员服务
123+阅读 · 2020年12月9日
金融领域自然语言处理研究资源大列表
专知
13+阅读 · 2020年2月27日
自然语言处理中的语言模型预训练方法
PaperWeekly
14+阅读 · 2018年10月21日
干货|当深度学习遇见自动文本摘要,seq2seq+attention
机器学习算法与Python学习
10+阅读 · 2018年5月28日
干货!自然语言处理中的自注意力机制!
全球人工智能
11+阅读 · 2018年3月27日
从语言学到深度学习NLP,一文概述自然语言处理
人工智能学家
13+阅读 · 2018年1月28日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
最新内容
ECCV 2026 | MIMFlow:MIM与归一化流统一图像生成
专知会员服务
2+阅读 · 今天11:43
网状网络及其在军事领域的运用
专知会员服务
5+阅读 · 今天6:18
无美国参与的欧洲战争方式(万字长文)
专知会员服务
6+阅读 · 今天5:54
《国防领域敏感性分析白皮书》
专知会员服务
7+阅读 · 今天3:42
综述 | 从问答到任务完成:Agent系统与Harness设计
Agentic RL:框架、实践与长程智能体训练
专知会员服务
7+阅读 · 6月24日
重新思考无人机时代的生存能力
专知会员服务
9+阅读 · 6月24日
装甲突击旅:现代战争思考、战斗与组织
专知会员服务
7+阅读 · 6月24日
在人工智能加速决策环境中拓展OODA循环
专知会员服务
9+阅读 · 6月24日
相关VIP内容
大型语言模型在预测和异常检测中的应用综述
专知会员服务
70+阅读 · 2024年2月19日
预训练语言模型的应用综述
专知会员服务
36+阅读 · 2023年1月23日
专知会员服务
61+阅读 · 2021年5月28日
专知会员服务
123+阅读 · 2020年12月9日
相关基金
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
0+阅读 · 2016年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员