Objective: Social determinants of health (SDOH) impact health outcomes and are documented in the electronic health record (EHR) through structured data and unstructured clinical notes. However, clinical notes often contain more comprehensive SDOH information, detailing aspects such as status, severity, and temporality. This work has two primary objectives: i) develop a natural language processing (NLP) information extraction model to capture detailed SDOH information and ii) evaluate the information gain achieved by applying the SDOH extractor to clinical narratives and combining the extracted representations with existing structured data. Materials and Methods: We developed a novel SDOH extractor using a deep learning entity and relation extraction architecture to characterize SDOH across various dimensions. In an EHR case study, we applied the SDOH extractor to a large clinical data set with 225,089 patients and 430,406 notes with social history sections and compared the extracted SDOH information with existing structured data. Results: The SDOH extractor achieved 0.86 F1 on a withheld test set. In the EHR case study, we found extracted SDOH information complements existing structured data with 32% of homeless patients, 19% of current tobacco users, and 10% of drug users only having these health risk factors documented in the clinical narrative. Conclusions: Utilizing EHR data to identify SDOH health risk factors and social needs may improve patient care and outcomes. Semantic representations of text-encoded SDOH information can augment existing structured data, and this more comprehensive SDOH representation can assist health systems in identifying and addressing these social needs.


翻译:目的:社会健康决定因素(SDOH)影响健康结果,并通过结构化数据和非结构化临床笔记记录在电子健康记录(EHR)中。然而,临床笔记通常包含更全面的SDOH信息,详细描述了状态、严重性和时间性等各个方面。本研究有两个主要目标:i)开发一种自然语言处理(NLP)信息提取模型以捕获详细的SDOH信息;ii)评估将SDOH提取器应用于临床叙述并将提取的表示与现有结构化数据相结合所实现的信息增益。材料与方法:我们利用深度学习实体和关系提取架构开发了一种新型SDOH提取器,以表征不同维度的SDOH。在一项EHR案例研究中,我们将SDOH提取器应用于一个包含225,089名患者和430,406份带有社会历史章节笔记的大型临床数据集,并将提取的SDOH信息与现有结构化数据进行了比较。结果:SDOH提取器在保留测试集上达到了0.86的F1分数。在EHR案例研究中,我们发现提取的SDOH信息补充了现有结构化数据:32%的无家可归患者、19%的当前烟草使用者以及10%的药物使用者仅在这些健康风险因素被记录在临床叙述中。结论:利用EHR数据识别SDOH健康风险因素和社会需求可能改善患者护理和结果。文本编码的SDOH信息的语义表示可以增强现有结构化数据,而这种更全面的SDOH表示有助于卫生系统识别和解决这些社会需求。

0
下载
关闭预览

相关内容

金融领域自然语言处理研究资源大列表
专知
13+阅读 · 2020年2月27日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
一文读懂依存句法分析
AINLP
16+阅读 · 2019年4月28日
Zero-Shot Learning相关资源大列表
专知
52+阅读 · 2019年1月1日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
18+阅读 · 2018年12月24日
深度学习医学图像分析文献集
机器学习研究会
19+阅读 · 2017年10月13日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
15+阅读 · 2022年1月24日
Arxiv
15+阅读 · 2021年11月19日
Arxiv
37+阅读 · 2021年8月2日
VIP会员
最新内容
超越网格:作战环境对炮兵的影响
专知会员服务
2+阅读 · 5月31日
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
5+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
5+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
18+阅读 · 5月30日
基于声学的无人机检测技术综述
专知会员服务
10+阅读 · 5月30日
《当代混合战争分析框架:俄乌战争经验教训》
相关VIP内容
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员