Child sexual exploitation and abuse (CSEA) case data is inherently disturbing, fragmented across multiple organizations, jurisdictions, and agencies, with varying levels of detail and formatting, making cross-case analysis, pattern identification, and trend detection challenging. This paper presents CaseLinker, a modular system for ingesting, processing, analyzing, and visualizing CSEA case data. CaseLinker employs a hybrid deterministic information extraction approach combining regex-based extraction for structured data (demographics, platforms, evidence) with pattern-based semantic analysis for severity indicators and case topics, ensuring interpretability and auditability. The system extracts relevant case information, populates a comprehensive case schema, creates six interactive visualizations (Timeline, Severity Indicators, Case Visualization, Previous Perpetrator Status, Environment/Platforms, Organizations Involved), provides a platform for deeper automated and manual analysis, groups similar cases using weighted Jaccard similarity across multiple dimensions (platforms, demographics, topics, severity, investigation type), and provides automated triage and insights based on collected case data. CaseLinker is evaluated on 47 cases from publicly available AZICAC reports (2011-2014), demonstrating effective information extraction, case clustering, automated insights generation, and interactive visualization capabilities. CaseLinker addresses critical challenges in case analysis including fragmented data sources, cross-case pattern identification, and the emotional burden of repeatedly processing disturbing case material.


翻译:儿童性剥削与虐待(CSEA)案件数据具有固有的敏感性,分散于多个组织、司法管辖区和机构之间,且详细程度与格式各异,导致跨案例分析、模式识别和趋势检测极具挑战。本文介绍CaseLinker——一个用于接收、处理、分析及可视化CSEA案件数据的模块化系统。CaseLinker采用混合确定性信息抽取方法:对结构化数据(人口统计特征、平台、证据)使用基于正则表达式的抽取,对严重性指标和案件主题则采用基于模式的语义分析,确保系统可解释性与可审计性。该系统可抽取相关案件信息,填充综合案件模式,生成六类交互式可视化(时间线、严重性指标、案件可视化、前科施暴者状态、环境/平台、涉案组织),为深层自动化与人工分析提供平台,通过加权杰卡德相似度(涵盖平台、人口统计特征、主题、严重性、调查类型等多维度)对相似案件进行聚类,并基于收集的案件数据提供自动化分诊与洞察。我们在来自公开AZICAC报告(2011-2014年)的47起案件上对CaseLinker进行了评估,结果表明其具备高效的信息抽取、案件聚类、自动化洞察生成及交互式可视化能力。CaseLinker有效应对了案件分析中的关键挑战,包括分散的数据源、跨案例模式识别,以及反复处理干扰性案件材料所造成的情感负担。

0
下载
关闭预览

相关内容

基于事件社会网络推荐系统综述
专知会员服务
71+阅读 · 2021年1月13日
NetworkMiner - 网络取证分析工具
黑白之道
16+阅读 · 2018年6月29日
【团队新作】连续情感识别,精准捕捉你的小情绪!
中国科学院自动化研究所
16+阅读 · 2018年4月17日
警务云情报分析研判平台解决方案(ppt)
智能交通技术
17+阅读 · 2018年3月18日
推荐|caffe-orc主流ocr算法:CNN+BLSTM+CTC架构实现!
全球人工智能
19+阅读 · 2017年10月29日
网络安全态势感知浅析
计算机与网络安全
18+阅读 · 2017年10月13日
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
VIP会员
最新内容
BES:让语言模型通过双向进化搜索自我改进
专知会员服务
3+阅读 · 5月30日
以色列-美国-伊朗战争中的无人机:关键要点
专知会员服务
4+阅读 · 5月30日
《Palantir任务保障性软件安全标准(MA-S2)》
专知会员服务
10+阅读 · 5月30日
基于声学的无人机检测技术综述
专知会员服务
7+阅读 · 5月30日
《当代混合战争分析框架:俄乌战争经验教训》
战略前沿人工智能的再思考(中文)
专知会员服务
8+阅读 · 5月29日
《量化地基防空系统间接效应的博弈论方法》
专知会员服务
6+阅读 · 5月29日
相关VIP内容
基于事件社会网络推荐系统综述
专知会员服务
71+阅读 · 2021年1月13日
相关基金
国家自然科学基金
23+阅读 · 2016年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员