A large number of URLs are made public by various platforms for security analysis, archiving, and paste sharing -- such as VirusTotal, URLScan.io, Hybrid Analysis, the Wayback Machine, and RedHunt. These services may unintentionally expose links containing sensitive information, as reported in some news articles and blog posts. However, no large-scale measurement has quantified the extent of such exposures. We present an automated system that detects and analyzes potential sensitive information leaked through publicly accessible URLs. The system combines lexical URL filtering, dynamic rendering, OCR-based extraction, and content classification to identify potential leaks. We apply it to 6,094,475 URLs collected from public scanning platforms, paste sites, and web archives, identifying 12,331 potential exposures across authentication, financial, personal, and document-related domains. These findings show that sensitive information remains exposed, underscoring the importance of automated detection to identify accidental leaks.


翻译:大量URL被各类平台公开用于安全分析、归档和粘贴共享——例如VirusTotal、URLScan.io、Hybrid Analysis、Wayback Machine和RedHunt。正如某些新闻报道和博客文章所述,这些服务可能无意中暴露包含敏感信息的链接。然而,目前尚无大规模测量研究量化此类暴露的程度。我们提出了一种自动化系统,用于检测和分析通过公开访问URL泄露的潜在敏感信息。该系统结合了词汇URL过滤、动态渲染、基于OCR的提取和内容分类技术来识别潜在泄露。我们将其应用于从公共扫描平台、粘贴站点和网络档案中收集的6,094,475个URL,在身份验证、金融、个人和文档相关领域识别出12,331个潜在暴露案例。这些发现表明敏感信息仍处于暴露状态,凸显了通过自动化检测识别意外泄露的重要性。

0
下载
关闭预览

相关内容

《使用静态污点分析检测恶意代码》CMU最新30页slides
专知会员服务
21+阅读 · 2023年10月11日
Xsser 一款自动检测XSS漏洞工具
黑白之道
14+阅读 · 2019年8月26日
Web渗透测试Fuzz字典分享
黑白之道
21+阅读 · 2019年5月22日
20个安全可靠的免费数据源,各领域数据任你挑
机器学习算法与Python学习
13+阅读 · 2019年5月9日
被动DNS,一个被忽视的安全利器
运维帮
11+阅读 · 2019年3月8日
NetworkMiner - 网络取证分析工具
黑白之道
16+阅读 · 2018年6月29日
如何访问"暗网"(慎入)
黑白之道
145+阅读 · 2018年6月14日
网络安全态势感知浅析
计算机与网络安全
18+阅读 · 2017年10月13日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
VIP会员
相关VIP内容
《使用静态污点分析检测恶意代码》CMU最新30页slides
专知会员服务
21+阅读 · 2023年10月11日
相关资讯
Xsser 一款自动检测XSS漏洞工具
黑白之道
14+阅读 · 2019年8月26日
Web渗透测试Fuzz字典分享
黑白之道
21+阅读 · 2019年5月22日
20个安全可靠的免费数据源,各领域数据任你挑
机器学习算法与Python学习
13+阅读 · 2019年5月9日
被动DNS,一个被忽视的安全利器
运维帮
11+阅读 · 2019年3月8日
NetworkMiner - 网络取证分析工具
黑白之道
16+阅读 · 2018年6月29日
如何访问"暗网"(慎入)
黑白之道
145+阅读 · 2018年6月14日
网络安全态势感知浅析
计算机与网络安全
18+阅读 · 2017年10月13日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
19+阅读 · 2015年12月31日
国家自然科学基金
20+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员