GitHub and GitLab are widely used collaborative platforms whose issue-tracking systems contain large volumes of unstructured text, including logs, code snippets, and configuration examples. This creates a significant risk of accidental secret exposure, such as API keys and credentials, yet these platforms provide no mechanism to warn users before submission. We present \textsc{IssueGuard}, a tool for real-time detection and prevention of secret leaks in issue reports. Implemented as a Chrome extension, \textsc{IssueGuard} analyzes text as users type and combines regex-based candidate extraction with a fine-tuned CodeBERT model for contextual classification. This approach effectively separates real secrets from false positives and achieves an F1-score of 92.70\% on a benchmark dataset, outperforming traditional regex-based scanners. \textsc{IssueGuard} integrates directly into the web interface and continuously analyzes the issue editor, presenting clear visual warnings to help users avoid submitting sensitive data. The source code is publicly available at \href{https://github.com/nafiurahman00/IssueGuard}{https://github.com/nafiurahman00/IssueGuard}, and a demonstration video is available at \href{https://youtu.be/kvbWA8rr9cU}{https://youtu.be/kvbWA8rr9cU}.


翻译:GitHub和GitLab是广泛使用的协作平台,其议题跟踪系统包含大量非结构化文本,如日志、代码片段和配置示例。这带来了意外泄露密钥(如API密钥和凭证)的重大风险,但这些平台在用户提交前并未提供任何预警机制。本文提出\textsc{IssueGuard},一种用于实时检测和预防议题报告中密钥泄露的工具。该工具以Chrome扩展形式实现,在用户输入时分析文本,并结合基于正则表达式的候选提取与微调的CodeBERT模型进行上下文分类。该方法能有效区分真实密钥与误报,在基准数据集上取得了92.70\%的F1分数,性能优于传统的基于正则表达式的扫描器。\textsc{IssueGuard}直接集成到网页界面中,持续分析议题编辑器,并通过清晰的可视化警告帮助用户避免提交敏感数据。源代码公开于\href{https://github.com/nafiurahman00/IssueGuard}{https://github.com/nafiurahman00/IssueGuard},演示视频可在\href{https://youtu.be/kvbWA8rr9cU}{https://youtu.be/kvbWA8rr9cU}查看。

0
下载
关闭预览

相关内容

GitHub.com 使用 Git 作为版本控制系统(version control system)提供在线源码托管的服务,同时是个有社交功能的开发者社区。 国外类似服务: Bitbucket.com
Gitlab.com
国内类似服务:
Coding.net
专知会员服务
40+阅读 · 2020年12月20日
八个不容错过的 GitHub Copilot 功能!
CSDN
11+阅读 · 2022年9月22日
重磅:git checkout 未来将消失
Python程序员
15+阅读 · 2019年8月22日
Github项目推荐 | PyTorch 中文手册 (pytorch handbook)
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
专知会员服务
40+阅读 · 2020年12月20日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员