GitHub and GitLab are widely used collaborative platforms whose issue-tracking systems contain large volumes of unstructured text, including logs, code snippets, and configuration examples. This creates a significant risk of accidental secret exposure, such as API keys and credentials, yet these platforms provide no mechanism to warn users before submission. We present \textsc{IssueGuard}, a tool for real-time detection and prevention of secret leaks in issue reports. Implemented as a Chrome extension, \textsc{IssueGuard} analyzes text as users type and combines regex-based candidate extraction with a fine-tuned CodeBERT model for contextual classification. This approach effectively separates real secrets from false positives and achieves an F1-score of 92.70\% on a benchmark dataset, outperforming traditional regex-based scanners. \textsc{IssueGuard} integrates directly into the web interface and continuously analyzes the issue editor, presenting clear visual warnings to help users avoid submitting sensitive data. The source code is publicly available at \href{https://github.com/disa-lab/IssueGuard}{https://github.com/disa-lab/IssueGuard} , and a demonstration video is available at \href{https://youtu.be/kvbWA8rr9cU}{https://youtu.be/kvbWA8rr9cU} .


翻译:GitHub与GitLab作为广泛使用的协作平台,其问题追踪系统包含大量非结构化文本,如日志、代码片段及配置示例。这导致了API密钥、凭证等敏感信息意外泄露的高风险,然而这些平台并未在提交前提供预警机制。本文提出\textsc{IssueGuard}工具,用于实时检测并阻止问题报告中的秘密泄露。作为Chrome扩展程序实现,\textsc{IssueGuard}在用户输入时实时分析文本,通过基于正则表达式的候选提取与微调后的CodeBERT模型进行上下文分类。该方法有效区分真实秘密与误报,在基准数据集上达到92.70%的F1分值,性能优于传统正则扫描器。\textsc{IssueGuard}直接集成于网页界面,持续分析问题编辑器状态,通过可视化警告帮助用户避免提交敏感数据。源代码开源发布至\href{https://github.com/disa-lab/IssueGuard}{https://github.com/disa-lab/IssueGuard},演示视频见\href{https://youtu.be/kvbWA8rr9cU}{https://youtu.be/kvbWA8rr9cU}。

0
下载
关闭预览

相关内容

GitHub.com 使用 Git 作为版本控制系统(version control system)提供在线源码托管的服务,同时是个有社交功能的开发者社区。 国外类似服务: Bitbucket.com
Gitlab.com
国内类似服务:
Coding.net
八个不容错过的 GitHub Copilot 功能!
CSDN
11+阅读 · 2022年9月22日
重磅:git checkout 未来将消失
Python程序员
15+阅读 · 2019年8月22日
Github项目推荐 | Emotion-recognition 实时表情识别
AI科技评论
19+阅读 · 2019年7月8日
Github 项目推荐 | PyTorch 实现的 GAN 文本生成框架
AI研习社
35+阅读 · 2019年6月10日
FaceNiff工具 - 适用于黑客的Android应用程序
黑白之道
151+阅读 · 2019年4月7日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 4月15日
VIP会员
最新内容
从看见到认知世界:视觉世界模型综述
专知会员服务
7+阅读 · 5月17日
《高超声速打击武器引发的战略影响》116页
专知会员服务
8+阅读 · 5月17日
《美军不对称战略选择》28页slides
专知会员服务
9+阅读 · 5月17日
《审视 Palantir 监控平台》
专知会员服务
20+阅读 · 5月17日
PALANTIR GOTHAM平台:人工智能赋能作战
专知会员服务
17+阅读 · 5月17日
集成式人工智能:Palantir与认知维度
专知会员服务
11+阅读 · 5月17日
AI原生数据库发展趋势白皮书
专知会员服务
13+阅读 · 5月16日
相关VIP内容
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员