Online user generated content games (UGCGs) are increasingly popular among children and adolescents for social interaction and more creative online entertainment. However, they pose a heightened risk of exposure to explicit content, raising growing concerns for the online safety of children and adolescents. Despite these concerns, few studies have addressed the issue of illicit image-based promotions of unsafe UGCGs on social media, which can inadvertently attract young users. This challenge arises from the difficulty of obtaining comprehensive training data for UGCG images and the unique nature of these images, which differ from traditional unsafe content. In this work, we take the first step towards studying the threat of illicit promotions of unsafe UGCGs. We collect a real-world dataset comprising 2,924 images that display diverse sexually explicit and violent content used to promote UGCGs by their game creators. Our in-depth studies reveal a new understanding of this problem and the urgent need for automatically flagging illicit UGCG promotions. We additionally create a cutting-edge system, UGCG-Guard, designed to aid social media platforms in effectively identifying images used for illicit UGCG promotions. This system leverages recently introduced large vision-language models (VLMs) and employs a novel conditional prompting strategy for zero-shot domain adaptation, along with chain-of-thought (CoT) reasoning for contextual identification. UGCG-Guard achieves outstanding results, with an accuracy rate of 94% in detecting these images used for the illicit promotion of such games in real-world scenarios.


翻译:在线用户生成内容游戏(UGCGs)在儿童和青少年中日益流行,成为他们进行社交互动和获取更具创意的在线娱乐途径。然而,这类游戏也带来了接触露骨内容的更高风险,引发了对儿童及青少年网络安全的日益担忧。尽管存在这些担忧,但鲜有研究关注社交媒体上基于图像的非法推广不安全UGCGs问题——此类推广可能无意中吸引年轻用户。这一挑战源于获取UGCG图像的全面训练数据存在困难,且这些图像具有不同于传统不安全内容的独特性。在本研究中,我们首次系统性地探索了不安全UGCGs非法推广的威胁。我们收集了一个包含2924张图像的真实世界数据集,这些图像展示了游戏创作者用于推广UGCGs的多种色情与暴力内容。深入分析揭示了该问题的新认知,以及自动标记非法UGCG推广的迫切需求。我们进一步开发了前沿系统UGCG-Guard,旨在协助社交媒体平台有效识别用于非法UGCG推广的图像。该系统利用最新的大型视觉语言模型(VLMs),并采用新颖的条件提示策略实现零样本领域自适应,结合思维链(CoT)推理进行上下文识别。在真实场景中,UGCG-Guard检测此类非法推广图像的准确率达到94%,表现出色。

0
下载
关闭预览

相关内容

《可控视频生成:综述》
专知会员服务
17+阅读 · 2025年7月24日
AIGC大模型测评综述:使能技术,安全隐患和应对
专知会员服务
49+阅读 · 2024年7月2日
AIGC视觉内容生成与溯源研究进展
专知会员服务
28+阅读 · 2024年3月26日
《利用大型语言模型检测社交平台上的网络欺凌行为》
专知会员服务
45+阅读 · 2024年1月23日
深度解析人脸关键点Landmark算法FPS3000
CVer
13+阅读 · 2020年7月4日
云游戏行业发展趋势分析报告
行业研究报告
13+阅读 · 2019年3月24日
【知识图谱】基于知识图谱的用户画像技术
产业智能官
103+阅读 · 2019年1月9日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
4+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
4+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
5+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关VIP内容
《可控视频生成:综述》
专知会员服务
17+阅读 · 2025年7月24日
AIGC大模型测评综述:使能技术,安全隐患和应对
专知会员服务
49+阅读 · 2024年7月2日
AIGC视觉内容生成与溯源研究进展
专知会员服务
28+阅读 · 2024年3月26日
《利用大型语言模型检测社交平台上的网络欺凌行为》
专知会员服务
45+阅读 · 2024年1月23日
相关基金
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2017年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
13+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员