Deja Vu in Plots: Leveraging Cross-Session Evidence with Retrieval-Augmented LLMs for Live Streaming Risk Assessment

The rise of live streaming has transformed online interaction, enabling massive real-time engagement but also exposing platforms to complex risks such as scams and coordinated malicious behaviors. Detecting these risks is challenging because harmful actions often accumulate gradually and recur across seemingly unrelated streams. To address this, we propose CS-VAR (Cross-Session Evidence-Aware Retrieval-Augmented Detector) for live streaming risk assessment. In CS-VAR, a lightweight, domain-specific model performs fast session-level risk inference, guided during training by a Large Language Model (LLM) that reasons over retrieved cross-session behavioral evidence and transfers its local-to-global insights to the small model. This design enables the small model to recognize recurring patterns across streams, perform structured risk assessment, and maintain efficiency for real-time deployment. Extensive offline experiments on large-scale industrial datasets, combined with online validation, demonstrate the state-of-the-art performance of CS-VAR. Furthermore, CS-VAR provides interpretable, localized signals that effectively empower real-world moderation for live streaming.

翻译：直播的兴起改变了在线互动方式，实现了大规模的实时参与，但也使平台面临诈骗和协同恶意行为等复杂风险。检测这些风险具有挑战性，因为有害行为往往逐渐累积，并在看似无关的直播流中反复出现。为此，我们提出CS-VAR（跨会话证据感知检索增强检测器）用于直播风险评估。在CS-VAR中，一个轻量级的领域专用模型执行快速的会话级风险推断，其训练过程由大型语言模型（LLM）指导——该LLM基于检索到的跨会话行为证据进行推理，并将其从局部到全局的洞察迁移至小模型。这种设计使小模型能够识别跨直播流的重复模式，执行结构化风险评估，并保持实时部署的效率。基于大规模工业数据集的广泛离线实验结合在线验证，证明了CS-VAR的先进性能。此外，CS-VAR提供可解释的局部化信号，有效赋能现实世界的直播内容审核。

相关内容

计算机科学

关注 56

计算机科学（Computer Science, CS）是系统性研究信息与计算的理论基础以及它们在计算机系统中如何实现与应用的实用技术的学科。它通常被形容为对那些创造、描述以及转换信息的算法处理的系统研究。计算机科学包含很多分支领域；其中一些，比如计算机图形学强调特定结果的计算，而另外一些，比如计算复杂性理论是学习计算问题的性质。还有一些领域专注于挑战怎样实现计算。比如程序设计语言理论学习描述计算的方法，而程序设计是应用特定的程序设计语言解决特定的计算问题，人机交互则是专注于挑战怎样使计算机和计算变得有用、可用，以及随时随地为人所用。 现代计算机科学( Computer Science)包含理论计算机科学和应用计算机科学两大分支。

《人工智能增强监视分析：利用跨网络、陆地、空中及海上领域的威胁向量实时建模》

专知会员服务

28+阅读 · 2025年12月11日

《利用人工智能增强的监视分析在网络、陆地、空中和海上领域实时建模威胁向量》

专知会员服务

21+阅读 · 2025年11月2日

《缓解大语言模型（LLMs）幻觉：面向应用的检索增强生成（RAG）、推理与智能体系统综述》

专知会员服务

24+阅读 · 2025年10月29日

《利用 LLM 进行高级持续性威胁 (APT) 检测和智能解释》

专知会员服务

23+阅读 · 2025年2月14日