BLM-Guard：基于思维链与策略对齐奖励的可解释多模态广告审核 (BLM-Guard: Explainable Multimodal Ad Moderation with Chain-of-Thought and Policy-Aligned Rewards) - 专知论文

会员服务 ·

0

模态 · 多模 · 思维链 · 多模态 · 视频 ·

BLM-Guard: Explainable Multimodal Ad Moderation with Chain-of-Thought and Policy-Aligned Rewards

翻译：BLM-Guard：基于思维链与策略对齐奖励的可解释多模态广告审核

Yiran Yang,Zhaowei Liu,Yuan Yuan,Yukun Song,Xiong Ma,Yinghao Song,Xiangji Zeng,Lu Sun,Yulu Wang,Hai Zhou,Shuai Cui,Zhaohan Gong,Jiefei Zhang

from arxiv, 7 pages, 3 figures. To appear in AAAI 2026

Short-video platforms now host vast multimodal ads whose deceptive visuals, speech and subtitles demand finer-grained, policy-driven moderation than community safety filters. We present BLM-Guard, a content-audit framework for commercial ads that fuses Chain-of-Thought reasoning with rule-based policy principles and a critic-guided reward. A rule-driven ICoT data-synthesis pipeline jump-starts training by generating structured scene descriptions, reasoning chains and labels, cutting annotation costs. Reinforcement learning then refines the model using a composite reward balancing causal coherence with policy adherence. A multitask architecture models intra-modal manipulations (e.g., exaggerated imagery) and cross-modal mismatches (e.g., subtitle-speech drift), boosting robustness. Experiments on real short-video ads show BLM-Guard surpasses strong baselines in accuracy, consistency and generalization.

翻译：短视频平台当前承载着海量多模态广告，其欺骗性视觉内容、语音及字幕需要比社区安全过滤器更细粒度、策略驱动的审核机制。本文提出BLM-Guard——面向商业广告的内容审核框架，该框架融合思维链推理、基于规则的策略原则与评论家引导的奖励机制。通过规则驱动的ICoT数据合成流程生成结构化场景描述、推理链与标注，显著降低标注成本并快速启动训练。强化学习随后采用平衡因果连贯性与策略遵从性的复合奖励对模型进行微调。多任务架构同时建模模态内操纵（如夸张图像）与跨模态失配（如字幕-语音偏移），从而增强系统鲁棒性。在真实短视频广告数据集上的实验表明，BLM-Guard在准确性、一致性和泛化能力方面均超越现有基线模型。

0

相关内容

【AAAI2026】Align3GR：面向 LLM 生成式推荐的统一多层次对齐方法

【AAAI2026】Align3GR：面向 LLM 生成式推荐的统一多层次对齐方法

专知会员服务

13+阅读 · 2025年11月17日

认知优势：人工智能在国家安全决策中的核心作用

认知优势：人工智能在国家安全决策中的核心作用

专知会员服务

14+阅读 · 2025年8月16日

【CVPR2024】MA-LMM: 内存增强的大型多模态模型，用于长期视频理解

【CVPR2024】MA-LMM: 内存增强的大型多模态模型，用于长期视频理解

专知会员服务

21+阅读 · 2024年4月9日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

什么是大模型Red-teaming？大模型安全研究《结构大语言模型红蓝对抗》（含下载）

什么是大模型Red-teaming？大模型安全研究《结构大语言模型红蓝对抗》（含下载）

专知会员服务

54+阅读 · 2023年5月1日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

【开放书】《Multimedia Forensics》多媒体取证与安全，494页pdf

【开放书】《Multimedia Forensics》多媒体取证与安全，494页pdf

专知会员服务

50+阅读 · 2022年4月14日

【博士论文】推荐系统多行为建模与隐私保护研究

【博士论文】推荐系统多行为建模与隐私保护研究

专知会员服务

53+阅读 · 2021年11月27日

移动数字广告与互联网反欺诈蓝皮报告

移动数字广告与互联网反欺诈蓝皮报告

专知会员服务

28+阅读 · 2021年5月13日

【ACM MM 2019 】MMGCN：用于微视频个性化推荐的多模图卷积网络（MMGCN：Multi-modal Graph Convolution Network for Personalized Recommendation of Micro-video）

【ACM MM 2019 】MMGCN：用于微视频个性化推荐的多模图卷积网络（MMGCN：Multi-modal Graph Convolution Network for Personalized Recommendation of Micro-video）

专知会员服务

57+阅读 · 2019年11月20日

MOBIUS：百度凤巢新一代广告召回系统

MOBIUS：百度凤巢新一代广告召回系统

DataFunTalk

11+阅读 · 2020年10月3日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

【论文笔记】具有深度注意力网络的协同Bundle（项目组合）推荐

【论文笔记】具有深度注意力网络的协同Bundle（项目组合）推荐

专知

11+阅读 · 2019年10月14日

【论文笔记】注意力机制的协同过滤模型 Attentive Collaborative Filtering(ACF)

【论文笔记】注意力机制的协同过滤模型 Attentive Collaborative Filtering(ACF)

专知

50+阅读 · 2019年9月23日

主流互联网平台广告业务对比分析

主流互联网平台广告业务对比分析

百度公共政策研究院

29+阅读 · 2019年5月20日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

推荐策略产品经理：剖析协同过滤（千人千面推荐的核心）

推荐策略产品经理：剖析协同过滤（千人千面推荐的核心）

PMCAFF

10+阅读 · 2019年3月14日

【论文推荐】最新六篇视觉问答相关论文—鲁棒性分析、虚拟意象、双曲注意力网络、R-VQA、关系推理、双线性注意力网络

【论文推荐】最新六篇视觉问答相关论文—鲁棒性分析、虚拟意象、双曲注意力网络、R-VQA、关系推理、双线性注意力网络

专知

17+阅读 · 2018年6月7日

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

专知

11+阅读 · 2018年6月4日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

考虑价格歧视和广告效应的网络团购销售策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习和马尔科夫逻辑网络的特殊视频识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

逻辑错误屏蔽的近似电路逻辑综合多目标优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向CCMANET网络可证明安全命名与名字路由机制关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

恐怖组织网络动态演化与干预策略研究

国家自然科学基金

0+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

互联网实时竞价广告的若干关键问题研究

国家自然科学基金

2+阅读 · 2014年12月31日

SFCoT: Safer Chain-of-Thought via Active Safety Evaluation and Calibration

SFCoT: Safer Chain-of-Thought via Active Safety Evaluation and Calibration

Arxiv

0+阅读 · 3月16日

DistillGuard: Evaluating Defenses Against LLM Knowledge Distillation

Arxiv

0+阅读 · 3月8日

Bloom: Designing for LLM-Augmented Behavior Change Interactions

Arxiv

0+阅读 · 3月3日

Decision Quality Evaluation Framework at Pinterest

Decision Quality Evaluation Framework at Pinterest

Arxiv

0+阅读 · 2月17日

Bielik Guard: Efficient Polish Language Safety Classifiers for LLM Content Moderation

Arxiv

0+阅读 · 2月13日

Poly-Guard: Massive Multi-Domain Safety Policy-Grounded Guardrail Dataset

Arxiv

0+阅读 · 2月11日

Bielik Guard: Efficient Polish Language Safety Classifiers for LLM Content Moderation

Arxiv

0+阅读 · 2月11日

Efficient and Adaptable Detection of Malicious LLM Prompts via Bootstrap Aggregation

Arxiv

0+阅读 · 2月8日

Beyond Static Alignment: Hierarchical Policy Control for LLM Safety via Risk-Aware Chain-of-Thought

Arxiv

0+阅读 · 2月6日

Efficient LLM Moderation with Multi-Layer Latent Prototypes

Arxiv

0+阅读 · 2月6日

VIP会员

文章信息

相关主题

最新内容

美军MAVEN项目全面解析：算法战架构

美军MAVEN项目全面解析：算法战架构

专知会员服务

13+阅读 · 今天8:36

从俄乌战场看“马赛克战”（万字长文）

从俄乌战场看“马赛克战”（万字长文）

专知会员服务

8+阅读 · 今天8:19

人工智能与机器人自主系统等新兴技术革命将如何影响地面作战的指挥控制？

人工智能与机器人自主系统等新兴技术革命将如何影响地面作战的指挥控制？

专知会员服务

9+阅读 · 4月12日

弹性指挥控制：北约、伊朗与俄罗斯指挥控制架构的比较分析

弹性指挥控制：北约、伊朗与俄罗斯指挥控制架构的比较分析

专知会员服务

7+阅读 · 4月12日

最新“指挥控制”领域出版物合集（16份）

最新“指挥控制”领域出版物合集（16份）

专知会员服务

13+阅读 · 4月12日

面向军事作战需求开发的人工智能（RAIMOND）

面向军事作战需求开发的人工智能（RAIMOND）

专知会员服务

19+阅读 · 4月12日

检测算法战：一个识别军事行动中人工智能特征的框架

检测算法战：一个识别军事行动中人工智能特征的框架

专知会员服务

13+阅读 · 4月12日

软件定义多域战术网络：基础与未来方向（综述）

软件定义多域战术网络：基础与未来方向（综述）

专知会员服务

14+阅读 · 4月12日

水下战战术决策中的气象与海洋预报（50页报告）

水下战战术决策中的气象与海洋预报（50页报告）

专知会员服务

5+阅读 · 4月12日

远程空中优势：新一代超视距导弹的兴起

远程空中优势：新一代超视距导弹的兴起

专知会员服务

4+阅读 · 4月12日

大语言模型溯因推理的统一分类学与综述

大语言模型溯因推理的统一分类学与综述

专知会员服务

6+阅读 · 4月12日

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

CVPR 2026 Findings | 算力砍半、性能不降！全开源 A₁模型：让机器人大模型真正走向落地

专知会员服务

3+阅读 · 4月12日

大语言模型与国防战略：升级风险与国家安全挑战（综述）

大语言模型与国防战略：升级风险与国家安全挑战（综述）

专知会员服务

9+阅读 · 4月12日

《基于机器学习预测模型识别新型超视距战术及DARPA AIR智能体误差分析》

《基于机器学习预测模型识别新型超视距战术及DARPA AIR智能体误差分析》

专知会员服务

12+阅读 · 4月11日

以机器速度作战：人工智能与美陆军反火力作战——第二部分

以机器速度作战：人工智能与美陆军反火力作战——第二部分

专知会员服务

10+阅读 · 4月11日

相关VIP内容

【AAAI2026】Align3GR：面向 LLM 生成式推荐的统一多层次对齐方法

【AAAI2026】Align3GR：面向 LLM 生成式推荐的统一多层次对齐方法

专知会员服务

13+阅读 · 2025年11月17日

认知优势：人工智能在国家安全决策中的核心作用

认知优势：人工智能在国家安全决策中的核心作用

专知会员服务

14+阅读 · 2025年8月16日

【CVPR2024】MA-LMM: 内存增强的大型多模态模型，用于长期视频理解

【CVPR2024】MA-LMM: 内存增强的大型多模态模型，用于长期视频理解

专知会员服务

21+阅读 · 2024年4月9日

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

RAG+LLM=？同济大学等最新《大型语言模型的检索增强生成》综述

专知会员服务

111+阅读 · 2023年12月19日

什么是大模型Red-teaming？大模型安全研究《结构大语言模型红蓝对抗》（含下载）

什么是大模型Red-teaming？大模型安全研究《结构大语言模型红蓝对抗》（含下载）

专知会员服务

54+阅读 · 2023年5月1日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

【开放书】《Multimedia Forensics》多媒体取证与安全，494页pdf

【开放书】《Multimedia Forensics》多媒体取证与安全，494页pdf

专知会员服务

50+阅读 · 2022年4月14日

【博士论文】推荐系统多行为建模与隐私保护研究

【博士论文】推荐系统多行为建模与隐私保护研究

专知会员服务

53+阅读 · 2021年11月27日

移动数字广告与互联网反欺诈蓝皮报告

移动数字广告与互联网反欺诈蓝皮报告

专知会员服务

28+阅读 · 2021年5月13日

【ACM MM 2019 】MMGCN：用于微视频个性化推荐的多模图卷积网络（MMGCN：Multi-modal Graph Convolution Network for Personalized Recommendation of Micro-video）

【ACM MM 2019 】MMGCN：用于微视频个性化推荐的多模图卷积网络（MMGCN：Multi-modal Graph Convolution Network for Personalized Recommendation of Micro-video）

专知会员服务

57+阅读 · 2019年11月20日

热门VIP内容

开通专知VIP会员享更多权益服务

从俄乌战场看“马赛克战”（万字长文）

弹性指挥控制：北约、伊朗与俄罗斯指挥控制架构的比较分析

美军MAVEN项目全面解析：算法战架构

人工智能与机器人自主系统等新兴技术革命将如何影响地面作战的指挥控制？

相关资讯

MOBIUS：百度凤巢新一代广告召回系统

MOBIUS：百度凤巢新一代广告召回系统

DataFunTalk

11+阅读 · 2020年10月3日

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

【阿里巴巴-WWW2020】对抗性多模态表示学习的点击率预测，Adversarial Multimodal RL

专知

11+阅读 · 2020年3月17日

【论文笔记】具有深度注意力网络的协同Bundle（项目组合）推荐

【论文笔记】具有深度注意力网络的协同Bundle（项目组合）推荐

专知

11+阅读 · 2019年10月14日

【论文笔记】注意力机制的协同过滤模型 Attentive Collaborative Filtering(ACF)

【论文笔记】注意力机制的协同过滤模型 Attentive Collaborative Filtering(ACF)

专知

50+阅读 · 2019年9月23日

主流互联网平台广告业务对比分析

主流互联网平台广告业务对比分析

百度公共政策研究院

29+阅读 · 2019年5月20日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

推荐策略产品经理：剖析协同过滤（千人千面推荐的核心）

推荐策略产品经理：剖析协同过滤（千人千面推荐的核心）

PMCAFF

10+阅读 · 2019年3月14日

【论文推荐】最新六篇视觉问答相关论文—鲁棒性分析、虚拟意象、双曲注意力网络、R-VQA、关系推理、双线性注意力网络

【论文推荐】最新六篇视觉问答相关论文—鲁棒性分析、虚拟意象、双曲注意力网络、R-VQA、关系推理、双线性注意力网络

专知

17+阅读 · 2018年6月7日

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

【论文推荐】最新八篇视频描述生成相关论文—在线视频理解、联合定位和描述事件、生成视频、跨模态注意力机制、联合事件检测和描述

专知

11+阅读 · 2018年6月4日

推荐算法：Match与Rank模型的交织配合

推荐算法：Match与Rank模型的交织配合

从0到1

15+阅读 · 2017年12月18日

相关论文

SFCoT: Safer Chain-of-Thought via Active Safety Evaluation and Calibration

SFCoT: Safer Chain-of-Thought via Active Safety Evaluation and Calibration

Arxiv

0+阅读 · 3月16日

DistillGuard: Evaluating Defenses Against LLM Knowledge Distillation

Arxiv

0+阅读 · 3月8日

Bloom: Designing for LLM-Augmented Behavior Change Interactions

Arxiv

0+阅读 · 3月3日

Decision Quality Evaluation Framework at Pinterest

Decision Quality Evaluation Framework at Pinterest

Arxiv

0+阅读 · 2月17日

Bielik Guard: Efficient Polish Language Safety Classifiers for LLM Content Moderation

Arxiv

0+阅读 · 2月13日

Poly-Guard: Massive Multi-Domain Safety Policy-Grounded Guardrail Dataset

Arxiv

0+阅读 · 2月11日

Bielik Guard: Efficient Polish Language Safety Classifiers for LLM Content Moderation

Arxiv

0+阅读 · 2月11日

Efficient and Adaptable Detection of Malicious LLM Prompts via Bootstrap Aggregation

Arxiv

0+阅读 · 2月8日

Beyond Static Alignment: Hierarchical Policy Control for LLM Safety via Risk-Aware Chain-of-Thought

Arxiv

0+阅读 · 2月6日

Efficient LLM Moderation with Multi-Layer Latent Prototypes

Arxiv

0+阅读 · 2月6日

相关基金

基于软件定义无线网络的虚拟多径攻击检测与防御技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

考虑价格歧视和广告效应的网络团购销售策略研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习和马尔科夫逻辑网络的特殊视频识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

逻辑错误屏蔽的近似电路逻辑综合多目标优化方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向CCMANET网络可证明安全命名与名字路由机制关键技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

多域网络安全的异构策略语义形态与验证机制

国家自然科学基金

0+阅读 · 2014年12月31日

恐怖组织网络动态演化与干预策略研究

国家自然科学基金

0+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

多语言大数据环境下的复杂网络行为分析、预测和干预

国家自然科学基金

4+阅读 · 2014年12月31日

互联网实时竞价广告的若干关键问题研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员