VEXA: Evidence-Grounded and Persona-Adaptive Explanations for Scam Risk Sensemaking - 专知论文

会员服务 ·

0

自适应 · 风险感知 · 检测器 · 设计 · 社交 ·

VEXA: Evidence-Grounded and Persona-Adaptive Explanations for Scam Risk Sensemaking

翻译：VEXA：基于证据与角色自适应的诈骗风险感知解释框架

Heajun An,Connor Ng,Sandesh Sharma Dulal,Junghwan Kim,Jin-Hee Cho

Online scams across email, short message services, and social media increasingly challenge everyday risk assessment, particularly as generative AI enables more fluent and context-aware deception. Although transformer-based detectors achieve strong predictive performance, their explanations are often opaque to non-experts or misaligned with model decisions. We propose VEXA, an evidence-grounded and persona-adaptive framework for generating learner-facing scam explanations by integrating GradientSHAP-based attribution with theory-informed vulnerability personas. Evaluation across multi-channel datasets shows that grounding explanations in detector-derived evidence improves semantic reliability without increasing linguistic complexity, while persona conditioning introduces interpretable stylistic variation without disrupting evidential alignment. These results reveal a key design insight: evidential grounding governs semantic correctness, whereas persona-based adaptation operates at the level of presentation under constraints of faithfulness. Together, VEXA demonstrates the feasibility of persona-adaptive, evidence-grounded explanations and provides design guidance for trustworthy, learner-facing security explanations in non-formal contexts.

翻译：电子邮件、短消息服务和社交媒体中的在线诈骗日益挑战日常风险评估，尤其是生成式人工智能能够实现更流畅、更具情境感知的欺骗行为。尽管基于Transformer的检测器实现了强大的预测性能，但其解释对非专业人士往往不透明或与模型决策不一致。我们提出VEXA，一个基于证据与角色自适应的框架，通过将基于GradientSHAP的归因方法与理论驱动的脆弱性角色模型相结合，生成面向学习者的诈骗解释。跨多通道数据集的评估表明，将解释锚定于检测器衍生的证据可在不增加语言复杂度的前提下提升语义可靠性，而角色条件调节则能在不破坏证据对齐的前提下引入可解释的风格变化。这些结果揭示了一个关键设计洞见：证据锚定主导语义正确性，而基于角色的自适应在忠实性约束下作用于呈现层面。VEXA共同证明了角色自适应、证据锚定式解释的可行性，并为非正式场景下面向学习者的可信安全解释提供了设计指导。

0

相关内容

自适应

《迈向人工智能赋能网络威胁的风险阈值：利用贝叶斯网络增强不确定性下的决策能力》最新60页报告

《迈向人工智能赋能网络威胁的风险阈值：利用贝叶斯网络增强不确定性下的决策能力》最新60页报告

专知会员服务

20+阅读 · 3月2日

《缓解大语言模型（LLMs）幻觉：面向应用的检索增强生成（RAG）、推理与智能体系统综述》

《缓解大语言模型（LLMs）幻觉：面向应用的检索增强生成（RAG）、推理与智能体系统综述》

专知会员服务

24+阅读 · 2025年10月29日

DGP双粒度提示框架：图增强大模型助力欺诈检测

DGP双粒度提示框架：图增强大模型助力欺诈检测

专知会员服务

9+阅读 · 2025年8月17日

《军事网络工具中运用生成式人工智能的伦理与对抗风险》最新报告

《军事网络工具中运用生成式人工智能的伦理与对抗风险》最新报告

专知会员服务

17+阅读 · 2025年6月21日

【CMU博士论文】重新思考面向风险感知的社会型具身智能的安全保障体系

【CMU博士论文】重新思考面向风险感知的社会型具身智能的安全保障体系

专知会员服务

15+阅读 · 2025年5月9日

图神经网络在金融欺诈检测中的应用综述

图神经网络在金融欺诈检测中的应用综述

专知会员服务

28+阅读 · 2024年11月22日

【KDD2024】SEFraud：通过解释性掩码学习实现的基于图的自解释欺诈检测

【KDD2024】SEFraud：通过解释性掩码学习实现的基于图的自解释欺诈检测

专知会员服务

18+阅读 · 2024年6月18日

图异常检测在金融反欺诈中的应用研究进展

图异常检测在金融反欺诈中的应用研究进展

专知会员服务

50+阅读 · 2022年11月20日

《应用人工智能来识别针对全球定位系统（GPS）的网络欺骗攻击》美国海军136页论文

《应用人工智能来识别针对全球定位系统（GPS）的网络欺骗攻击》美国海军136页论文

专知会员服务

63+阅读 · 2022年9月29日

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

专知会员服务

20+阅读 · 2020年11月7日

【干货书】机器学习的金融风险管理与Python，194页pdf

【干货书】机器学习的金融风险管理与Python，194页pdf

专知

27+阅读 · 2022年7月1日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

90+阅读 · 2022年4月17日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

学界 | 受压缩感知启发，斯坦福 AI 研究院提出新的无监督表示学习框架！

学界 | 受压缩感知启发，斯坦福 AI 研究院提出新的无监督表示学习框架！

AI科技评论

10+阅读 · 2019年6月18日

【智能金融】机器学习在反欺诈中应用

【智能金融】机器学习在反欺诈中应用

产业智能官

35+阅读 · 2019年3月15日

中国信通院：人工智能安全白皮书（2018年）（附解读及白皮书下载）

中国信通院：人工智能安全白皮书（2018年）（附解读及白皮书下载）

走向智能论坛

27+阅读 · 2018年9月18日

干货解析 | 如何通过用户的行为序列来提升欺诈风险识别

干货解析 | 如何通过用户的行为序列来提升欺诈风险识别

蚂蚁程序猿

13+阅读 · 2018年9月7日

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

数据分析

12+阅读 · 2018年8月15日

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

AI100

11+阅读 · 2017年11月17日

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于压缩感知的网络层析成像技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于多源证据的繁忙水域交管雷达异常目标识别方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习和马尔科夫逻辑网络的特殊视频识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

恐惧、高兴微表情识别的认知神经机制

国家自然科学基金

1+阅读 · 2014年12月31日

风险信息披露、风险感知与资本市场风险识别行为

国家自然科学基金

1+阅读 · 2014年12月31日

复杂需求场景驱动的软件安全防护模型检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

Agentic Multi-Persona Framework for Evidence-Aware Fake News Detection

Arxiv

0+阅读 · 3月5日

Detecting Cybersecurity Threats by Integrating Explainable AI with SHAP Interpretability and Strategic Data Sampling

Arxiv

0+阅读 · 2月22日

LLM Scalability Risk for Agentic-AI and Model Supply Chain Security

Arxiv

0+阅读 · 2月22日

ViGText: Deepfake Image Detection with Vision-Language Model Explanations and Graph Neural Networks

Arxiv

0+阅读 · 2月20日

ForesightSafety Bench: A Frontier Risk Evaluation and Governance Framework towards Safe AI

Arxiv

0+阅读 · 2月18日

VulReaD: Knowledge-Graph-guided Software Vulnerability Reasoning and Detection

Arxiv

0+阅读 · 2月11日

CausalArmor: Efficient Indirect Prompt Injection Guardrails via Causal Attribution

Arxiv

0+阅读 · 2月8日

VERA-MH: Reliability and Validity of an Open-Source AI Safety Evaluation in Mental Health

Arxiv

0+阅读 · 2月6日

Spider-Sense: Intrinsic Risk Sensing for Efficient Agent Defense with Hierarchical Adaptive Screening

Arxiv

0+阅读 · 2月6日

The Verification Crisis: Expert Perceptions of GenAI Disinformation and the Case for Reproducible Provenance

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

最新内容

《美陆军条例：陆军指挥政策（2026版）》

《美陆军条例：陆军指挥政策（2026版）》

专知会员服务

9+阅读 · 今天8:10

《提升美军全域城市作战训练最佳实践的案例研究》366页

《提升美军全域城市作战训练最佳实践的案例研究》366页

专知会员服务

8+阅读 · 今天8:06

《军用自主人工智能系统的治理与安全》

《军用自主人工智能系统的治理与安全》

专知会员服务

5+阅读 · 今天8:02

美海军数字作战负责人：如何利用数据快速生成战斗力

美海军数字作战负责人：如何利用数据快速生成战斗力

专知会员服务

5+阅读 · 今天7:32

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

《COOL模型（行动循环圈）：军事领导体系中的战役层级变革流程》

专知会员服务

11+阅读 · 4月20日

《系统簇式多域作战规划范畴论框架》

《系统簇式多域作战规划范畴论框架》

专知会员服务

10+阅读 · 4月20日

《美国防部指令6130.03，第2卷服役医疗标准：保留》

《美国防部指令6130.03，第2卷服役医疗标准：保留》

专知会员服务

6+阅读 · 4月20日

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

《美国防部指令6130.03，第1卷服役医疗标准：任命、征募或征召》

专知会员服务

4+阅读 · 4月20日

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

美空军“战场机载通信节点（BACN）”：美以对伊空战行动中隐形却关键的一环

专知会员服务

8+阅读 · 4月20日

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

【CMU博士论文】面向非结构化环境下医疗急救的具身人工智能

专知会员服务

5+阅读 · 4月20日

高效视频扩散模型：进展与挑战

高效视频扩散模型：进展与挑战

专知会员服务

5+阅读 · 4月20日

乌克兰前线的五项创新

乌克兰前线的五项创新

专知会员服务

8+阅读 · 4月20日

军事通信系统与设备的技术演进综述

军事通信系统与设备的技术演进综述

专知会员服务

7+阅读 · 4月20日

《北约 AI手册：作战人员的实用考量》（2026最新64页）

《北约 AI手册：作战人员的实用考量》（2026最新64页）

专知会员服务

12+阅读 · 4月20日

《北约标准：医疗评估手册》174页

《北约标准：医疗评估手册》174页

专知会员服务

6+阅读 · 4月20日

相关VIP内容

《迈向人工智能赋能网络威胁的风险阈值：利用贝叶斯网络增强不确定性下的决策能力》最新60页报告

《迈向人工智能赋能网络威胁的风险阈值：利用贝叶斯网络增强不确定性下的决策能力》最新60页报告

专知会员服务

20+阅读 · 3月2日

《缓解大语言模型（LLMs）幻觉：面向应用的检索增强生成（RAG）、推理与智能体系统综述》

《缓解大语言模型（LLMs）幻觉：面向应用的检索增强生成（RAG）、推理与智能体系统综述》

专知会员服务

24+阅读 · 2025年10月29日

DGP双粒度提示框架：图增强大模型助力欺诈检测

DGP双粒度提示框架：图增强大模型助力欺诈检测

专知会员服务

9+阅读 · 2025年8月17日

《军事网络工具中运用生成式人工智能的伦理与对抗风险》最新报告

《军事网络工具中运用生成式人工智能的伦理与对抗风险》最新报告

专知会员服务

17+阅读 · 2025年6月21日

【CMU博士论文】重新思考面向风险感知的社会型具身智能的安全保障体系

【CMU博士论文】重新思考面向风险感知的社会型具身智能的安全保障体系

专知会员服务

15+阅读 · 2025年5月9日

图神经网络在金融欺诈检测中的应用综述

图神经网络在金融欺诈检测中的应用综述

专知会员服务

28+阅读 · 2024年11月22日

【KDD2024】SEFraud：通过解释性掩码学习实现的基于图的自解释欺诈检测

【KDD2024】SEFraud：通过解释性掩码学习实现的基于图的自解释欺诈检测

专知会员服务

18+阅读 · 2024年6月18日

图异常检测在金融反欺诈中的应用研究进展

图异常检测在金融反欺诈中的应用研究进展

专知会员服务

50+阅读 · 2022年11月20日

《应用人工智能来识别针对全球定位系统（GPS）的网络欺骗攻击》美国海军136页论文

《应用人工智能来识别针对全球定位系统（GPS）的网络欺骗攻击》美国海军136页论文

专知会员服务

63+阅读 · 2022年9月29日

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

ISWC2020最佳论文《可解释假信息检测的链接可信度评价》

专知会员服务

20+阅读 · 2020年11月7日

热门VIP内容

开通专知VIP会员享更多权益服务

《提升美军全域城市作战训练最佳实践的案例研究》366页

美海军数字作战负责人：如何利用数据快速生成战斗力

《美陆军条例：陆军指挥政策（2026版）》

《军用自主人工智能系统的治理与安全》

相关资讯

【干货书】机器学习的金融风险管理与Python，194页pdf

【干货书】机器学习的金融风险管理与Python，194页pdf

专知

27+阅读 · 2022年7月1日

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

【AI+军事】《用于威胁评估的人工智能工具》加拿大国防研究和发展部技术报告，附中文版pdf

专知

90+阅读 · 2022年4月17日

《人工智能安全测评白皮书》，99页pdf

《人工智能安全测评白皮书》，99页pdf

专知

36+阅读 · 2022年2月26日

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

最新《深度生成式模型进展》视频报告，43页ppt，斯坦福Aditya Grover

专知

13+阅读 · 2020年8月9日

学界 | 受压缩感知启发，斯坦福 AI 研究院提出新的无监督表示学习框架！

学界 | 受压缩感知启发，斯坦福 AI 研究院提出新的无监督表示学习框架！

AI科技评论

10+阅读 · 2019年6月18日

【智能金融】机器学习在反欺诈中应用

【智能金融】机器学习在反欺诈中应用

产业智能官

35+阅读 · 2019年3月15日

中国信通院：人工智能安全白皮书（2018年）（附解读及白皮书下载）

中国信通院：人工智能安全白皮书（2018年）（附解读及白皮书下载）

走向智能论坛

27+阅读 · 2018年9月18日

干货解析 | 如何通过用户的行为序列来提升欺诈风险识别

干货解析 | 如何通过用户的行为序列来提升欺诈风险识别

蚂蚁程序猿

13+阅读 · 2018年9月7日

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

推荐系统、风控模型、知识图谱，竟然都可以用网络挖掘来实现

数据分析

12+阅读 · 2018年8月15日

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

干货 | 人工智能如何帮助银行反欺诈：来看看关于银行智能欺诈风险预测模型的研究

AI100

11+阅读 · 2017年11月17日

相关论文

Agentic Multi-Persona Framework for Evidence-Aware Fake News Detection

Arxiv

0+阅读 · 3月5日

Detecting Cybersecurity Threats by Integrating Explainable AI with SHAP Interpretability and Strategic Data Sampling

Arxiv

0+阅读 · 2月22日

LLM Scalability Risk for Agentic-AI and Model Supply Chain Security

Arxiv

0+阅读 · 2月22日

ViGText: Deepfake Image Detection with Vision-Language Model Explanations and Graph Neural Networks

Arxiv

0+阅读 · 2月20日

ForesightSafety Bench: A Frontier Risk Evaluation and Governance Framework towards Safe AI

Arxiv

0+阅读 · 2月18日

VulReaD: Knowledge-Graph-guided Software Vulnerability Reasoning and Detection

Arxiv

0+阅读 · 2月11日

CausalArmor: Efficient Indirect Prompt Injection Guardrails via Causal Attribution

Arxiv

0+阅读 · 2月8日

VERA-MH: Reliability and Validity of an Open-Source AI Safety Evaluation in Mental Health

Arxiv

0+阅读 · 2月6日

Spider-Sense: Intrinsic Risk Sensing for Efficient Agent Defense with Hierarchical Adaptive Screening

Arxiv

0+阅读 · 2月6日

The Verification Crisis: Expert Perceptions of GenAI Disinformation and the Case for Reproducible Provenance

Arxiv

0+阅读 · 2月2日

相关基金

结合知识图谱的概率话题模型研究

国家自然科学基金

10+阅读 · 2015年12月31日

基于压缩感知的网络层析成像技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

网络安全威胁踪源分析方法研究

国家自然科学基金

19+阅读 · 2015年12月31日

基于多源证据的繁忙水域交管雷达异常目标识别方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于深度学习和马尔科夫逻辑网络的特殊视频识别研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向大数据的知识表示、推理、在线学习理论及应用研究

国家自然科学基金

12+阅读 · 2014年12月31日

恐惧、高兴微表情识别的认知神经机制

国家自然科学基金

1+阅读 · 2014年12月31日

风险信息披露、风险感知与资本市场风险识别行为

国家自然科学基金

1+阅读 · 2014年12月31日

复杂需求场景驱动的软件安全防护模型检测技术研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于自适应模型检测的安全协议自动建模与设计研究

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员