This paper introduces a performative scenario optimization framework for decision-dependent chance-constrained problems. Unlike classical stochastic optimization, we account for the feedback loop where decisions actively shape the underlying data-generating process. We define performative solutions as self-consistent equilibria and establish their existence using Kakutani's fixed-point theorem. To ensure computational tractability without requiring an explicit model of the environment, we propose a model-free, scenario-based approximation that alternates between data generation and optimization. Under mild regularity conditions, we prove that a stochastic fixed-point iteration, equipped with a logarithmic sample size schedule, converges almost surely to the unique performative solution. The effectiveness of the proposed framework is demonstrated through an emerging AI safety application: deploying performative guardrails against Large Language Model (LLM) jailbreaks. Numerical results confirm the co-evolution and convergence of the guardrail classifier and the induced adversarial prompt distribution to a stable equilibrium.


翻译:本文提出了一种面向决策依赖机会约束问题的表演性场景优化框架。与经典随机优化不同,我们考虑了决策主动塑造底层数据生成过程的反馈回路。我们将表演性解定义为自洽均衡,并利用角谷不动点定理证明了其存在性。为确保无需显式环境模型即可实现计算可解性,我们提出了一种基于无模型场景的近似的交替方法,在数据生成与优化之间迭代进行。在温和的正则条件下,我们证明了配备对数样本量调度策略的随机不动点迭代几乎必然收敛到唯一的表演性解。通过一个新兴的人工智能安全应用——针对大语言模型越狱部署表演性护栏,验证了所提出框架的有效性。数值结果证实了护栏分类器与诱导的对抗提示分布会共同演化并收敛到稳定均衡状态。

0
下载
关闭预览

相关内容

《攻击场景描述形式化模型研究》
专知会员服务
32+阅读 · 2025年8月15日
多样化偏好优化
专知会员服务
12+阅读 · 2025年2月3日
【ICML2023】表示驱动强化学习
专知会员服务
39+阅读 · 2023年6月2日
人工智能指导的现实问题非线性优化,Meta AI Yuandong Tian
专知会员服务
32+阅读 · 2023年3月3日
南大《优化方法 (Optimization Methods》课程,推荐!
专知会员服务
80+阅读 · 2022年4月3日
【干货书】凸随机优化,320页pdf
专知
12+阅读 · 2022年9月16日
从动力学角度看优化算法:GAN的第三个阶段
PaperWeekly
11+阅读 · 2019年5月13日
机器学习中的最优化算法总结
人工智能前沿讲习班
22+阅读 · 2019年3月22日
深度学习中Attention Mechanism详细介绍:原理、分类及应用
深度学习与NLP
10+阅读 · 2019年2月18日
推荐中的序列化建模:Session-based neural recommendation
机器学习研究会
18+阅读 · 2017年11月5日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Arxiv
0+阅读 · 4月30日
Arxiv
0+阅读 · 4月7日
Arxiv
0+阅读 · 2月21日
VIP会员
最新内容
综述 | 3D场景图:开放挑战与未来方向
专知会员服务
2+阅读 · 6月22日
21世纪的无人机战争
专知会员服务
3+阅读 · 6月22日
《量子技术的军事任务技术适配与利用》
专知会员服务
3+阅读 · 6月22日
美国从乌克兰无人机战争中学习经验
专知会员服务
7+阅读 · 6月21日
ICML 2026 | 面向视觉语言模型的语义鲁棒性认证
专知会员服务
5+阅读 · 6月21日
相关VIP内容
《攻击场景描述形式化模型研究》
专知会员服务
32+阅读 · 2025年8月15日
多样化偏好优化
专知会员服务
12+阅读 · 2025年2月3日
【ICML2023】表示驱动强化学习
专知会员服务
39+阅读 · 2023年6月2日
人工智能指导的现实问题非线性优化,Meta AI Yuandong Tian
专知会员服务
32+阅读 · 2023年3月3日
南大《优化方法 (Optimization Methods》课程,推荐!
专知会员服务
80+阅读 · 2022年4月3日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员