Optimal Targeting in Dynamic Systems - 专知论文

会员服务 ·

0

系统 · 靶向 · 最优 · 阈值 · 自适应系统 ·

Optimal Targeting in Dynamic Systems

翻译：动态系统中的最优靶向目标选择

Yuchen Hu,Shuangning Li,Stefan Wager

Modern treatment targeting methods often rely on estimating a conditional average treatment effect (CATE) using machine learning tools. While effective in identifying who benefits from treatment on the individual level, these approaches typically overlook system-level dynamics that may arise when treatments induce strain on shared capacity. We study the problem of targeting in Markovian systems, where treatment decisions must be made one at a time as units arrive, and early decisions can impact later outcomes through delayed or limited access to resources. We show that optimal policies in such settings compare CATE-like quantities to state-specific thresholds, where each threshold reflects the expected cumulative impact on the system of treating an additional individual in the given state. We propose an algorithm that augments standard CATE estimation with state-level value iteration to estimate these thresholds from observational data. Theoretical results establish consistency and convergence guarantees, and empirical studies demonstrate that our method improves long-run outcomes considerably relative to individual-level CATE targeting rules and generic offline reinforcement learning algorithms.

翻译：现代治疗靶向方法通常依赖机器学习工具估计条件平均处理效应（CATE）。虽然这类方法在识别个体层面受益于治疗的对象方面表现有效，但往往忽略了因治疗对共享容量施加压力而产生的系统级动态变化。我们研究了马尔可夫系统中的靶向问题：当治疗决策需按单元抵达顺序逐一做出时，早期决策可能通过资源延迟或有限获取影响后续结果。研究表明，此类场景下的最优策略需要将类CATE指标与状态特定阈值进行比较，其中每个阈值反映了在给定状态下对一个额外个体实施治疗所产生的预期累积系统影响。我们提出一种算法，将标准CATE估计与状态级值迭代相结合，从观测数据中估计这些阈值。理论结果确立了估计的一致性与收敛性保证，实验证明相较个体级CATE靶向规则和通用离线强化学习算法，该方法能显著改善长期结果。

0

相关内容

《面向战术决策的广义智能：大语言模型驱动的动态武器-目标分配》

《面向战术决策的广义智能：大语言模型驱动的动态武器-目标分配》

专知会员服务

24+阅读 · 4月18日

《高速强机动目标制导方法优化途径：不同优化途径能力分析》

《高速强机动目标制导方法优化途径：不同优化途径能力分析》

专知会员服务

18+阅读 · 2025年11月30日

《战术决策智能：大语言模型驱动的动态武器目标分配》

《战术决策智能：大语言模型驱动的动态武器目标分配》

专知会员服务

59+阅读 · 2025年11月18日

《基于随机优化提升军事医疗后送系统效能》最新165页博士论文

《基于随机优化提升军事医疗后送系统效能》最新165页博士论文

专知会员服务

19+阅读 · 2025年9月9日

《基于遗传神经网络算法的防御系统武器分配多目标优化》

《基于遗传神经网络算法的防御系统武器分配多目标优化》

专知会员服务

22+阅读 · 2025年8月29日

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

专知会员服务

27+阅读 · 2025年5月7日

《组合优化问题强化学习框架在动态武器目标分配中的应用》61页

《组合优化问题强化学习框架在动态武器目标分配中的应用》61页

专知会员服务

68+阅读 · 2025年3月21日

基于注意力机制的态势要素推荐技术

基于注意力机制的态势要素推荐技术

专知会员服务

27+阅读 · 2025年2月14日

《注意力驱动的多智能体强化学习：利用专业知识强化任务决策》

《注意力驱动的多智能体强化学习：利用专业知识强化任务决策》

专知会员服务

57+阅读 · 2024年8月3日

译文-AI赋能军事动态目标定位《动态目标定位场景中间接火力交战过程的系统架构》美国西点军校

译文-AI赋能军事动态目标定位《动态目标定位场景中间接火力交战过程的系统架构》美国西点军校

专知会员服务

162+阅读 · 2023年3月13日

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

13+阅读 · 2022年11月25日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

推荐系统

炼数成金订阅号

28+阅读 · 2019年1月17日

【论文推荐】最新5篇目标跟踪（Object Tracking）相关论文—并行跟踪和验证、光流、自动跟踪、相关滤波集成、CFNet

【论文推荐】最新5篇目标跟踪（Object Tracking）相关论文—并行跟踪和验证、光流、自动跟踪、相关滤波集成、CFNet

专知

25+阅读 · 2018年2月6日

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

专知

12+阅读 · 2018年1月12日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

原创 | Attention Modeling for Targeted Sentiment

原创 | Attention Modeling for Targeted Sentiment

黑龙江大学自然语言处理实验室

25+阅读 · 2017年11月5日

改进智能优化策略多机动目标跟踪方法研究

国家自然科学基金

20+阅读 · 2015年12月31日

事件驱动下信息-物理融合系统最优状态估计理论与应用研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

有限范围随机最优控制系统的数值方法与均场倒向随机系统的最优控制问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

随机动态系统的风险分析及其最优控制问题

国家自然科学基金

1+阅读 · 2014年12月31日

关于面板(纵向）数据的动态统计分析

国家自然科学基金

0+阅读 · 2014年12月31日

含不确定性区间参数的刚柔耦合多体系统动力学建模与分析

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

动态环境下决策单元效率评价方法与应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

AgentCyberRange: Benchmarking Frontier AI Systems in Realistic Cyber Ranges

Arxiv

0+阅读 · 6月16日

OptEMA: Adaptive Exponential Moving Average for Stochastic Optimization with Zero-Noise Optimality

Arxiv

0+阅读 · 6月15日

Optimal Transport for Machine Learners

Arxiv

0+阅读 · 6月14日

MOSIC: Model-Agnostic Optimal Subgroup Identification with Multi-Constraint for Improved Reliability

Arxiv

0+阅读 · 6月12日

DynamicPO: Dynamic Preference Optimization for Recommendation

Arxiv

0+阅读 · 6月6日

Dynamic Coordination Strategy Selection for Enterprise Multi-Agent Systems

Arxiv

0+阅读 · 6月4日

Randomization for Faster Exact Optimization of Discounted Markov Decision Processes

Arxiv

0+阅读 · 6月3日

Improving Longitudinal Targeted Maximum Likelihood Estimation in Target Trial Emulation using Joint Calibrated Weights

Arxiv

0+阅读 · 6月3日

Decoupled Delay Compensation: Enhancing Pre-trained MARL Policies via Learned Dynamics Filtering

Arxiv

0+阅读 · 5月25日

Dynamic Treatment on Networks

Arxiv

0+阅读 · 5月7日

VIP会员

文章信息

相关主题

自适应系统

最新内容

综述 | 从问答到任务完成：Agent系统与Harness设计

综述 | 从问答到任务完成：Agent系统与Harness设计

专知会员服务

0+阅读 · 54分钟前

Agentic RL：框架、实践与长程智能体训练

Agentic RL：框架、实践与长程智能体训练

专知会员服务

0+阅读 · 56分钟前

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

专知会员服务

6+阅读 · 今天8:00

重新思考无人机时代的生存能力

重新思考无人机时代的生存能力

专知会员服务

5+阅读 · 今天7:44

装甲突击旅：现代战争思考、战斗与组织

装甲突击旅：现代战争思考、战斗与组织

专知会员服务

4+阅读 · 今天7:28

在人工智能加速决策环境中拓展OODA循环

在人工智能加速决策环境中拓展OODA循环

专知会员服务

4+阅读 · 今天7:18

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰与伊朗案例研究》

专知会员服务

5+阅读 · 今天7:07

军事欺骗：供作战战术指挥官使用的工具

军事欺骗：供作战战术指挥官使用的工具

专知会员服务

4+阅读 · 今天7:03

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

ICML 2026 | CFPO：用反事实策略优化提升多模态推理

专知会员服务

4+阅读 · 6月23日

综述 | 世界动作模型：少做梦，多行动

综述 | 世界动作模型：少做梦，多行动

专知会员服务

6+阅读 · 6月23日

美以伊冲突：无人机与人工智能的运用

美以伊冲突：无人机与人工智能的运用

专知会员服务

10+阅读 · 6月23日

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

《战时图神经网络：整合以色列-伊朗冲突中的网络安全与无人机智能》最新50页文献

专知会员服务

4+阅读 · 6月23日

《特种部队在透明战场中的生存力》最新报告

《特种部队在透明战场中的生存力》最新报告

专知会员服务

5+阅读 · 6月23日

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

《自主无人机蜂群协同与控制系统：人工智能赋能的战场协同与自主任务编排平台》

专知会员服务

8+阅读 · 6月23日

《人工智能生成的零日漏洞：对未来作战的影响》

《人工智能生成的零日漏洞：对未来作战的影响》

专知会员服务

7+阅读 · 6月23日

相关VIP内容

《面向战术决策的广义智能：大语言模型驱动的动态武器-目标分配》

《面向战术决策的广义智能：大语言模型驱动的动态武器-目标分配》

专知会员服务

24+阅读 · 4月18日

《高速强机动目标制导方法优化途径：不同优化途径能力分析》

《高速强机动目标制导方法优化途径：不同优化途径能力分析》

专知会员服务

18+阅读 · 2025年11月30日

《战术决策智能：大语言模型驱动的动态武器目标分配》

《战术决策智能：大语言模型驱动的动态武器目标分配》

专知会员服务

59+阅读 · 2025年11月18日

《基于随机优化提升军事医疗后送系统效能》最新165页博士论文

《基于随机优化提升军事医疗后送系统效能》最新165页博士论文

专知会员服务

19+阅读 · 2025年9月9日

《基于遗传神经网络算法的防御系统武器分配多目标优化》

《基于遗传神经网络算法的防御系统武器分配多目标优化》

专知会员服务

22+阅读 · 2025年8月29日

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

《多智能体系统的神经协调：多领域任务环境中基于深度学习的智能体最优选择框架》

专知会员服务

27+阅读 · 2025年5月7日

《组合优化问题强化学习框架在动态武器目标分配中的应用》61页

《组合优化问题强化学习框架在动态武器目标分配中的应用》61页

专知会员服务

68+阅读 · 2025年3月21日

基于注意力机制的态势要素推荐技术

基于注意力机制的态势要素推荐技术

专知会员服务

27+阅读 · 2025年2月14日

《注意力驱动的多智能体强化学习：利用专业知识强化任务决策》

《注意力驱动的多智能体强化学习：利用专业知识强化任务决策》

专知会员服务

57+阅读 · 2024年8月3日

译文-AI赋能军事动态目标定位《动态目标定位场景中间接火力交战过程的系统架构》美国西点军校

译文-AI赋能军事动态目标定位《动态目标定位场景中间接火力交战过程的系统架构》美国西点军校

专知会员服务

162+阅读 · 2023年3月13日

热门VIP内容

开通专知VIP会员享更多权益服务

Agentic RL：框架、实践与长程智能体训练

重新思考无人机时代的生存能力

综述 | 从问答到任务完成：Agent系统与Harness设计

反无人机拦截器训练与运用课程：对美国陆军部队发展的启示

相关资讯

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

《基于近端策略优化(PPO)算法的制导弹体控制行为学习》美国陆军2022最新27页技术报告

专知

13+阅读 · 2022年11月25日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

33+阅读 · 2022年10月17日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

最新最权威《深度学习显著目标检测综述》论文代码数据发布，带你全面了解显著目标检测方法

专知

79+阅读 · 2019年4月24日

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

10+阅读 · 2019年2月18日

推荐系统

炼数成金订阅号

28+阅读 · 2019年1月17日

【论文推荐】最新5篇目标跟踪（Object Tracking）相关论文—并行跟踪和验证、光流、自动跟踪、相关滤波集成、CFNet

【论文推荐】最新5篇目标跟踪（Object Tracking）相关论文—并行跟踪和验证、光流、自动跟踪、相关滤波集成、CFNet

专知

25+阅读 · 2018年2月6日

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

【干货】结合单阶段和两阶段目标检测的优势：基于单次精化神经网络的目标检测方法

专知

12+阅读 · 2018年1月12日

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

深度学习与NLP

12+阅读 · 2017年11月30日

原创 | Attention Modeling for Targeted Sentiment

原创 | Attention Modeling for Targeted Sentiment

黑龙江大学自然语言处理实验室

25+阅读 · 2017年11月5日

相关论文

AgentCyberRange: Benchmarking Frontier AI Systems in Realistic Cyber Ranges

Arxiv

0+阅读 · 6月16日

OptEMA: Adaptive Exponential Moving Average for Stochastic Optimization with Zero-Noise Optimality

Arxiv

0+阅读 · 6月15日

Optimal Transport for Machine Learners

Arxiv

0+阅读 · 6月14日

MOSIC: Model-Agnostic Optimal Subgroup Identification with Multi-Constraint for Improved Reliability

Arxiv

0+阅读 · 6月12日

DynamicPO: Dynamic Preference Optimization for Recommendation

Arxiv

0+阅读 · 6月6日

Dynamic Coordination Strategy Selection for Enterprise Multi-Agent Systems

Arxiv

0+阅读 · 6月4日

Randomization for Faster Exact Optimization of Discounted Markov Decision Processes

Arxiv

0+阅读 · 6月3日

Improving Longitudinal Targeted Maximum Likelihood Estimation in Target Trial Emulation using Joint Calibrated Weights

Arxiv

0+阅读 · 6月3日

Decoupled Delay Compensation: Enhancing Pre-trained MARL Policies via Learned Dynamics Filtering

Arxiv

0+阅读 · 5月25日

Dynamic Treatment on Networks

Arxiv

0+阅读 · 5月7日

相关基金

改进智能优化策略多机动目标跟踪方法研究

国家自然科学基金

20+阅读 · 2015年12月31日

事件驱动下信息-物理融合系统最优状态估计理论与应用研究

国家自然科学基金

1+阅读 · 2015年12月31日

随机环境下多个体系统集体行为分析、调控与优化

国家自然科学基金

0+阅读 · 2015年12月31日

有限范围随机最优控制系统的数值方法与均场倒向随机系统的最优控制问题研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于动态增益非线性干扰观测器的多智能体系统协调跟踪和干扰抑制

国家自然科学基金

1+阅读 · 2015年12月31日

随机动态系统的风险分析及其最优控制问题

国家自然科学基金

1+阅读 · 2014年12月31日

关于面板(纵向）数据的动态统计分析

国家自然科学基金

0+阅读 · 2014年12月31日

含不确定性区间参数的刚柔耦合多体系统动力学建模与分析

国家自然科学基金

0+阅读 · 2014年12月31日

基于结构学习的非平行支持向量机最优化方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

动态环境下决策单元效率评价方法与应用研究

国家自然科学基金

3+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员