Containing a spread through sequential learning: to exploit or to explore? - 专知论文

会员服务 ·

0

Learning · Networking · Processing（编程语言） · 知识 (knowledge) · 易处理的 ·

2023 年 3 月 23 日

Containing a spread through sequential learning: to exploit or to explore?

翻译：通过序贯学习遏制传播：利用还是探索？

Xingran Chen,Hesam Nikpey,Jungyeol Kim,Saswati Sarkar,Shirin Saeedi-Bidokhti

The spread of an undesirable contact process, such as an infectious disease (e.g. COVID-19), is contained through testing and isolation of infected nodes. The temporal and spatial evolution of the process (along with containment through isolation) render such detection as fundamentally different from active search detection strategies. In this work, through an active learning approach, we design testing and isolation strategies to contain the spread and minimize the cumulative infections under a given test budget. We prove that the objective can be optimized, with performance guarantees, by greedily selecting the nodes to test. We further design reward-based methodologies that effectively minimize an upper bound on the cumulative infections and are computationally more tractable in large networks. These policies, however, need knowledge about the nodes' infection probabilities which are dynamically changing and have to be learned by sequential testing. We develop a message-passing framework for this purpose and, building on that, show novel tradeoffs between exploitation of knowledge through reward-based heuristics and exploration of the unknown through a carefully designed probabilistic testing. The tradeoffs are fundamentally distinct from the classical counterparts under active search or multi-armed bandit problems (MABs). We provably show the necessity of exploration in a stylized network and show through simulations that exploration can outperform exploitation in various synthetic and real-data networks depending on the parameters of the network and the spread.

翻译：不良接触过程（如COVID-19等传染病）的传播，是通过检测和隔离受感染节点加以遏制的。该过程的时间与空间演化（以及通过隔离实施的遏制）使得此类检测与主动搜索检测策略存在根本差异。在本工作中，我们通过主动学习方法设计检测与隔离策略，在给定检测预算下遏制传播并最小化累计感染人数。我们证明，通过贪婪选择待检测节点，该目标可在性能保证下实现优化。我们进一步设计了基于奖励的方法论，该方法能有效最小化累计感染人数的上界，并在大型网络中具有更高的计算可行性。然而，这些策略需要掌握节点感染概率的相关知识——这些概率动态变化，必须通过序贯检测来学习。为此，我们开发了一个消息传递框架，并在此基础上揭示了通过基于奖励的启发式方法利用已知信息与通过精心设计的概率检测探索未知信息之间的新型权衡。该权衡与主动搜索或多臂老虎机问题中的经典权衡存在本质区别。我们在一个简约网络中严格证明了探索的必要性，并通过仿真表明，在网络结构与传播参数的影响下，探索策略在多种合成网络与真实数据网络中可优于利用策略。

0

相关内容

Learning

【MIT博士论文】简单、快速、可扩展、可靠的多处理器算法，358页pdf

【MIT博士论文】简单、快速、可扩展、可靠的多处理器算法，358页pdf

专知会员服务

26+阅读 · 2023年5月1日

【剑桥大学博士论文】监督学习、模仿和强化学习中泛化和自适应的因果表示学习，202页pdf

【剑桥大学博士论文】监督学习、模仿和强化学习中泛化和自适应的因果表示学习，202页pdf

专知会员服务

55+阅读 · 2023年2月3日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知会员服务

53+阅读 · 2022年11月24日

《分布式多智能体强化学习的编码》加州大学等

《分布式多智能体强化学习的编码》加州大学等

专知会员服务

56+阅读 · 2022年11月2日

【MIT博士论文】通过奇异值分解、端到端基于模型的方法和奖励塑造的有效强化学习

【MIT博士论文】通过奇异值分解、端到端基于模型的方法和奖励塑造的有效强化学习

专知会员服务

49+阅读 · 2022年9月22日

蛋白质语言建模？伯克利RoshanRao157页博士论文《训练，评估和理解蛋白质序列的进化模型》

蛋白质语言建模？伯克利RoshanRao157页博士论文《训练，评估和理解蛋白质序列的进化模型》

专知会员服务

26+阅读 · 2022年3月22日

【CMU博士论文】用动态超参数优化改进深度学习训练和推理，Improving Deep Learning Training and Inference with Dynamic Hyperparameter Optimization

【CMU博士论文】用动态超参数优化改进深度学习训练和推理，Improving Deep Learning Training and Inference with Dynamic Hyperparameter Optimization

专知会员服务

55+阅读 · 2020年5月26日

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

专知会员服务

63+阅读 · 2020年5月23日

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling in Graph Representation Learning

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling in Graph Representation Learning

专知会员服务

58+阅读 · 2020年5月21日

【ICLR2020-MIT】元学习的好奇心算法，Meta-learning curiosity algorithms

【ICLR2020-MIT】元学习的好奇心算法，Meta-learning curiosity algorithms

专知会员服务

34+阅读 · 2020年3月13日

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

专知

12+阅读 · 2023年4月4日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知

13+阅读 · 2022年11月24日

【CMU博士论文】强化学习可解释：统一状态和策略级解释，132页pdf

【CMU博士论文】强化学习可解释：统一状态和策略级解释，132页pdf

专知

3+阅读 · 2022年11月22日

NeurIPS'22 | 具有自适应读出的图神经网络

NeurIPS'22 | 具有自适应读出的图神经网络

图与推荐

1+阅读 · 2022年11月11日

【MIT博士论文】通过奇异值分解、端到端基于模型的方法和奖励塑造的有效强化学习

【MIT博士论文】通过奇异值分解、端到端基于模型的方法和奖励塑造的有效强化学习

专知

1+阅读 · 2022年9月22日

陈天奇CMU新课程线上免费听，剖析DL框架底层原理，学完你也能开发mini版PyTorch/TF

陈天奇CMU新课程线上免费听，剖析DL框架底层原理，学完你也能开发mini版PyTorch/TF

量子位

0+阅读 · 2022年8月28日

“小”标记图数据如何学习？KDD2022最新《图最小监督学习》教程，125页ppt阐述图学习的弱监督学习、少样本学习和自监督学习

“小”标记图数据如何学习？KDD2022最新《图最小监督学习》教程，125页ppt阐述图学习的弱监督学习、少样本学习和自监督学习

专知

1+阅读 · 2022年8月21日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

19+阅读 · 2022年7月11日

Distributional Soft Actor-Critic (DSAC)强化学习算法的设计与验证

Distributional Soft Actor-Critic (DSAC)强化学习算法的设计与验证

深度强化学习实验室

20+阅读 · 2020年8月11日

最前沿：深度解读Soft Actor-Critic 算法

最前沿：深度解读Soft Actor-Critic 算法

极市平台

55+阅读 · 2019年7月28日

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

高谱效全/半双工混合通信网络连续中继协议设计与性能分析

国家自然科学基金

0+阅读 · 2015年12月31日

多跳认知无线电网络动态信道接入问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

动态网络中信息传播时间的理论分析与跨层算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

适应大数据处理的概率特征映射研究

国家自然科学基金

0+阅读 · 2013年12月31日

码率兼容且码长可控的低密度奇偶校验卷积码研究与设计

国家自然科学基金

0+阅读 · 2013年12月31日

高速移动环境下混叠中继时变信道建模与逼近、参数估计和导频设计

国家自然科学基金

0+阅读 · 2012年12月31日

组合优化问题的组合：问题、算法和复杂性

国家自然科学基金

5+阅读 · 2012年12月31日

复杂网络环境下遥操作系统的性能分析与控制器设计

国家自然科学基金

0+阅读 · 2009年12月31日

基于动态优化策略的复杂网络研究

国家自然科学基金

3+阅读 · 2008年12月31日

FeatFSDA: Towards Few-shot Domain Adaptation for Video-based Activity Recognition

Arxiv

0+阅读 · 2023年5月15日

Training Diverse High-Dimensional Controllers by Scaling Covariance Matrix Adaptation MAP-Annealing

Arxiv

0+阅读 · 2023年5月13日

Beyond invariant representation learning: linearly alignable latent spaces for efficient closed-form domain adaptation

Arxiv

0+阅读 · 2023年5月12日

Adaptive and Flexible Model-Based AI for Deep Receivers in Dynamic Channels

Arxiv

0+阅读 · 2023年5月12日

Learning to Rank under Multinomial Logit Choice

Arxiv

0+阅读 · 2023年5月11日

Data Efficient Contrastive Learning in Histopathology using Active Sampling

Arxiv

0+阅读 · 2023年5月11日

Bayesian Deep Learning via Subnetwork Inference

Arxiv

10+阅读 · 2021年2月18日

KD3A: Unsupervised Multi-Source Decentralized Domain Adaptation via Knowledge Distillation

Arxiv

10+阅读 · 2020年12月8日

Learning in the Frequency Domain

Learning in the Frequency Domain

Arxiv

11+阅读 · 2020年3月12日

How to train your MAML

Arxiv

26+阅读 · 2019年3月5日

VIP会员

文章信息

相关主题

Processing（编程语言）

知识 (knowledge)

最新内容

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

专知会员服务

7+阅读 · 6月20日

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

专知会员服务

4+阅读 · 6月19日

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

专知会员服务

6+阅读 · 6月19日

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

ICML 2026 Spotlight | SmoothSMoE：解析稀疏 MoE 路由不连续

专知会员服务

6+阅读 · 6月18日

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

综述 | 周期表视角下的大模型推理：范式、方法与失败模式

专知会员服务

7+阅读 · 6月18日

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

11+阅读 · 6月18日

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

11+阅读 · 6月18日

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

7+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

11+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

8+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

18+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

9+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

6+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

8+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

8+阅读 · 6月17日

相关VIP内容

【MIT博士论文】简单、快速、可扩展、可靠的多处理器算法，358页pdf

【MIT博士论文】简单、快速、可扩展、可靠的多处理器算法，358页pdf

专知会员服务

26+阅读 · 2023年5月1日

【剑桥大学博士论文】监督学习、模仿和强化学习中泛化和自适应的因果表示学习，202页pdf

【剑桥大学博士论文】监督学习、模仿和强化学习中泛化和自适应的因果表示学习，202页pdf

专知会员服务

55+阅读 · 2023年2月3日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知会员服务

53+阅读 · 2022年11月24日

《分布式多智能体强化学习的编码》加州大学等

《分布式多智能体强化学习的编码》加州大学等

专知会员服务

56+阅读 · 2022年11月2日

【MIT博士论文】通过奇异值分解、端到端基于模型的方法和奖励塑造的有效强化学习

【MIT博士论文】通过奇异值分解、端到端基于模型的方法和奖励塑造的有效强化学习

专知会员服务

49+阅读 · 2022年9月22日

蛋白质语言建模？伯克利RoshanRao157页博士论文《训练，评估和理解蛋白质序列的进化模型》

蛋白质语言建模？伯克利RoshanRao157页博士论文《训练，评估和理解蛋白质序列的进化模型》

专知会员服务

26+阅读 · 2022年3月22日

【CMU博士论文】用动态超参数优化改进深度学习训练和推理，Improving Deep Learning Training and Inference with Dynamic Hyperparameter Optimization

【CMU博士论文】用动态超参数优化改进深度学习训练和推理，Improving Deep Learning Training and Inference with Dynamic Hyperparameter Optimization

专知会员服务

55+阅读 · 2020年5月26日

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling

专知会员服务

63+阅读 · 2020年5月23日

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling in Graph Representation Learning

【KDD2020-清华大学】理解图表示学习中的负采样，Understanding Negative Sampling in Graph Representation Learning

专知会员服务

58+阅读 · 2020年5月21日

【ICLR2020-MIT】元学习的好奇心算法，Meta-learning curiosity algorithms

【ICLR2020-MIT】元学习的好奇心算法，Meta-learning curiosity algorithms

专知会员服务

34+阅读 · 2020年3月13日

热门VIP内容

开通专知VIP会员享更多权益服务

深入解读 Palantir AIP：全球最具争议的人工智能平台究竟如何运作

ICML 2026 | 多任务贝叶斯上下文学习：让 Transformer 在测试时显式适应新先验

ACL 2026综述 | 大规模手语数据集：资源、基准与标注标准

相关资讯

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

【斯坦福博士论文】将深度学习机器人学习扩展到广泛的现实世界数据，176页pdf

专知

12+阅读 · 2023年4月4日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知

13+阅读 · 2022年11月24日

【CMU博士论文】强化学习可解释：统一状态和策略级解释，132页pdf

【CMU博士论文】强化学习可解释：统一状态和策略级解释，132页pdf

专知

3+阅读 · 2022年11月22日

NeurIPS'22 | 具有自适应读出的图神经网络

NeurIPS'22 | 具有自适应读出的图神经网络

图与推荐

1+阅读 · 2022年11月11日

【MIT博士论文】通过奇异值分解、端到端基于模型的方法和奖励塑造的有效强化学习

【MIT博士论文】通过奇异值分解、端到端基于模型的方法和奖励塑造的有效强化学习

专知

1+阅读 · 2022年9月22日

陈天奇CMU新课程线上免费听，剖析DL框架底层原理，学完你也能开发mini版PyTorch/TF

陈天奇CMU新课程线上免费听，剖析DL框架底层原理，学完你也能开发mini版PyTorch/TF

量子位

0+阅读 · 2022年8月28日

“小”标记图数据如何学习？KDD2022最新《图最小监督学习》教程，125页ppt阐述图学习的弱监督学习、少样本学习和自监督学习

“小”标记图数据如何学习？KDD2022最新《图最小监督学习》教程，125页ppt阐述图学习的弱监督学习、少样本学习和自监督学习

专知

1+阅读 · 2022年8月21日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

19+阅读 · 2022年7月11日

Distributional Soft Actor-Critic (DSAC)强化学习算法的设计与验证

Distributional Soft Actor-Critic (DSAC)强化学习算法的设计与验证

深度强化学习实验室

20+阅读 · 2020年8月11日

最前沿：深度解读Soft Actor-Critic 算法

最前沿：深度解读Soft Actor-Critic 算法

极市平台

55+阅读 · 2019年7月28日

相关论文

FeatFSDA: Towards Few-shot Domain Adaptation for Video-based Activity Recognition

Arxiv

0+阅读 · 2023年5月15日

Training Diverse High-Dimensional Controllers by Scaling Covariance Matrix Adaptation MAP-Annealing

Arxiv

0+阅读 · 2023年5月13日

Beyond invariant representation learning: linearly alignable latent spaces for efficient closed-form domain adaptation

Arxiv

0+阅读 · 2023年5月12日

Adaptive and Flexible Model-Based AI for Deep Receivers in Dynamic Channels

Arxiv

0+阅读 · 2023年5月12日

Learning to Rank under Multinomial Logit Choice

Arxiv

0+阅读 · 2023年5月11日

Data Efficient Contrastive Learning in Histopathology using Active Sampling

Arxiv

0+阅读 · 2023年5月11日

Bayesian Deep Learning via Subnetwork Inference

Arxiv

10+阅读 · 2021年2月18日

KD3A: Unsupervised Multi-Source Decentralized Domain Adaptation via Knowledge Distillation

Arxiv

10+阅读 · 2020年12月8日

Learning in the Frequency Domain

Learning in the Frequency Domain

Arxiv

11+阅读 · 2020年3月12日

How to train your MAML

Arxiv

26+阅读 · 2019年3月5日

相关基金

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

高谱效全/半双工混合通信网络连续中继协议设计与性能分析

国家自然科学基金

0+阅读 · 2015年12月31日

多跳认知无线电网络动态信道接入问题研究

国家自然科学基金

0+阅读 · 2014年12月31日

动态网络中信息传播时间的理论分析与跨层算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

适应大数据处理的概率特征映射研究

国家自然科学基金

0+阅读 · 2013年12月31日

码率兼容且码长可控的低密度奇偶校验卷积码研究与设计

国家自然科学基金

0+阅读 · 2013年12月31日

高速移动环境下混叠中继时变信道建模与逼近、参数估计和导频设计

国家自然科学基金

0+阅读 · 2012年12月31日

组合优化问题的组合：问题、算法和复杂性

国家自然科学基金

5+阅读 · 2012年12月31日

复杂网络环境下遥操作系统的性能分析与控制器设计

国家自然科学基金

0+阅读 · 2009年12月31日

基于动态优化策略的复杂网络研究

国家自然科学基金

3+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员