The Careless Coupon Collector's Problem - 专知论文

会员服务 ·

0

概率 · 网络爬虫 · 系统 · 离散 · 分析 ·

The Careless Coupon Collector's Problem

翻译：粗心集券者问题

Emilio Cruciani,Aditi Dudeja

from arxiv, Published at FUN 2026

We initiate the study of the Careless Coupon Collector's Problem (CCCP), a novel variation of the classical coupon collector, that we envision as a model for information systems such as web crawlers, dynamic caches, and fault-resilient networks. In CCCP, a collector attempts to gather $n$ distinct coupon types by obtaining one coupon type uniformly at random in each discrete round, however the collector is \textit{careless}: at the end of each round, each collected coupon type is independently lost with probability $p$. We analyze the number of rounds required to complete the collection as a function of $n$ and $p$. In particular, we show that it transitions from $Θ(n \ln n)$ when $p = o\big(\frac{\ln n}{n^2}\big)$ up to $Θ\big((\frac{np}{1-p})^n\big)$ when $p=ω\big(\frac{1}{n}\big)$ in multiple distinct phases. Interestingly, when $p=\frac{c}{n}$, the process remains in a metastable phase, where the fraction of collected coupon types is concentrated around $\frac{1}{1+c}$ with probability $1-o(1)$, for a time window of length $e^{Θ(n)}$. Finally, we give an algorithm that computes the expected completion time of CCCP in $O(n^2)$ time.

翻译：我们首次研究了粗心集券者问题（CCCP），这是经典集券者问题的一个新颖变体，我们将其设想为网络爬虫、动态缓存和容错网络等信息系统的模型。在CCCP中，收集者试图通过在每个离散轮次中均匀随机获取一种券类型来收集$n$种不同的券类型，但收集者是\textit{粗心的}：在每轮结束时，每种已收集的券类型会以概率$p$独立丢失。我们分析了完成收集所需轮次数与$n$和$p$的函数关系。特别地，我们证明当$p = o\big(\frac{\ln n}{n^2}\big)$时轮次数为$Θ(n \ln n)$，而当$p=ω\big(\frac{1}{n}\big)$时轮次数增长至$Θ\big((\frac{np}{1-p})^n\big)$，其间经历多个不同的相变阶段。有趣的是，当$p=\frac{c}{n}$时，该过程会进入亚稳态阶段：在长度为$e^{Θ(n)}$的时间窗口内，以$1-o(1)$的概率，已收集券类型的比例始终集中在$\frac{1}{1+c}$附近。最后，我们提出了一种能在$O(n^2)$时间内计算CCCP期望完成时间的算法。

0

相关内容

本话题关于日常用语「概率」，用于讨论生活中的运气、机会，及赌博、彩票、游戏中的「技巧」。关于抽象数学概念「概率」的讨论，请转概率（数学）话题。

《军事选址集合覆盖干扰问题》109页

《军事选址集合覆盖干扰问题》109页

专知会员服务

18+阅读 · 2月20日

南洋理工阿里巴巴等首篇《神经开放信息抽取》综述论文，系统阐述最新神经信息抽取关键技术

南洋理工阿里巴巴等首篇《神经开放信息抽取》综述论文，系统阐述最新神经信息抽取关键技术

专知会员服务

17+阅读 · 2022年5月30日

AAAI2022 | 针对事件论元抽取学会高效地提问

AAAI2022 | 针对事件论元抽取学会高效地提问

专知会员服务

13+阅读 · 2022年1月5日

NeurIPS 2021 Spotlight | 针对有缺失坐标的聚类问题的核心集

NeurIPS 2021 Spotlight | 针对有缺失坐标的聚类问题的核心集

专知会员服务

16+阅读 · 2021年11月27日

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

专知会员服务

60+阅读 · 2020年11月21日

【伯克利Payam博士论文】大规模稀疏图的问题探究: 图压缩与负载均衡，268页pdf

【伯克利Payam博士论文】大规模稀疏图的问题探究: 图压缩与负载均衡，268页pdf

专知会员服务

20+阅读 · 2020年11月4日

【DeepMind】无监督实体对齐，AlignNet: Unsupervised Entity Alignment

【DeepMind】无监督实体对齐，AlignNet: Unsupervised Entity Alignment

专知会员服务

21+阅读 · 2020年7月24日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知会员服务

124+阅读 · 2020年5月30日

【WWW2020】解决推荐系统中目标客户失真问题，Addressing the Target Customer Distortion Problem in Recommender Systems

【WWW2020】解决推荐系统中目标客户失真问题，Addressing the Target Customer Distortion Problem in Recommender Systems

专知会员服务

10+阅读 · 2020年4月4日

【金融强化学习论文】金融资产组合管理问题的深度强化学习框架（A Deep Reinforcement Learning Framework for theFinancial Portfolio Management Problem）

【金融强化学习论文】金融资产组合管理问题的深度强化学习框架（A Deep Reinforcement Learning Framework for theFinancial Portfolio Management Problem）

专知会员服务

55+阅读 · 2019年12月16日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

AINLP

38+阅读 · 2019年9月3日

《计算机研究与发展》投稿常见问题

《计算机研究与发展》投稿常见问题

计算机研究与发展

25+阅读 · 2019年6月13日

【边缘计算】边缘计算面临的问题

【边缘计算】边缘计算面临的问题

产业智能官

17+阅读 · 2019年5月31日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

机器人操作的“圣杯问题” -- Bin Picking

机器人操作的“圣杯问题” -- Bin Picking

机器人学家

16+阅读 · 2018年8月2日

占坑！利用 JenKins 持续集成 iOS 项目时遇到的问题

占坑！利用 JenKins 持续集成 iOS 项目时遇到的问题

DevOps时代

36+阅读 · 2018年7月19日

放弃 RNN/LSTM 吧，因为真的不好用！望周知~

放弃 RNN/LSTM 吧，因为真的不好用！望周知~

人工智能头条

19+阅读 · 2018年4月24日

一文读懂「Attention is All You Need」| 附代码实现

一文读懂「Attention is All You Need」| 附代码实现

PaperWeekly

37+阅读 · 2018年1月10日

关于处理样本不平衡问题的Trick整理

关于处理样本不平衡问题的Trick整理

机器学习算法与Python学习

14+阅读 · 2017年12月3日

相依结构不确定下的聚合风险问题

国家自然科学基金

0+阅读 · 2015年12月31日

随机动力系统的逼近和跑出问题

国家自然科学基金

0+阅读 · 2015年12月31日

社会网秘密共享中的关键问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

平面多项式向量场的中心问题与可积性

国家自然科学基金

1+阅读 · 2015年12月31日

分数次椭圆型方程解的集中现象

国家自然科学基金

0+阅读 · 2015年12月31日

随机吸引子的若干问题

国家自然科学基金

0+阅读 · 2014年12月31日

排序集抽样下随机删失数据的非参数估计

国家自然科学基金

1+阅读 · 2014年12月31日

保险中两类随机最优控制问题及策略过程概率分布研究

国家自然科学基金

0+阅读 · 2014年12月31日

随机Helmholtz型问题的数值方法

国家自然科学基金

0+阅读 · 2014年12月31日

两类非马氏保险模型下的最优问题以及公司合并问题

国家自然科学基金

0+阅读 · 2014年12月31日

Computational Hardness of Private Coreset

Arxiv

0+阅读 · 2月19日

On the Hardness of Approximation of the Fair k-Center Problem

Arxiv

0+阅读 · 2月18日

The Distortion of Stable Matching

Arxiv

0+阅读 · 2月16日

The Keychain Problem: On Minimizing the Opportunity Cost of Uncertainty

Arxiv

0+阅读 · 2月11日

Necessary President in Elections with Parties

Arxiv

0+阅读 · 2月11日

Self-referential instances of the dominating set problem are irreducible

Arxiv

0+阅读 · 2月11日

Lipschitz Bandits with Stochastic Delayed Feedback

Arxiv

0+阅读 · 2月11日

Conservative Maltsev Constraint Satisfaction Problems

Arxiv

0+阅读 · 2月7日

Dynamic Matching Under Patience Imbalance

Arxiv

0+阅读 · 2月3日

A two-player version of the assignment problem

Arxiv

0+阅读 · 2月2日

VIP会员

文章信息

相关主题

最新内容

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

专知会员服务

6+阅读 · 5月31日

比利时发布用于实时战场军事装备识别的离线人工智能系统

比利时发布用于实时战场军事装备识别的离线人工智能系统

专知会员服务

5+阅读 · 5月31日

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

专知会员服务

4+阅读 · 5月31日

超越网格：作战环境对炮兵的影响

超越网格：作战环境对炮兵的影响

专知会员服务

2+阅读 · 5月31日

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

专知会员服务

8+阅读 · 5月31日

综述 | 推理时控制：可信大语言模型的运行时治理全景

综述 | 推理时控制：可信大语言模型的运行时治理全景

专知会员服务

4+阅读 · 5月31日

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

6+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

7+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

7+阅读 · 5月30日

美以伊战争：首次人工智能战争——军事自主性困境

美以伊战争：首次人工智能战争——军事自主性困境

专知会员服务

7+阅读 · 5月30日

《Palantir任务保障性软件安全标准（MA-S2）》

《Palantir任务保障性软件安全标准（MA-S2）》

专知会员服务

19+阅读 · 5月30日

《美海军利用扩展现实增强知识流动研究》300页报告

《美海军利用扩展现实增强知识流动研究》300页报告

专知会员服务

10+阅读 · 5月30日

基于声学的无人机检测技术综述

基于声学的无人机检测技术综述

专知会员服务

11+阅读 · 5月30日

《当代混合战争分析框架：俄乌战争经验教训》

《当代混合战争分析框架：俄乌战争经验教训》

专知会员服务

10+阅读 · 5月30日

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

生成式AI基础小册子绪论解读：一条数学地基路线，178页pdf

专知会员服务

14+阅读 · 5月29日

相关VIP内容

《军事选址集合覆盖干扰问题》109页

《军事选址集合覆盖干扰问题》109页

专知会员服务

18+阅读 · 2月20日

南洋理工阿里巴巴等首篇《神经开放信息抽取》综述论文，系统阐述最新神经信息抽取关键技术

南洋理工阿里巴巴等首篇《神经开放信息抽取》综述论文，系统阐述最新神经信息抽取关键技术

专知会员服务

17+阅读 · 2022年5月30日

AAAI2022 | 针对事件论元抽取学会高效地提问

AAAI2022 | 针对事件论元抽取学会高效地提问

专知会员服务

13+阅读 · 2022年1月5日

NeurIPS 2021 Spotlight | 针对有缺失坐标的聚类问题的核心集

NeurIPS 2021 Spotlight | 针对有缺失坐标的聚类问题的核心集

专知会员服务

16+阅读 · 2021年11月27日

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

【经典书】应用随机微分方程，324页pdf，Applied Stochastic Differential Equations

专知会员服务

60+阅读 · 2020年11月21日

【伯克利Payam博士论文】大规模稀疏图的问题探究: 图压缩与负载均衡，268页pdf

【伯克利Payam博士论文】大规模稀疏图的问题探究: 图压缩与负载均衡，268页pdf

专知会员服务

20+阅读 · 2020年11月4日

【DeepMind】无监督实体对齐，AlignNet: Unsupervised Entity Alignment

【DeepMind】无监督实体对齐，AlignNet: Unsupervised Entity Alignment

专知会员服务

21+阅读 · 2020年7月24日

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知会员服务

124+阅读 · 2020年5月30日

【WWW2020】解决推荐系统中目标客户失真问题，Addressing the Target Customer Distortion Problem in Recommender Systems

【WWW2020】解决推荐系统中目标客户失真问题，Addressing the Target Customer Distortion Problem in Recommender Systems

专知会员服务

10+阅读 · 2020年4月4日

【金融强化学习论文】金融资产组合管理问题的深度强化学习框架（A Deep Reinforcement Learning Framework for theFinancial Portfolio Management Problem）

【金融强化学习论文】金融资产组合管理问题的深度强化学习框架（A Deep Reinforcement Learning Framework for theFinancial Portfolio Management Problem）

专知会员服务

55+阅读 · 2019年12月16日

热门VIP内容

开通专知VIP会员享更多权益服务

比利时发布用于实时战场军事装备识别的离线人工智能系统

超越网格：作战环境对炮兵的影响

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

相关资讯

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

(普林斯顿讲义)：高维概率论，326页pdf《Probability in High Dimension》

专知

21+阅读 · 2020年5月30日

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

【论文】Awesome Relation Extraction Paper（关系抽取）（PART V）

AINLP

38+阅读 · 2019年9月3日

《计算机研究与发展》投稿常见问题

《计算机研究与发展》投稿常见问题

计算机研究与发展

25+阅读 · 2019年6月13日

【边缘计算】边缘计算面临的问题

【边缘计算】边缘计算面临的问题

产业智能官

17+阅读 · 2019年5月31日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

机器人操作的“圣杯问题” -- Bin Picking

机器人操作的“圣杯问题” -- Bin Picking

机器人学家

16+阅读 · 2018年8月2日

占坑！利用 JenKins 持续集成 iOS 项目时遇到的问题

占坑！利用 JenKins 持续集成 iOS 项目时遇到的问题

DevOps时代

36+阅读 · 2018年7月19日

放弃 RNN/LSTM 吧，因为真的不好用！望周知~

放弃 RNN/LSTM 吧，因为真的不好用！望周知~

人工智能头条

19+阅读 · 2018年4月24日

一文读懂「Attention is All You Need」| 附代码实现

一文读懂「Attention is All You Need」| 附代码实现

PaperWeekly

37+阅读 · 2018年1月10日

关于处理样本不平衡问题的Trick整理

关于处理样本不平衡问题的Trick整理

机器学习算法与Python学习

14+阅读 · 2017年12月3日

相关论文

Computational Hardness of Private Coreset

Arxiv

0+阅读 · 2月19日

On the Hardness of Approximation of the Fair k-Center Problem

Arxiv

0+阅读 · 2月18日

The Distortion of Stable Matching

Arxiv

0+阅读 · 2月16日

The Keychain Problem: On Minimizing the Opportunity Cost of Uncertainty

Arxiv

0+阅读 · 2月11日

Necessary President in Elections with Parties

Arxiv

0+阅读 · 2月11日

Self-referential instances of the dominating set problem are irreducible

Arxiv

0+阅读 · 2月11日

Lipschitz Bandits with Stochastic Delayed Feedback

Arxiv

0+阅读 · 2月11日

Conservative Maltsev Constraint Satisfaction Problems

Arxiv

0+阅读 · 2月7日

Dynamic Matching Under Patience Imbalance

Arxiv

0+阅读 · 2月3日

A two-player version of the assignment problem

Arxiv

0+阅读 · 2月2日

相关基金

相依结构不确定下的聚合风险问题

国家自然科学基金

0+阅读 · 2015年12月31日

随机动力系统的逼近和跑出问题

国家自然科学基金

0+阅读 · 2015年12月31日

社会网秘密共享中的关键问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

平面多项式向量场的中心问题与可积性

国家自然科学基金

1+阅读 · 2015年12月31日

分数次椭圆型方程解的集中现象

国家自然科学基金

0+阅读 · 2015年12月31日

随机吸引子的若干问题

国家自然科学基金

0+阅读 · 2014年12月31日

排序集抽样下随机删失数据的非参数估计

国家自然科学基金

1+阅读 · 2014年12月31日

保险中两类随机最优控制问题及策略过程概率分布研究

国家自然科学基金

0+阅读 · 2014年12月31日

随机Helmholtz型问题的数值方法

国家自然科学基金

0+阅读 · 2014年12月31日

两类非马氏保险模型下的最优问题以及公司合并问题

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员