Buzz, Choose, Forget: A Meta-Bandit Framework for Bee-Like Decision Making - 专知论文

会员服务 ·

0

赌博机 · 群决策 · 多臂赌博机 · 序列 · 学习模型 ·

Buzz, Choose, Forget: A Meta-Bandit Framework for Bee-Like Decision Making

翻译：蜂鸣、选择、遗忘：一种蜂群决策的元赌博机框架

Emmanuelle Claeys,Elena Kerjean,Jean-Michel Loubes

This work introduces MAYA, a sequential imitation learning model based on multi-armed bandits, designed to reproduce and predict individual bees' decisions in contextualized foraging tasks. The model accounts for bees' limited memory through a temporal window $τ$, whose optimal value is around 7 trials, with a slight dependence on weather conditions. Experimental results on real, simulated, and complementary (mice) datasets show that MAYA (particularly with the Wasserstein distance) outperforms imitation baselines and classical statistical models, while providing interpretability of individual learning strategies and enabling the inference of realistic trajectories for prospective ecological applications.

翻译：本文提出了MAYA，一种基于多臂赌博机的序列模仿学习模型，旨在复现并预测个体蜜蜂在情境化觅食任务中的决策。该模型通过时间窗口$τ$来考虑蜜蜂的有限记忆能力，其最优值约为7次尝试，且略微依赖于天气条件。在真实、模拟以及补充（小鼠）数据集上的实验结果表明，MAYA（特别是采用Wasserstein距离时）在模仿基准和经典统计模型上表现更优，同时能够提供个体学习策略的可解释性，并可为前瞻性生态应用推断出真实的轨迹。

0

相关内容

赌博机

《基于强化学习的反无人机蜂群拦截优先级排序》

《基于强化学习的反无人机蜂群拦截优先级排序》

专知会员服务

29+阅读 · 4月16日

《无人机蜂群攻击防御的预测建模：面向美军战备的人工智能轨迹预测与最优拦截策略设计》最新报告

《无人机蜂群攻击防御的预测建模：面向美军战备的人工智能轨迹预测与最优拦截策略设计》最新报告

专知会员服务

45+阅读 · 2025年12月24日

《反蜂群作战中的分布式决策深度学习方法》最新89页

《反蜂群作战中的分布式决策深度学习方法》最新89页

专知会员服务

57+阅读 · 2024年10月20日

《利用多智能体深度强化学习和自适应导航策略在复杂环境中高效反制蜂群》

《利用多智能体深度强化学习和自适应导航策略在复杂环境中高效反制蜂群》

专知会员服务

44+阅读 · 2024年2月15日

《Swarm-GPT：将大型语言模型与无人机蜂群编排设计的安全运动规划相结合》最新论文

《Swarm-GPT：将大型语言模型与无人机蜂群编排设计的安全运动规划相结合》最新论文

专知会员服务

105+阅读 · 2024年1月20日

《通过自适应蜂群智能实现认知物联网系统》

《通过自适应蜂群智能实现认知物联网系统》

专知会员服务

46+阅读 · 2023年10月29日

《大规模无人机蜂群交战的权衡分析》2022.12最新67页论文

《大规模无人机蜂群交战的权衡分析》2022.12最新67页论文

专知会员服务

151+阅读 · 2023年2月17日

《分布式多智能体强化学习的编码》加州大学等

《分布式多智能体强化学习的编码》加州大学等

专知会员服务

57+阅读 · 2022年11月2日

《全球军用无人机蜂群的发展》【各国蜂群计划、未来发展】2022最新报告，印度联合战争研究中心

《全球军用无人机蜂群的发展》【各国蜂群计划、未来发展】2022最新报告，印度联合战争研究中心

专知会员服务

217+阅读 · 2022年10月19日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

39+阅读 · 2023年4月13日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

字节跳动李航提出AMBERT！超越BERT！多粒度token预训练语言模型

字节跳动李航提出AMBERT！超越BERT！多粒度token预训练语言模型

专知

19+阅读 · 2020年8月31日

万物皆Embedding，从经典的word2vec到深度学习基本操作item2vec

万物皆Embedding，从经典的word2vec到深度学习基本操作item2vec

AINLP

10+阅读 · 2019年8月18日

深入理解BERT Transformer ，不仅仅是注意力机制

深入理解BERT Transformer ，不仅仅是注意力机制

大数据文摘

22+阅读 · 2019年3月19日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

用机器学习来预测股价（代码+文档）——2018年iNTUtion决赛大作！

用机器学习来预测股价（代码+文档）——2018年iNTUtion决赛大作！

量化投资与机器学习

25+阅读 · 2018年11月20日

无人机集群、蜂群与蜂群算法

无人机集群、蜂群与蜂群算法

无人机

99+阅读 · 2018年9月25日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

复杂动态网络上演化博弈的群体策略选择和干预机制研究

国家自然科学基金

5+阅读 · 2015年12月31日

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

双层网络下的振子集体行为研究：以生物钟神经元网络为例

国家自然科学基金

0+阅读 · 2015年12月31日

有噪声纠缠比特的纠缠辅助量子纠错码研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

针对多目标优化的人工蜂群算法改进及在水文模型参数优化中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

贝叶斯博弈关于信息结构的比较静态分析及应用

国家自然科学基金

1+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

Restless Bandits with Individual Penalty Constraints: Near-Optimal Indices and Deep Reinforcement Learning

Arxiv

0+阅读 · 4月17日

A Player Selection Network for Scalable Game-Theoretic Prediction and Planning

Arxiv

0+阅读 · 4月1日

MemBoost: A Memory-Boosted Framework for Cost-Aware LLM Inference

Arxiv

0+阅读 · 3月27日

Fitting Reinforcement Learning Model to Behavioral Data under Bandits

Arxiv

0+阅读 · 3月26日

Asymptotically and Minimax Optimal Regret Bounds for Multi-Armed Bandits with Abstention

Arxiv

0+阅读 · 3月22日

Online Clustering of Data Sequences with Bandit Information

Arxiv

0+阅读 · 3月20日

Kernel Single-Index Bandits: Estimation, Inference, and Learning

Arxiv

0+阅读 · 3月19日

Emotional Modulation in Swarm Decision Dynamics

Arxiv

0+阅读 · 3月10日

NeuroProlog: Multi-Task Fine-Tuning for Neurosymbolic Mathematical Reasoning via the Cocktail Effect

Arxiv

0+阅读 · 3月4日

Bayesian Attention Mechanism: A Probabilistic Framework for Positional Encoding and Context Length Extrapolation

Arxiv

0+阅读 · 2月23日

VIP会员

文章信息

相关主题

多臂赌博机

最新内容

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

4+阅读 · 今天15:21

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

0+阅读 · 今天15:12

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

2+阅读 · 今天15:06

《无人机蜂群通信技术研究》50页

《无人机蜂群通信技术研究》50页

专知会员服务

4+阅读 · 今天14:55

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

《基于智能体建模与仿真的无人机蜂群模型目标定位涌现行为比较分析》360页

专知会员服务

9+阅读 · 7月18日

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

欧洲智能弹药战略创新管理：迈向制导弹药、巡飞系统与自主无人机蜂群的技术主权研究路线图

专知会员服务

7+阅读 · 7月18日

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

从领域适配到部署与可解释：Berkeley博士论文解析大语言模型真实落地

专知会员服务

9+阅读 · 7月18日

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

综述 | 长程智能体研究全景：基础、演化、框架、优化与前沿

专知会员服务

6+阅读 · 7月18日

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

DARPA拟打造十万规模自主思考作战的AI智能体集群：“受控涌现式分布式人工智能”（DICE）项目

专知会员服务

9+阅读 · 7月17日

《边缘端实时无线感知赋能现场多机器人部署》200页

《边缘端实时无线感知赋能现场多机器人部署》200页

专知会员服务

9+阅读 · 7月17日

战力倍增器：自主武器系统与乌克兰及加沙冲突

战力倍增器：自主武器系统与乌克兰及加沙冲突

专知会员服务

5+阅读 · 7月17日

人工智能赋能战场情报：提速决策进程

人工智能赋能战场情报：提速决策进程

专知会员服务

3+阅读 · 7月17日

《拥抱新兴技术：面向未来军官的教育革新》

《拥抱新兴技术：面向未来军官的教育革新》

专知会员服务

7+阅读 · 7月17日

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

ACM MM 2026 | MAR-GRPO：稳定混合图像生成的强化学习训练

专知会员服务

5+阅读 · 7月17日

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

综述 | 大模型水印理论与部署：来源追踪、攻击鲁棒与可信治理

专知会员服务

6+阅读 · 7月17日

相关VIP内容

《基于强化学习的反无人机蜂群拦截优先级排序》

《基于强化学习的反无人机蜂群拦截优先级排序》

专知会员服务

29+阅读 · 4月16日

《无人机蜂群攻击防御的预测建模：面向美军战备的人工智能轨迹预测与最优拦截策略设计》最新报告

《无人机蜂群攻击防御的预测建模：面向美军战备的人工智能轨迹预测与最优拦截策略设计》最新报告

专知会员服务

45+阅读 · 2025年12月24日

《反蜂群作战中的分布式决策深度学习方法》最新89页

《反蜂群作战中的分布式决策深度学习方法》最新89页

专知会员服务

57+阅读 · 2024年10月20日

《利用多智能体深度强化学习和自适应导航策略在复杂环境中高效反制蜂群》

《利用多智能体深度强化学习和自适应导航策略在复杂环境中高效反制蜂群》

专知会员服务

44+阅读 · 2024年2月15日

《Swarm-GPT：将大型语言模型与无人机蜂群编排设计的安全运动规划相结合》最新论文

《Swarm-GPT：将大型语言模型与无人机蜂群编排设计的安全运动规划相结合》最新论文

专知会员服务

105+阅读 · 2024年1月20日

《通过自适应蜂群智能实现认知物联网系统》

《通过自适应蜂群智能实现认知物联网系统》

专知会员服务

46+阅读 · 2023年10月29日

《大规模无人机蜂群交战的权衡分析》2022.12最新67页论文

《大规模无人机蜂群交战的权衡分析》2022.12最新67页论文

专知会员服务

151+阅读 · 2023年2月17日

《分布式多智能体强化学习的编码》加州大学等

《分布式多智能体强化学习的编码》加州大学等

专知会员服务

57+阅读 · 2022年11月2日

《全球军用无人机蜂群的发展》【各国蜂群计划、未来发展】2022最新报告，印度联合战争研究中心

《全球军用无人机蜂群的发展》【各国蜂群计划、未来发展】2022最新报告，印度联合战争研究中心

专知会员服务

217+阅读 · 2022年10月19日

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

【ICML2022】Branchformer:并行MLP-Attention架构，捕捉局部和全局上下文，用于语音识别和理解

专知会员服务

25+阅读 · 2022年7月8日

热门VIP内容

开通专知VIP会员享更多权益服务

锻造未来士兵：外骨骼、基因工程与赛博格

《无人机蜂群通信技术研究》50页

深入Project Maven：为何人工智能在战场上依然失灵

《无人机系统（UAS）通信网状网络试验性部署》50页报告

相关资讯

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

【佐治亚理工博士论文】基于策略智能体和有限反馈的序列决策，211页pdf

专知

39+阅读 · 2023年4月13日

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

注意力机制 | 图卷积多跳注意力机制 | Direct multi-hop Attention based GNN

AINLP

22+阅读 · 2020年11月29日

字节跳动李航提出AMBERT！超越BERT！多粒度token预训练语言模型

字节跳动李航提出AMBERT！超越BERT！多粒度token预训练语言模型

专知

19+阅读 · 2020年8月31日

万物皆Embedding，从经典的word2vec到深度学习基本操作item2vec

万物皆Embedding，从经典的word2vec到深度学习基本操作item2vec

AINLP

10+阅读 · 2019年8月18日

深入理解BERT Transformer ，不仅仅是注意力机制

深入理解BERT Transformer ，不仅仅是注意力机制

大数据文摘

22+阅读 · 2019年3月19日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

DeepMind研究员Tor2019著作《赌博机算法》，555页带你学习专治选择困难症技术

专知

11+阅读 · 2019年1月6日

用机器学习来预测股价（代码+文档）——2018年iNTUtion决赛大作！

用机器学习来预测股价（代码+文档）——2018年iNTUtion决赛大作！

量化投资与机器学习

25+阅读 · 2018年11月20日

无人机集群、蜂群与蜂群算法

无人机集群、蜂群与蜂群算法

无人机

99+阅读 · 2018年9月25日

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

DeepMind无监督表示学习重大突破：语音、图像、文本、强化学习全能冠军！

新智元

12+阅读 · 2018年7月13日

相关论文

Restless Bandits with Individual Penalty Constraints: Near-Optimal Indices and Deep Reinforcement Learning

Arxiv

0+阅读 · 4月17日

A Player Selection Network for Scalable Game-Theoretic Prediction and Planning

Arxiv

0+阅读 · 4月1日

MemBoost: A Memory-Boosted Framework for Cost-Aware LLM Inference

Arxiv

0+阅读 · 3月27日

Fitting Reinforcement Learning Model to Behavioral Data under Bandits

Arxiv

0+阅读 · 3月26日

Asymptotically and Minimax Optimal Regret Bounds for Multi-Armed Bandits with Abstention

Arxiv

0+阅读 · 3月22日

Online Clustering of Data Sequences with Bandit Information

Arxiv

0+阅读 · 3月20日

Kernel Single-Index Bandits: Estimation, Inference, and Learning

Arxiv

0+阅读 · 3月19日

Emotional Modulation in Swarm Decision Dynamics

Arxiv

0+阅读 · 3月10日

NeuroProlog: Multi-Task Fine-Tuning for Neurosymbolic Mathematical Reasoning via the Cocktail Effect

Arxiv

0+阅读 · 3月4日

Bayesian Attention Mechanism: A Probabilistic Framework for Positional Encoding and Context Length Extrapolation

Arxiv

0+阅读 · 2月23日

相关基金

复杂动态网络上演化博弈的群体策略选择和干预机制研究

国家自然科学基金

5+阅读 · 2015年12月31日

噪声不确定下基于计算智能的多跳认知无线电网络协作频谱感知优化

国家自然科学基金

0+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

9+阅读 · 2015年12月31日

双层网络下的振子集体行为研究：以生物钟神经元网络为例

国家自然科学基金

0+阅读 · 2015年12月31日

有噪声纠缠比特的纠缠辅助量子纠错码研究

国家自然科学基金

0+阅读 · 2014年12月31日

面向大数据的群体偏好决策分析研究

国家自然科学基金

6+阅读 · 2014年12月31日

针对多目标优化的人工蜂群算法改进及在水文模型参数优化中的应用

国家自然科学基金

0+阅读 · 2014年12月31日

贝叶斯博弈关于信息结构的比较静态分析及应用

国家自然科学基金

1+阅读 · 2014年12月31日

算法博弈论视角下的策略替代型网络博弈

国家自然科学基金

4+阅读 · 2014年12月31日

不确定环境下强化学习和决策的神经机制

国家自然科学基金

11+阅读 · 2012年12月31日

微信扫码咨询专知VIP会员