Bayesian Deployment Approval for Learned Landing Controllers under Finite Rollout Validation - 专知论文

会员服务 ·

0

控制器 · 不确定 · 贝叶斯 · 不确定性 · 概率 ·

Bayesian Deployment Approval for Learned Landing Controllers under Finite Rollout Validation

翻译：面向有限推出验证的学习型着陆控制器的贝叶斯部署批准

Fei Jiang,Lei Yang

from arxiv, 16 pages, 4 figures and 4 tables

Reinforcement learning and data-driven autonomous controllers are commonly evaluated using cumulative reward and empirical success frequency under finite simulation trajectories. However, such empirical metrics do not necessarily provide sufficient statistical evidence regarding deployment readiness under uncertainty. This work develops a Bayesian approval framework for learned autonomous landing controllers under finite rollout evidence. A probabilistic landing capability formulation is introduced based on touchdown safety satisfaction under uncertain operating conditions, while Bayesian posterior inference is used to quantify uncertainty regarding the true deployment capability of learned policies. Posterior approval probability and posterior deployment risk are further introduced for deployment-oriented evaluation, together with a sequential validation framework supporting approve/reject/continue decisions during progressive rollout testing. Simulation experiments using PPO and SAC controllers demonstrate that empirical success and reward optimization may produce overconfident deployment interpretation under limited validation evidence, whereas posterior approval inference provides a more uncertainty-calibrated assessment of deployment readiness. The proposed framework provides a practical statistical connection between conventional reinforcement-learning evaluation and deployment-oriented validation under uncertainty and may be generalized to broader classes of learned autonomous systems.

翻译：强化学习与数据驱动的自主控制器通常通过有限仿真轨迹下的累积奖励和经验成功频率进行评估。然而，此类经验度量在不确定性条件下未必能为部署准备度提供充分的统计证据。本文提出了一种基于有限推出证据的贝叶斯批准框架，用于学习型自主着陆控制器的部署决策。首先，基于不确定运行条件下触地安全性满足情况，引入了一种概率化着陆能力表述形式；同时，利用贝叶斯后验推理量化学习策略真实部署能力的不确定性。进一步引入后验批准概率和后验部署风险用于面向部署的评估，并提出一种序贯验证框架，支持渐进式推出测试中的批准/拒绝/继续决策。采用PPO和SAC控制器的仿真实验表明，在有限验证证据条件下，经验成功率和奖励优化可能产生过度自信的部署解读，而后验批准推理能提供更具不确定性校准能力的部署准备度评估。所提框架建立了传统强化学习评估与不确定性条件下面向部署的验证之间实用的统计联系，并可推广至更广泛的学习型自主系统类别。

0

相关内容

控制器

无人机精确着陆控制技术

无人机精确着陆控制技术

专知会员服务

25+阅读 · 2024年10月22日

【剑桥大学博士论文】贝叶斯机器学习进展:从不确定性到决策，272页pdf

【剑桥大学博士论文】贝叶斯机器学习进展:从不确定性到决策，272页pdf

专知会员服务

83+阅读 · 2023年2月5日

《学习型系统的保证性》美国空军研究实验室2022最新56页技术报告

《学习型系统的保证性》美国空军研究实验室2022最新56页技术报告

专知会员服务

36+阅读 · 2022年11月22日

推荐！【美国空军】《可靠自主性的分布式学习和控制器设计》24页“可靠自主性”（Assured Autonomy）项目技术报告，2022年8月

推荐！【美国空军】《可靠自主性的分布式学习和控制器设计》24页“可靠自主性”（Assured Autonomy）项目技术报告，2022年8月

专知会员服务

41+阅读 · 2022年9月25日

【ICLR2022】Transformers亦能贝叶斯推断

【ICLR2022】Transformers亦能贝叶斯推断

专知会员服务

25+阅读 · 2021年12月23日

【ICML2021】贝叶斯结构自适应的持续学习

专知会员服务

35+阅读 · 2021年9月18日

生成式对抗网络先验贝叶斯推断，Bayesian Inference with Generative Adversarial Network Priors

生成式对抗网络先验贝叶斯推断，Bayesian Inference with Generative Adversarial Network Priors

专知会员服务

28+阅读 · 2020年2月18日

【贝叶斯深度学习：一种基于模型的可解释方法】Bayesian deep learning: A model-based interpretable approach

【贝叶斯深度学习：一种基于模型的可解释方法】Bayesian deep learning: A model-based interpretable approach

专知会员服务

49+阅读 · 2020年1月1日

【变分推断课件】Lectures on Variational Inference： Approximate Bayesian Inference in Machine Learning（附带pdf）

【变分推断课件】Lectures on Variational Inference： Approximate Bayesian Inference in Machine Learning（附带pdf）

专知会员服务

35+阅读 · 2019年11月30日

【北京智源大会2019】贝叶斯深度学习（ Bayesian Deep Learning ），清华大学| 朱军

【北京智源大会2019】贝叶斯深度学习（ Bayesian Deep Learning ），清华大学| 朱军

专知会员服务

105+阅读 · 2019年11月22日

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

27+阅读 · 2022年11月24日

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知

10+阅读 · 2022年1月16日

【GitHub】BERT模型从训练到部署全流程

【GitHub】BERT模型从训练到部署全流程

专知

34+阅读 · 2019年6月28日

【Github项目】基于Keras的BERT实现，可直接载入官方预训练模型

【Github项目】基于Keras的BERT实现，可直接载入官方预训练模型

专知

20+阅读 · 2019年6月27日

最新36页《贝叶斯非参学习综述》，机器学习内功修炼手册

最新36页《贝叶斯非参学习综述》，机器学习内功修炼手册

专知

25+阅读 · 2019年2月27日

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

深度学习贝叶斯，这是一份密集的6天速成课程（附视频与PPT）

深度学习贝叶斯，这是一份密集的6天速成课程（附视频与PPT）

数据派THU

17+阅读 · 2018年9月23日

【深度】让DL可解释？这一份66页贝叶斯深度学习教程告诉你

【深度】让DL可解释？这一份66页贝叶斯深度学习教程告诉你

GAN生成式对抗网络

15+阅读 · 2018年8月11日

让DL可解释？这一份66页贝叶斯深度学习教程告诉你

让DL可解释？这一份66页贝叶斯深度学习教程告诉你

专知

19+阅读 · 2018年8月4日

贝叶斯机器学习前沿进展

贝叶斯机器学习前沿进展

机器学习研究会

21+阅读 · 2018年1月21日

贝叶斯网分解理论及其应用

国家自然科学基金

16+阅读 · 2017年12月31日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于弱监督贝叶斯推断模型的多无人机协同跟踪技术研究

国家自然科学基金

14+阅读 · 2015年12月31日

在轨航天器诊断策略自动构建与学习调控方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于贝叶斯网络的城市公交动态调度决策方法

国家自然科学基金

3+阅读 · 2015年12月31日

基于确定学习方法的无人水面艇智能控制研究

国家自然科学基金

17+阅读 · 2014年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

12+阅读 · 2008年12月31日

Calibrated Sampling-Free Uncertainty Estimation in Bayesian Deep Learning

Arxiv

0+阅读 · 6月15日

Optimal Stopping for Sequential Bayesian Experimental Design

Arxiv

0+阅读 · 6月13日

Calibrating Bayesian Inference

Arxiv

0+阅读 · 6月12日

Multi-Label Test-Time Adaptation with Bayesian Conditional Priors

Arxiv

0+阅读 · 6月11日

Bayesian online learning in the one-pass regime: Frequentist validity and uncertainty quantification

Arxiv

0+阅读 · 6月10日

Testing Neural Networks via Bayesian-Guided Exploration of Decision Landscapes

Arxiv

0+阅读 · 6月3日

Goal-driven Bayesian Optimal Experimental Design for Robust Decision-Making Under Model Uncertainty

Arxiv

0+阅读 · 5月25日

Goal-Oriented Lower-Tail Calibration of Gaussian Processes for Bayesian Optimization

Arxiv

0+阅读 · 5月19日

Sequential Bayesian Monitoring for Recoverable and Drifting Processes

Arxiv

0+阅读 · 5月5日

Bayesian Optimization on Networks

Arxiv

0+阅读 · 3月27日

VIP会员

文章信息

相关主题

最新内容

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

专知会员服务

1+阅读 · 今天2:06

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

专知会员服务

1+阅读 · 今天1:37

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

专知会员服务

2+阅读 · 6月17日

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

专知会员服务

2+阅读 · 6月17日

学习数据的几何：形状空间分析数学综述

学习数据的几何：形状空间分析数学综述

专知会员服务

2+阅读 · 6月17日

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

《现代防空系统综述：架构、传感器、拦截器及新兴威胁环境对基础设施受限防御环境的影响》2026最新长综述

专知会员服务

5+阅读 · 6月17日

定向能反无人机系统最新发展动态

定向能反无人机系统最新发展动态

专知会员服务

6+阅读 · 6月17日

从燃煤战舰到算法战争：水面指挥的永恒要求

从燃煤战舰到算法战争：水面指挥的永恒要求

专知会员服务

3+阅读 · 6月17日

《短程弹道再入飞行器拦截时间中的一项异常现象》

《短程弹道再入飞行器拦截时间中的一项异常现象》

专知会员服务

4+阅读 · 6月17日

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

《基于回归方法与任务上下文的对抗环境动态战术网络报文优先级排序》

专知会员服务

4+阅读 · 6月17日

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

美智库《战术级指挥控制的迫切要求：构建弹性机动式指挥控制网络》报告

专知会员服务

4+阅读 · 6月17日

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

《韩国国防政策与军备出口：韩国安全与国防政策如何塑造其国防工业与军备出口格局》最新100页报告

专知会员服务

3+阅读 · 6月17日

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

ICML 2026 | VOTP：用视频基础模型与最优传输，让离线偏好强化学习只需少量反馈

专知会员服务

5+阅读 · 6月16日

多模态代码智能综述：从视觉输入到可执行代码系统

多模态代码智能综述：从视觉输入到可执行代码系统

专知会员服务

7+阅读 · 6月16日

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

美国马六甲“三重网”概念：安全网、威慑网与杀伤网

专知会员服务

5+阅读 · 6月16日

相关VIP内容

无人机精确着陆控制技术

无人机精确着陆控制技术

专知会员服务

25+阅读 · 2024年10月22日

【剑桥大学博士论文】贝叶斯机器学习进展:从不确定性到决策，272页pdf

【剑桥大学博士论文】贝叶斯机器学习进展:从不确定性到决策，272页pdf

专知会员服务

83+阅读 · 2023年2月5日

《学习型系统的保证性》美国空军研究实验室2022最新56页技术报告

《学习型系统的保证性》美国空军研究实验室2022最新56页技术报告

专知会员服务

36+阅读 · 2022年11月22日

推荐！【美国空军】《可靠自主性的分布式学习和控制器设计》24页“可靠自主性”（Assured Autonomy）项目技术报告，2022年8月

推荐！【美国空军】《可靠自主性的分布式学习和控制器设计》24页“可靠自主性”（Assured Autonomy）项目技术报告，2022年8月

专知会员服务

41+阅读 · 2022年9月25日

【ICLR2022】Transformers亦能贝叶斯推断

【ICLR2022】Transformers亦能贝叶斯推断

专知会员服务

25+阅读 · 2021年12月23日

【ICML2021】贝叶斯结构自适应的持续学习

专知会员服务

35+阅读 · 2021年9月18日

生成式对抗网络先验贝叶斯推断，Bayesian Inference with Generative Adversarial Network Priors

生成式对抗网络先验贝叶斯推断，Bayesian Inference with Generative Adversarial Network Priors

专知会员服务

28+阅读 · 2020年2月18日

【贝叶斯深度学习：一种基于模型的可解释方法】Bayesian deep learning: A model-based interpretable approach

【贝叶斯深度学习：一种基于模型的可解释方法】Bayesian deep learning: A model-based interpretable approach

专知会员服务

49+阅读 · 2020年1月1日

【变分推断课件】Lectures on Variational Inference： Approximate Bayesian Inference in Machine Learning（附带pdf）

【变分推断课件】Lectures on Variational Inference： Approximate Bayesian Inference in Machine Learning（附带pdf）

专知会员服务

35+阅读 · 2019年11月30日

【北京智源大会2019】贝叶斯深度学习（ Bayesian Deep Learning ），清华大学| 朱军

【北京智源大会2019】贝叶斯深度学习（ Bayesian Deep Learning ），清华大学| 朱军

专知会员服务

105+阅读 · 2019年11月22日

热门VIP内容

开通专知VIP会员享更多权益服务

《面向反无人机作战的联邦式可解释射频–光电/红外情报融合：边缘人工智能优化、电子战韧性及分布式监视验证》

【伯克利博士论文】迈向可扩展与自我演进的大语言模型智能体

《廉价自杀式无人机战争的军事战略影响：乌克兰和伊朗案例研究》

ICML 2026 | FR3D：解耦自车运动的未来动态三维重建世界模型

相关资讯

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

推荐！【DARPA终身学习机器（L2M）】《自主系统中用于感知和行动的终身学习》美空军、宾大2022最新234页技术报告

专知

27+阅读 · 2022年11月24日

【ETH博士论文】贝叶斯深度学习，241页pdf

【ETH博士论文】贝叶斯深度学习，241页pdf

专知

10+阅读 · 2022年1月16日

【GitHub】BERT模型从训练到部署全流程

【GitHub】BERT模型从训练到部署全流程

专知

34+阅读 · 2019年6月28日

【Github项目】基于Keras的BERT实现，可直接载入官方预训练模型

【Github项目】基于Keras的BERT实现，可直接载入官方预训练模型

专知

20+阅读 · 2019年6月27日

最新36页《贝叶斯非参学习综述》，机器学习内功修炼手册

最新36页《贝叶斯非参学习综述》，机器学习内功修炼手册

专知

25+阅读 · 2019年2月27日

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

pytorch-pretrained-BERT：BERT PyTorch实现，可加载Google BERT预训练模型

AINLP

35+阅读 · 2018年11月6日

深度学习贝叶斯，这是一份密集的6天速成课程（附视频与PPT）

深度学习贝叶斯，这是一份密集的6天速成课程（附视频与PPT）

数据派THU

17+阅读 · 2018年9月23日

【深度】让DL可解释？这一份66页贝叶斯深度学习教程告诉你

【深度】让DL可解释？这一份66页贝叶斯深度学习教程告诉你

GAN生成式对抗网络

15+阅读 · 2018年8月11日

让DL可解释？这一份66页贝叶斯深度学习教程告诉你

让DL可解释？这一份66页贝叶斯深度学习教程告诉你

专知

19+阅读 · 2018年8月4日

贝叶斯机器学习前沿进展

贝叶斯机器学习前沿进展

机器学习研究会

21+阅读 · 2018年1月21日

相关论文

Calibrated Sampling-Free Uncertainty Estimation in Bayesian Deep Learning

Arxiv

0+阅读 · 6月15日

Optimal Stopping for Sequential Bayesian Experimental Design

Arxiv

0+阅读 · 6月13日

Calibrating Bayesian Inference

Arxiv

0+阅读 · 6月12日

Multi-Label Test-Time Adaptation with Bayesian Conditional Priors

Arxiv

0+阅读 · 6月11日

Bayesian online learning in the one-pass regime: Frequentist validity and uncertainty quantification

Arxiv

0+阅读 · 6月10日

Testing Neural Networks via Bayesian-Guided Exploration of Decision Landscapes

Arxiv

0+阅读 · 6月3日

Goal-driven Bayesian Optimal Experimental Design for Robust Decision-Making Under Model Uncertainty

Arxiv

0+阅读 · 5月25日

Goal-Oriented Lower-Tail Calibration of Gaussian Processes for Bayesian Optimization

Arxiv

0+阅读 · 5月19日

Sequential Bayesian Monitoring for Recoverable and Drifting Processes

Arxiv

0+阅读 · 5月5日

Bayesian Optimization on Networks

Arxiv

0+阅读 · 3月27日

相关基金

贝叶斯网分解理论及其应用

国家自然科学基金

16+阅读 · 2017年12月31日

面向海量高维数据的可深度结合的贝叶斯网学习与推理新方法研究

国家自然科学基金

6+阅读 · 2015年12月31日

基于对称识别方法的贝叶斯probit模型稳健性研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于弱监督贝叶斯推断模型的多无人机协同跟踪技术研究

国家自然科学基金

14+阅读 · 2015年12月31日

在轨航天器诊断策略自动构建与学习调控方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于贝叶斯网络的城市公交动态调度决策方法

国家自然科学基金

3+阅读 · 2015年12月31日

基于确定学习方法的无人水面艇智能控制研究

国家自然科学基金

17+阅读 · 2014年12月31日

基于贝叶斯推理的模糊逻辑强化学习模型研究

国家自然科学基金

18+阅读 · 2012年12月31日

强化学习关键技术及其在机器人行为学习中的应用

国家自然科学基金

23+阅读 · 2009年12月31日

基于支持向量机的复杂连续系统强化学习控制研究

国家自然科学基金

12+阅读 · 2008年12月31日

微信扫码咨询专知VIP会员