Dynamic Correction of Erroneous State Estimates via Diffusion Bayesian Exploration - 专知论文

会员服务 ·

0

状态估计 · 贝叶斯 · 基线 · 扰动 · 应急 ·

Dynamic Correction of Erroneous State Estimates via Diffusion Bayesian Exploration

翻译：基于扩散贝叶斯探索的动态错误状态估计校正

Yiwei Shi,Hongnan Ma,Mengyue Yang,Cunjia Liu,Weiru Liu

In emergency response and other high-stakes societal applications, early-stage state estimates critically shape downstream outcomes. Yet, these initial state estimates-often based on limited or biased information-can be severely misaligned with reality, constraining subsequent actions and potentially causing catastrophic delays, resource misallocation, and human harm. Under the stationary bootstrap baseline (zero transition and no rejuvenation), bootstrap particle filters exhibit Stationarity-Induced Posterior Support Invariance (S-PSI), wherein regions excluded by the initial prior remain permanently unexplorable, making corrections impossible even when new evidence contradicts current beliefs. While classical perturbations can in principle break this lock-in, they operate in an always-on fashion and may be inefficient. To overcome this, we propose a diffusion-driven Bayesian exploration framework that enables principled, real-time correction of early state estimation errors. Our method expands posterior support via entropy-regularized sampling and covariance-scaled diffusion. A Metropolis-Hastings check validates proposals and keeps inference adaptive to unexpected evidence. Empirical evaluations on realistic hazardous-gas localization tasks show that our approach matches reinforcement learning and planning baselines when priors are correct. It substantially outperforms classical SMC perturbations and RL-based methods under misalignment, and we provide theoretical guarantees that DEPF resolves S-PSI while maintaining statistical rigor.

翻译：在应急响应及其他高风险社会应用中，早期状态估计对下游结果具有决定性影响。然而，这些初始状态估计——通常基于有限或有偏差的信息——可能与现实严重偏离，从而限制后续行动，并可能导致灾难性的延误、资源错配及人员伤亡。在平稳自助法基线（零转移且无更新）条件下，自助粒子滤波器表现出平稳性诱导的后验支撑不变性（S-PSI），即被初始先验排除的区域将永久无法探索，即使新证据与当前信念相矛盾也无法进行校正。虽然经典扰动方法原则上可打破这种锁定，但其始终处于开启状态且效率可能低下。为解决此问题，我们提出一种基于扩散的贝叶斯探索框架，能够对早期状态估计误差进行原则性的实时校正。该方法通过熵正则化采样与协方差缩放扩散扩展后验支撑。Metropolis-Hastings检验验证提议样本并保持推理对意外证据的自适应性。在真实有害气体定位任务上的实证评估表明：当先验正确时，本方法与强化学习和规划基线性能相当；在先验失准情况下，其显著优于经典SMC扰动方法与基于强化学习的方法。我们同时提供理论保证，证明DEPF在保持统计严谨性的同时能够解决S-PSI问题。

0

相关内容

状态估计

状态估计根据可获取的量测数据估算动态系统内部状态的方法。对系统的输入和输出进行量测而得到的数据只能反映系统的外部特性，而系统的动态规律需要用内部（通常无法直接测量）状态变量来描述。因此状态估计对于了解和控制一个系统具有重要意义。

《提升态势感知对指挥控制系统决策效能的影响分析》

《提升态势感知对指挥控制系统决策效能的影响分析》

专知会员服务

36+阅读 · 1月27日

《不确定条件下优化问题的高效精确与近似算法》MIT最新130页

《不确定条件下优化问题的高效精确与近似算法》MIT最新130页

专知会员服务

31+阅读 · 2025年11月19日

基于深度学习的物体姿态估计综述

基于深度学习的物体姿态估计综述

专知会员服务

27+阅读 · 2024年5月15日

《重新思考网络安全决策：在不确定情况下利用认知启发法》2024最新论文

《重新思考网络安全决策：在不确定情况下利用认知启发法》2024最新论文

专知会员服务

27+阅读 · 2024年2月1日

《数据驱动型危机决策中的偏见和去偏见》2023最新27页博士论文

《数据驱动型危机决策中的偏见和去偏见》2023最新27页博士论文

专知会员服务

31+阅读 · 2023年9月5日

【CVPR2023】基于梯度不确定性归因的可解释贝叶斯深度学习

【CVPR2023】基于梯度不确定性归因的可解释贝叶斯深度学习

专知会员服务

42+阅读 · 2023年4月14日

《灾难响应中的 AI赋能态势感知》约翰霍普金斯大学48页技术报告

《灾难响应中的 AI赋能态势感知》约翰霍普金斯大学48页技术报告

专知会员服务

45+阅读 · 2022年12月19日

2022最新综述《贝叶斯视角下深度学习分类系统中的不确定性估计综述》巴塞罗那大学

2022最新综述《贝叶斯视角下深度学习分类系统中的不确定性估计综述》巴塞罗那大学

专知会员服务

58+阅读 · 2022年7月26日

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

专知会员服务

141+阅读 · 2022年5月17日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知会员服务

61+阅读 · 2020年3月14日

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

异常检测（Anomaly Detection）综述

异常检测（Anomaly Detection）综述

极市平台

20+阅读 · 2020年10月24日

【KDD2020】动态知识图谱的多事件预测

【KDD2020】动态知识图谱的多事件预测

专知

88+阅读 · 2020年8月31日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

入门 | 什么是最大似然估计、最大后验估计以及贝叶斯参数估计

入门 | 什么是最大似然估计、最大后验估计以及贝叶斯参数估计

机器之心

11+阅读 · 2018年4月15日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

概率论之概念解析：用贝叶斯推断进行参数估计

概率论之概念解析：用贝叶斯推断进行参数估计

专知

14+阅读 · 2018年1月8日

网络安全态势感知浅析

网络安全态势感知浅析

计算机与网络安全

18+阅读 · 2017年10月13日

专知主题链路知识推荐#4-机器学习中往往被忽视的贝叶斯参数估计方法

专知主题链路知识推荐#4-机器学习中往往被忽视的贝叶斯参数估计方法

专知

10+阅读 · 2017年9月19日

面向动态演化的网构软件失效机理与测评方法

国家自然科学基金

1+阅读 · 2015年12月31日

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

延迟偏差对高速DAC动态性能的影响及其校正技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向混凝土梁桥结构状态评估的非线性有限元模型修正研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于WEB信息的信息错误自动检测与修复技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于扩展状态观测器的不确定分数阶系统镇定设计

国家自然科学基金

0+阅读 · 2015年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于动态贝叶斯网络的空天态势评估方法研究

国家自然科学基金

45+阅读 · 2014年12月31日

不确定与动态信息环境下基于预规划-重规划集成建模的应急物流选址-调度鲁棒优化研究

国家自然科学基金

3+阅读 · 2014年12月31日

UAV-SEAD: State Estimation Anomaly Dataset for UAVs

Arxiv

0+阅读 · 2月14日

Diffusion-Inspired Reconfiguration of Transformers for Uncertainty Calibration

Arxiv

0+阅读 · 2月9日

Estimating the False Discovery Rate of Variable Selection

Arxiv

0+阅读 · 2月9日

Adaptive Off-Policy Inference for M-Estimators Under Model Misspecification

Arxiv

0+阅读 · 2月8日

Assessing Omitted Variable Bias when the Controls are Endogenous

Arxiv

0+阅读 · 2月4日

Learning-Based Sensor Scheduling for Delay-Aware and Stable Remote State Estimation

Arxiv

0+阅读 · 1月29日

Joint estimation of the basic reproduction number and serial interval using Sequential Bayes

Arxiv

0+阅读 · 1月28日

Robust Uncertainty Estimation under Distribution Shift via Difference Reconstruction

Arxiv

0+阅读 · 1月27日

Calibrating hierarchical Bayesian domain inference for a proportion

Arxiv

0+阅读 · 1月27日

Robust Bayesian Inference for Measurement Error Misspecification: The Berkson and Classical Cases

Arxiv

0+阅读 · 1月15日

VIP会员

文章信息

相关主题

最新内容

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

10+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

8+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

10+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

5+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

9+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

7+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

7+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

7+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

5+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

9+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

12+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

7+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

10+阅读 · 7月31日

相关VIP内容

《提升态势感知对指挥控制系统决策效能的影响分析》

《提升态势感知对指挥控制系统决策效能的影响分析》

专知会员服务

36+阅读 · 1月27日

《不确定条件下优化问题的高效精确与近似算法》MIT最新130页

《不确定条件下优化问题的高效精确与近似算法》MIT最新130页

专知会员服务

31+阅读 · 2025年11月19日

基于深度学习的物体姿态估计综述

基于深度学习的物体姿态估计综述

专知会员服务

27+阅读 · 2024年5月15日

《重新思考网络安全决策：在不确定情况下利用认知启发法》2024最新论文

《重新思考网络安全决策：在不确定情况下利用认知启发法》2024最新论文

专知会员服务

27+阅读 · 2024年2月1日

《数据驱动型危机决策中的偏见和去偏见》2023最新27页博士论文

《数据驱动型危机决策中的偏见和去偏见》2023最新27页博士论文

专知会员服务

31+阅读 · 2023年9月5日

【CVPR2023】基于梯度不确定性归因的可解释贝叶斯深度学习

【CVPR2023】基于梯度不确定性归因的可解释贝叶斯深度学习

专知会员服务

42+阅读 · 2023年4月14日

《灾难响应中的 AI赋能态势感知》约翰霍普金斯大学48页技术报告

《灾难响应中的 AI赋能态势感知》约翰霍普金斯大学48页技术报告

专知会员服务

45+阅读 · 2022年12月19日

2022最新综述《贝叶斯视角下深度学习分类系统中的不确定性估计综述》巴塞罗那大学

2022最新综述《贝叶斯视角下深度学习分类系统中的不确定性估计综述》巴塞罗那大学

专知会员服务

58+阅读 · 2022年7月26日

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

《军事作战研究中的近似动态规划（强化学习）应用综述》加拿大国防研究与发展部、加拿大联合作战司令部

专知会员服务

141+阅读 · 2022年5月17日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知会员服务

61+阅读 · 2020年3月14日

热门VIP内容

开通专知VIP会员享更多权益服务

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

相关资讯

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

推荐！《不确定性下的作战决策：推理、序贯和对抗性方法》美国空军293页博士论文，含代码

专知

52+阅读 · 2022年11月16日

异常检测（Anomaly Detection）综述

异常检测（Anomaly Detection）综述

极市平台

20+阅读 · 2020年10月24日

【KDD2020】动态知识图谱的多事件预测

【KDD2020】动态知识图谱的多事件预测

专知

88+阅读 · 2020年8月31日

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

【WWW2020-新加坡国立大学】知识图谱强化负采样的推荐系统，Reinforced Negative Sampling

专知

22+阅读 · 2020年3月14日

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

最新「因果推断Causal Inference」综述论文38页pdf，阿里巴巴、Buffalo、Georgia、Virginia

专知

68+阅读 · 2020年2月11日

入门 | 什么是最大似然估计、最大后验估计以及贝叶斯参数估计

入门 | 什么是最大似然估计、最大后验估计以及贝叶斯参数估计

机器之心

11+阅读 · 2018年4月15日

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

【机器学习基本理论】详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

机器学习研究会

19+阅读 · 2018年3月11日

概率论之概念解析：用贝叶斯推断进行参数估计

概率论之概念解析：用贝叶斯推断进行参数估计

专知

14+阅读 · 2018年1月8日

网络安全态势感知浅析

网络安全态势感知浅析

计算机与网络安全

18+阅读 · 2017年10月13日

专知主题链路知识推荐#4-机器学习中往往被忽视的贝叶斯参数估计方法

专知主题链路知识推荐#4-机器学习中往往被忽视的贝叶斯参数估计方法

专知

10+阅读 · 2017年9月19日

相关论文

UAV-SEAD: State Estimation Anomaly Dataset for UAVs

Arxiv

0+阅读 · 2月14日

Diffusion-Inspired Reconfiguration of Transformers for Uncertainty Calibration

Arxiv

0+阅读 · 2月9日

Estimating the False Discovery Rate of Variable Selection

Arxiv

0+阅读 · 2月9日

Adaptive Off-Policy Inference for M-Estimators Under Model Misspecification

Arxiv

0+阅读 · 2月8日

Assessing Omitted Variable Bias when the Controls are Endogenous

Arxiv

0+阅读 · 2月4日

Learning-Based Sensor Scheduling for Delay-Aware and Stable Remote State Estimation

Arxiv

0+阅读 · 1月29日

Joint estimation of the basic reproduction number and serial interval using Sequential Bayes

Arxiv

0+阅读 · 1月28日

Robust Uncertainty Estimation under Distribution Shift via Difference Reconstruction

Arxiv

0+阅读 · 1月27日

Calibrating hierarchical Bayesian domain inference for a proportion

Arxiv

0+阅读 · 1月27日

Robust Bayesian Inference for Measurement Error Misspecification: The Berkson and Classical Cases

Arxiv

0+阅读 · 1月15日

相关基金

面向动态演化的网构软件失效机理与测评方法

国家自然科学基金

1+阅读 · 2015年12月31日

测量误差数据下部分线性模型有约束统计推断理论

国家自然科学基金

2+阅读 · 2015年12月31日

延迟偏差对高速DAC动态性能的影响及其校正技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于支撑函数的不规则形态扩展目标建模和估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向混凝土梁桥结构状态评估的非线性有限元模型修正研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于WEB信息的信息错误自动检测与修复技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于扩展状态观测器的不确定分数阶系统镇定设计

国家自然科学基金

0+阅读 · 2015年12月31日

相依回归模型与扩散过程的统计推断及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

基于动态贝叶斯网络的空天态势评估方法研究

国家自然科学基金

45+阅读 · 2014年12月31日

不确定与动态信息环境下基于预规划-重规划集成建模的应急物流选址-调度鲁棒优化研究

国家自然科学基金

3+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员