We study an information-theoretic minimax problem for finite multivariate Markov chains on $d$-dimensional product state spaces. Given a family $\mathcal B=\{P_1,\ldots,P_n\}$ of $π$-stationary transition matrices and a class $\mathcal F = \mathcal{F}(\mathbf{S})$ of factorizable models induced by a partition $\mathbf S$ of the coordinate set $[d]$, we seek to minimize the worst-case information loss by analyzing $$\min_{Q\in\mathcal F}\max_{P\in\mathcal B} D_{\mathrm{KL}}^π(P\|Q),$$ where $D_{\mathrm{KL}}^π(P\|Q)$ is the $π$-weighted KL divergence from $Q$ to $P$. We recast the above minimax problem into concave maximization over the $n$-probability-simplex via strong duality and Pythagorean identities that we derive. This leads us to formulate an information-theoretic game and show that a mixed strategy Nash equilibrium always exists; and propose a projected subgradient algorithm to approximately solve the minimax problem with provable guarantee. By transforming the minimax problem into an orthant submodular function in $\mathbf{S}$, this motivates us to consider a max-min-max submodular optimization problem and investigate a two-layer subgradient-greedy procedure to approximately solve this generalization. Numerical experiments for Markov chains on the Curie-Weiss and Bernoulli-Laplace models illustrate the practicality of these proposed algorithms and reveals sparse optimal structures in these examples.


翻译:我们研究了定义在 $d$ 维乘积状态空间上的有限多元马尔可夫链的一个信息论极小极大问题。给定一族 $π$-平稳转移矩阵 $\mathcal B=\{P_1,\ldots,P_n\}$,以及由坐标集 $[d]$ 的一个划分 $\mathbf S$ 诱导的可因子化模型类 $\mathcal F = \mathcal{F}(\mathbf{S})$,我们通过分析 $$\min_{Q\in\mathcal F}\max_{P\in\mathcal B} D_{\mathrm{KL}}^π(P\|Q),$$ 来寻求最小化最坏情况下的信息损失,其中 $D_{\mathrm{KL}}^π(P\|Q)$ 是从 $Q$ 到 $P$ 的 $π$ 加权 KL 散度。利用我们推导的强对偶性和勾股恒等式,我们将上述极小极大问题重新表述为在 $n$-概率单纯形上的凹最大化问题。这引导我们构建一个信息论博弈,并证明混合策略纳什均衡总是存在;同时提出一种投影次梯度算法来近似求解该极小极大问题,并给出可证明的保证。通过将极小极大问题转化为关于 $\mathbf{S}$ 的卦限子模函数,这促使我们考虑一个极大-极小-极大子模优化问题,并研究一种双层次梯度-贪婪过程来近似求解这一推广问题。针对 Curie-Weiss 模型和 Bernoulli-Laplace 模型上的马尔可夫链进行的数值实验,说明了这些所提算法的实用性,并揭示了这些示例中稀疏的最优结构。

0
下载
关闭预览

相关内容

多智能体强化学习(MARL)近年研究概览
PaperWeekly
38+阅读 · 2020年3月15日
从信息瓶颈理论一瞥机器学习的“大一统理论”
不用数学讲清马尔可夫链蒙特卡洛方法?
算法与数学之美
16+阅读 · 2018年8月8日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关VIP内容
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
国家自然科学基金
12+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员