Statistical Analysis of Conditional Group Distributionally Robust Optimization with Cross-Entropy Loss - 专知论文

会员服务 ·

0

鲁棒 · 鲁棒优化 · 交叉熵 · 损失 · 分析 ·

Statistical Analysis of Conditional Group Distributionally Robust Optimization with Cross-Entropy Loss

翻译：条件分组分布鲁棒优化的统计分析与交叉熵损失

Zijian Guo,Zhenyu Wang,Yifan Hu,Francis Bach

In multi-source learning with discrete labels, distributional heterogeneity across domains poses a central challenge to developing predictive models that transfer reliably to unseen domains. We study multi-source unsupervised domain adaptation, where labeled data are available from multiple source domains and only unlabeled data are observed from the target domain. To address potential distribution shifts, we propose a novel Conditional Group Distributionally Robust Optimization (CG-DRO) framework that learns a classifier by minimizing the worst-case cross-entropy loss over the convex combinations of the conditional outcome distributions from sources domains. We develop an efficient Mirror Prox algorithm for solving the minimax problem and employ a double machine learning procedure to estimate the risk function, ensuring that errors in nuisance estimation contribute only at higher-order rates. We establish fast statistical convergence rates for the empirical CG-DRO estimator by constructing two surrogate minimax optimization problems that serve as theoretical bridges. A distinguishing challenge for CG-DRO is the emergence of nonstandard asymptotics: the empirical CG-DRO estimator may fail to converge to a standard limiting distribution due to boundary effects and system instability. To address this, we introduce a perturbation-based inference procedure that enables uniformly valid inference, including confidence interval construction and hypothesis testing.

翻译：在多源学习与离散标签的场景中，跨领域的分布异质性构成了开发能够可靠迁移至未见领域的预测模型的核心挑战。本研究聚焦于多源无监督领域自适应问题，其中多个源领域提供带标签数据，而目标领域仅观测到无标签数据。为应对潜在的分布偏移，我们提出了一种新颖的条件分组分布鲁棒优化框架，该框架通过最小化源领域条件结果分布的凸组合上的最坏情况交叉熵损失来学习分类器。我们开发了一种高效的镜像近端算法来求解该极小极大问题，并采用双重机器学习程序来估计风险函数，确保干扰参数估计的误差仅以高阶速率影响结果。通过构建两个作为理论桥梁的代理极小极大优化问题，我们为经验CG-DRO估计量建立了快速的统计收敛速率。CG-DRO面临的一个显著挑战是非标准渐近性的出现：由于边界效应和系统不稳定性，经验CG-DRO估计量可能无法收敛到标准的极限分布。为解决此问题，我们引入了一种基于扰动的推断程序，该程序能够实现包括置信区间构建和假设检验在内的均匀有效推断。

0

相关内容

图基础模型中的分布外（Out-of-Distribution）泛化研究

图基础模型中的分布外（Out-of-Distribution）泛化研究

专知会员服务

12+阅读 · 1月31日

【牛津大学博士论文】学习分布不确定性估计的语义分割，191页pdf

【牛津大学博士论文】学习分布不确定性估计的语义分割，191页pdf

专知会员服务

30+阅读 · 2024年7月31日

【CMU博士论文】鲁棒机器学习：在分布变化下的检测、评估和适应

【CMU博士论文】鲁棒机器学习：在分布变化下的检测、评估和适应

专知会员服务

25+阅读 · 2024年7月2日

《分布外泛化评估》综述

《分布外泛化评估》综述

专知会员服务

44+阅读 · 2024年3月6日

GPT-4鲁棒性如何？MBZUAI等最新《探索GPT-4V在分布偏移下的适应性》论文

GPT-4鲁棒性如何？MBZUAI等最新《探索GPT-4V在分布偏移下的适应性》论文

专知会员服务

20+阅读 · 2023年12月14日

【CMU博士论文】分布偏移下的不确定性量化，226页pdf

【CMU博士论文】分布偏移下的不确定性量化，226页pdf

专知会员服务

31+阅读 · 2023年9月30日

【斯坦福博士论文】大模型驱动的鲁棒机器学习，243页pdf

【斯坦福博士论文】大模型驱动的鲁棒机器学习，243页pdf

专知会员服务

59+阅读 · 2023年7月10日

【牛津大学博士论文】随机过程非线性鲁棒独立分量分析，245页pdf

【牛津大学博士论文】随机过程非线性鲁棒独立分量分析，245页pdf

专知会员服务

22+阅读 · 2023年1月8日

分布外泛化(Out-Of-Distribution Generalization) 综述论文，22页pdf240篇文献

专知会员服务

64+阅读 · 2021年9月2日

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

专知会员服务

28+阅读 · 2019年12月27日

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

综述 | 异质信息网络分析与应用综述

综述 | 异质信息网络分析与应用综述

专知

27+阅读 · 2020年8月8日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

非平衡数据集 focal loss 多类分类

非平衡数据集 focal loss 多类分类

AI研习社

33+阅读 · 2019年4月23日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】

基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】

人工智能前沿讲习班

27+阅读 · 2018年12月13日

迁移学习之Domain Adaptation

迁移学习之Domain Adaptation

全球人工智能

18+阅读 · 2018年4月11日

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

带变动指标集的非光滑半无限优化问题的最优性条件研究

国家自然科学基金

0+阅读 · 2015年12月31日

通信网络在不确定业务流量需求下的路由鲁棒性优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

考虑材料分布不确定性的结构拓扑优化问题数学建模与求解方法

国家自然科学基金

0+阅读 · 2015年12月31日

非线性多自主体系统的分布式输出调节问题及其瞬态性能研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向多源大数据的鲁棒聚类模型与算法研究

国家自然科学基金

6+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

基于稀疏表示和流形理论的半监督分类研究

国家自然科学基金

0+阅读 · 2014年12月31日

Robust Machine Learning for Regulatory Sequence Modeling under Biological and Technical Distribution Shifts

Robust Machine Learning for Regulatory Sequence Modeling under Biological and Technical Distribution Shifts

Arxiv

0+阅读 · 2月19日

Profiling systematic uncertainties in Simulation-Based Inference with Factorizable Normalizing Flows

Arxiv

0+阅读 · 2月13日

Positive Distribution Shift as a Framework for Understanding Tractable Learning

Arxiv

0+阅读 · 2月12日

Distributionally Robust Optimization via Generative Ambiguity Modeling

Arxiv

0+阅读 · 2月9日

Transfer Learning Through Conditional Quantile Matching

Arxiv

0+阅读 · 2月2日

Robust Domain Generalization under Divergent Marginal and Conditional Distributions

Arxiv

0+阅读 · 2月2日

Deep Multivariate Models with Parametric Conditionals

Arxiv

0+阅读 · 2月2日

Duality and Policy Evaluation in Distributionally Robust Bayesian Diffusion Control

Arxiv

0+阅读 · 1月31日

Less is More: Clustered Cross-Covariance Control for Offline RL

Arxiv

0+阅读 · 1月28日

Contextual Distributionally Robust Optimization with Causal and Continuous Structure: An Interpretable and Tractable Approach

Arxiv

0+阅读 · 1月16日

VIP会员

文章信息

相关主题

最新内容

《无人机对海面作战影响评估》

《无人机对海面作战影响评估》

专知会员服务

1+阅读 · 今天15:30

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

专知会员服务

2+阅读 · 今天15:27

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

专知会员服务

0+阅读 · 今天15:00

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

专知会员服务

0+阅读 · 今天14:55

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

五角大楼新设无人机办公室（DRPM-UxS）将如何重塑美国无人系统格局（附美国防部设立备忘录）

专知会员服务

1+阅读 · 今天8:28

印度精确打击与指挥架构的断层

印度精确打击与指挥架构的断层

专知会员服务

4+阅读 · 7月20日

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

《NASA喷气推进实验室：高耐久轻质常驻空观测系统（HELIOS）》429页

专知会员服务

6+阅读 · 7月20日

美空军AI完成F-16战斗机自主空战历史性试飞

美空军AI完成F-16战斗机自主空战历史性试飞

专知会员服务

6+阅读 · 7月20日

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

《美政府问责局——武器系统年度评估（2026年）：强制要求成熟技术或可推动转向快速交付》249页

专知会员服务

6+阅读 · 7月20日

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

《美国陆军：通过弹性分布式模型库实现自适应AI优势》

专知会员服务

4+阅读 · 7月20日

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

博士论文 | 理解与改进大语言模型推理：从反转诅咒到连续思维链

专知会员服务

7+阅读 · 7月20日

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

综述 | 终身视觉表征：持续自监督学习CSSL系统综述

专知会员服务

7+阅读 · 7月20日

深入Project Maven：为何人工智能在战场上依然失灵

深入Project Maven：为何人工智能在战场上依然失灵

专知会员服务

14+阅读 · 7月19日

锻造未来士兵：外骨骼、基因工程与赛博格

锻造未来士兵：外骨骼、基因工程与赛博格

专知会员服务

7+阅读 · 7月19日

《无人机系统（UAS）通信网状网络试验性部署》50页报告

《无人机系统（UAS）通信网状网络试验性部署》50页报告

专知会员服务

10+阅读 · 7月19日

相关VIP内容

图基础模型中的分布外（Out-of-Distribution）泛化研究

图基础模型中的分布外（Out-of-Distribution）泛化研究

专知会员服务

12+阅读 · 1月31日

【牛津大学博士论文】学习分布不确定性估计的语义分割，191页pdf

【牛津大学博士论文】学习分布不确定性估计的语义分割，191页pdf

专知会员服务

30+阅读 · 2024年7月31日

【CMU博士论文】鲁棒机器学习：在分布变化下的检测、评估和适应

【CMU博士论文】鲁棒机器学习：在分布变化下的检测、评估和适应

专知会员服务

25+阅读 · 2024年7月2日

《分布外泛化评估》综述

《分布外泛化评估》综述

专知会员服务

44+阅读 · 2024年3月6日

GPT-4鲁棒性如何？MBZUAI等最新《探索GPT-4V在分布偏移下的适应性》论文

GPT-4鲁棒性如何？MBZUAI等最新《探索GPT-4V在分布偏移下的适应性》论文

专知会员服务

20+阅读 · 2023年12月14日

【CMU博士论文】分布偏移下的不确定性量化，226页pdf

【CMU博士论文】分布偏移下的不确定性量化，226页pdf

专知会员服务

31+阅读 · 2023年9月30日

【斯坦福博士论文】大模型驱动的鲁棒机器学习，243页pdf

【斯坦福博士论文】大模型驱动的鲁棒机器学习，243页pdf

专知会员服务

59+阅读 · 2023年7月10日

【牛津大学博士论文】随机过程非线性鲁棒独立分量分析，245页pdf

【牛津大学博士论文】随机过程非线性鲁棒独立分量分析，245页pdf

专知会员服务

22+阅读 · 2023年1月8日

分布外泛化(Out-Of-Distribution Generalization) 综述论文，22页pdf240篇文献

专知会员服务

64+阅读 · 2021年9月2日

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

【论文推荐】不同图像域弱监督语义分割的综合分析，A Comprehensive Analysis of Weakly-Supervised Semantic Segmentation in Different Image Domains

专知会员服务

28+阅读 · 2019年12月27日

热门VIP内容

开通专知VIP会员享更多权益服务

《可损耗无人系统规模化应用对美国军事转型的战略影响（2022-2030）》2026年270页

综述 | 面向5G/6G网络的LLM智能体AI：架构、协议与标准化

《无人机对海面作战影响评估》

博士论文 | 后训练如何损害大模型生成多样性？SimpleStrat与Stylus

相关资讯

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

多模态怎么用自监督？爱丁堡等最新《自监督多模态学习》综述，详述目标函数、数据对齐和模型架构

专知

10+阅读 · 2023年4月6日

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

推荐！《基于多智能体学习的任务分配动态邻域优化》2022最新41页综述论文，伦敦国王学院

专知

17+阅读 · 2022年11月15日

综述 | 异质信息网络分析与应用综述

综述 | 异质信息网络分析与应用综述

专知

27+阅读 · 2020年8月8日

【资源】领域自适应相关论文、代码分享

【资源】领域自适应相关论文、代码分享

专知

32+阅读 · 2019年10月12日

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

Dropout、梯度消失/爆炸、Adam优化算法，神经网络优化算法看这一篇就够了

AI100

14+阅读 · 2019年9月1日

非平衡数据集 focal loss 多类分类

非平衡数据集 focal loss 多类分类

AI研习社

33+阅读 · 2019年4月23日

领域自适应学习论文大列表

领域自适应学习论文大列表

专知

71+阅读 · 2019年3月2日

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

分布式优化算法及其在多智能体系统与机器学习中的应用【附PPT与视频资料】

人工智能前沿讲习班

21+阅读 · 2018年12月21日

基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】

基于数据的分布式鲁棒优化算法及其应用【附PPT与视频资料】

人工智能前沿讲习班

27+阅读 · 2018年12月13日

迁移学习之Domain Adaptation

迁移学习之Domain Adaptation

全球人工智能

18+阅读 · 2018年4月11日

相关论文

Robust Machine Learning for Regulatory Sequence Modeling under Biological and Technical Distribution Shifts

Robust Machine Learning for Regulatory Sequence Modeling under Biological and Technical Distribution Shifts

Arxiv

0+阅读 · 2月19日

Profiling systematic uncertainties in Simulation-Based Inference with Factorizable Normalizing Flows

Arxiv

0+阅读 · 2月13日

Positive Distribution Shift as a Framework for Understanding Tractable Learning

Arxiv

0+阅读 · 2月12日

Distributionally Robust Optimization via Generative Ambiguity Modeling

Arxiv

0+阅读 · 2月9日

Transfer Learning Through Conditional Quantile Matching

Arxiv

0+阅读 · 2月2日

Robust Domain Generalization under Divergent Marginal and Conditional Distributions

Arxiv

0+阅读 · 2月2日

Deep Multivariate Models with Parametric Conditionals

Arxiv

0+阅读 · 2月2日

Duality and Policy Evaluation in Distributionally Robust Bayesian Diffusion Control

Arxiv

0+阅读 · 1月31日

Less is More: Clustered Cross-Covariance Control for Offline RL

Arxiv

0+阅读 · 1月28日

Contextual Distributionally Robust Optimization with Causal and Continuous Structure: An Interpretable and Tractable Approach

Arxiv

0+阅读 · 1月16日

相关基金

有效融合多源异构数据的集成分类器研究

国家自然科学基金

5+阅读 · 2015年12月31日

带变动指标集的非光滑半无限优化问题的最优性条件研究

国家自然科学基金

0+阅读 · 2015年12月31日

通信网络在不确定业务流量需求下的路由鲁棒性优化研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于多模态信息集成的组合预测模型及其应用研究

国家自然科学基金

6+阅读 · 2015年12月31日

考虑材料分布不确定性的结构拓扑优化问题数学建模与求解方法

国家自然科学基金

0+阅读 · 2015年12月31日

非线性多自主体系统的分布式输出调节问题及其瞬态性能研究

国家自然科学基金

1+阅读 · 2015年12月31日

面向多源大数据的鲁棒聚类模型与算法研究

国家自然科学基金

6+阅读 · 2015年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

基于稀疏表示和流形理论的半监督分类研究

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员