Sparse Rank Regression for Restricted-Access Economic Data - 专知论文

会员服务 ·

0

稀疏 · 秩 · 估计/估计量 · 汇聚 · 准则 ·

Sparse Rank Regression for Restricted-Access Economic Data

翻译：稀疏秩回归：面向受限访问经济数据的方法

Wen Zhang,Songshan Yang,Liping Zhu

from arxiv, arXiv admin note: substantial text overlap with arXiv:2602.04594

Empirical research in economics increasingly relies on restricted-access data held by multiple firms or agencies, making it impossible to construct the estimator of interest on the pooled sample. At the same time, heavy-tailed distributions are pervasive in economics and finance outcomes such as prices, expenditures and loan sizes. We study sparse, robust estimation in the restricted-access setting. The infeasible pooled benchmark is convoluted rank regression (CRR), a smooth rank-based estimator designed for heavy-tailed outcomes. Because the CRR criterion is a non-additive U-statistic, existing communication-efficient methods built for additive empirical losses do not directly apply. We propose distributed convoluted rank regression (DCRR), a surrogate criterion built from a single local CRR loss and an aggregated gradient correction, and show that it shares the same population minimizer as the pooled CRR objective. Building on this surrogate, we develop a two-stage sparse procedure: an iterative $l_1$- penalized stage followed by a folded-concave refinement. For the resulting estimator, we establish non-asymptotic error bounds, a distributed strong oracle property, and a distributed criterion for consistent model selection. Simulations and an application to used-car prices show that DCRR closely approximates pooled CRR and improves on naive divide-and-conquer, particularly under heavy-tailed errors.

翻译：实证经济学研究日益依赖由多家企业或机构持有的受限访问数据，这使得无法在合并样本上构建目标估计量。与此同时，重尾分布普遍存在于价格、支出与贷款规模等经济与金融结果变量中。本文研究受限访问场景下的稀疏稳健估计方法。不可实现的全样本基准为卷积秩回归（CRR）——一种专为重尾结果设计的平滑秩基估计量。由于CRR准则为非可加U统计量，现有面向可加经验损失构建的通信高效方法无法直接适用。我们提出分布式卷积秩回归（DCRR）——基于单个局部CRR损失与聚合梯度校正构建的代理准则，并证明其与全样本CRR目标具有相同的总体最小化点。基于该代理准则，我们开发了两阶段稀疏算法：迭代$l_1$惩罚阶段后接折叠凹修正阶段。对于所得估计量，我们建立了非渐近误差界、分布式强Oracle性质及用于一致模型选择的分布式准则。仿真实验与二手车价格应用表明，DCRR能紧密逼近全样本CRR，并在重尾误差下优于朴素分治策略。

0

相关内容

【博士论文】利用图结构加速稀疏计算

【博士论文】利用图结构加速稀疏计算

专知会员服务

18+阅读 · 2025年3月6日

【ICLR2025】大型语言模型的动态低秩稀疏适应

【ICLR2025】大型语言模型的动态低秩稀疏适应

专知会员服务

14+阅读 · 2025年2月21日

【MIT博士论文】稀疏与低秩矩阵优化在机器学习应用中的进展

【MIT博士论文】稀疏与低秩矩阵优化在机器学习应用中的进展

专知会员服务

19+阅读 · 2024年11月15日

【MIT博士论文】机器学习应用中稀疏和低秩矩阵优化的进展

【MIT博士论文】机器学习应用中稀疏和低秩矩阵优化的进展

专知会员服务

28+阅读 · 2024年11月9日

【MIT博士论文】稀疏和低秩矩阵优化在机器学习应用中的进展

【MIT博士论文】稀疏和低秩矩阵优化在机器学习应用中的进展

专知会员服务

34+阅读 · 2024年10月17日

【斯坦福经典书】统计学稀疏性：Lasso与泛化性，362页pdf

【斯坦福经典书】统计学稀疏性：Lasso与泛化性，362页pdf

专知会员服务

37+阅读 · 2020年11月15日

【伯克利Payam博士论文】大规模稀疏图的问题探究: 图压缩与负载均衡，268页pdf

【伯克利Payam博士论文】大规模稀疏图的问题探究: 图压缩与负载均衡，268页pdf

专知会员服务

20+阅读 · 2020年11月4日

低秩稀疏矩阵优化问题的模型与算法

专知会员服务

46+阅读 · 2020年7月29日

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

专知会员服务

27+阅读 · 2020年7月24日

【SIGMOD2020】稀疏数据半监督学习的分解图表示，Factorized Graph Representations for Semi-Supervised Learning from Sparse Data

【SIGMOD2020】稀疏数据半监督学习的分解图表示，Factorized Graph Representations for Semi-Supervised Learning from Sparse Data

专知会员服务

15+阅读 · 2020年3月7日

【2022新书】用回归来解决比较、估计、预测和因果推断的实际问题，546页pdf

【2022新书】用回归来解决比较、估计、预测和因果推断的实际问题，546页pdf

专知

26+阅读 · 2022年2月2日

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

深度强化学习实验室

43+阅读 · 2020年7月6日

稀疏性的3个优势 -《稀疏统计学习及其应用》

稀疏性的3个优势 -《稀疏统计学习及其应用》

遇见数学

15+阅读 · 2018年10月24日

数据分析师应该知道的16种回归方法：负二项回归

数据分析师应该知道的16种回归方法：负二项回归

数萃大数据

74+阅读 · 2018年9月16日

数据分析师应该知道的16种回归方法：泊松回归

数据分析师应该知道的16种回归方法：泊松回归

数萃大数据

35+阅读 · 2018年9月13日

数据分析师应该知道的16种回归方法：定序回归

数据分析师应该知道的16种回归方法：定序回归

数萃大数据

16+阅读 · 2018年9月9日

数据分析师应该知道的16种回归技术：偏最小二乘回归

数据分析师应该知道的16种回归技术：偏最小二乘回归

数萃大数据

14+阅读 · 2018年8月29日

数据分析师应该知道的16种回归技术：弹性网络回归

数据分析师应该知道的16种回归技术：弹性网络回归

数萃大数据

91+阅读 · 2018年8月16日

数据分析师应该知道的16种回归技术：Lasso回归

数据分析师应该知道的16种回归技术：Lasso回归

数萃大数据

16+阅读 · 2018年8月13日

数据分析师应该知道的16种回归技术：分位数回归

数据分析师应该知道的16种回归技术：分位数回归

数萃大数据

29+阅读 · 2018年8月8日

稀疏表达下社会化正则方法与低秩分解推荐模型的研究

国家自然科学基金

1+阅读 · 2015年12月31日

非凸稀疏优化的恢复条件与低复杂度算法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

图像复原中非凸稀疏优化问题的快速算法

国家自然科学基金

0+阅读 · 2015年12月31日

高阶张量的低秩恢复问题研究

国家自然科学基金

2+阅读 · 2014年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

带稀疏约束不适定问题的算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

稀疏优化问题的理论与方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

Sparse Discovery of Functional Relationships in Solutions to Systems of Differential Equations

Arxiv

0+阅读 · 6月5日

Iterative Thresholding Pursuit with Continuation for $\ell_{1-2}$-Regularized Sparse Recovery

Arxiv

0+阅读 · 6月4日

Two-Stage Robust Sparse Gradient Methods for Regression Under Heavy-Tailed Designs

Arxiv

0+阅读 · 6月3日

Estimating equations for causal survival analysis with pooled logistic regression

Arxiv

0+阅读 · 6月3日

Sparse Bayesian Deep Functional Learning with Structured Region Selection

Arxiv

0+阅读 · 6月3日

Variance Reduction for Heavy-Tailed Monetization Metrics in Ranking Experiments via Post-Stratification

Arxiv

0+阅读 · 6月2日

Efficient Federated Estimation and Inference for High-Dimensional Tail Index Regression

Arxiv

0+阅读 · 6月2日

The Fragility of Sparsity

Arxiv

0+阅读 · 5月13日

Sparse Signal Recovery using Log-Sum Regularization and Adaptive Smoothing

Arxiv

0+阅读 · 5月11日

Adaptive Sparse Group Lasso Penalized Quantile Regression via Dual ADMM

Arxiv

0+阅读 · 4月22日

VIP会员

文章信息

相关主题

估计/估计量

最新内容

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

0+阅读 · 8分钟前

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

0+阅读 · 22分钟前

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

0+阅读 · 24分钟前

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

0+阅读 · 59分钟前

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

5+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

4+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

3+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

4+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

2+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

11+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

7+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

7+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

5+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

7+阅读 · 7月31日

“史诗怒火”行动：现代多域作战的重要节点

“史诗怒火”行动：现代多域作战的重要节点

专知会员服务

8+阅读 · 7月30日

相关VIP内容

【博士论文】利用图结构加速稀疏计算

【博士论文】利用图结构加速稀疏计算

专知会员服务

18+阅读 · 2025年3月6日

【ICLR2025】大型语言模型的动态低秩稀疏适应

【ICLR2025】大型语言模型的动态低秩稀疏适应

专知会员服务

14+阅读 · 2025年2月21日

【MIT博士论文】稀疏与低秩矩阵优化在机器学习应用中的进展

【MIT博士论文】稀疏与低秩矩阵优化在机器学习应用中的进展

专知会员服务

19+阅读 · 2024年11月15日

【MIT博士论文】机器学习应用中稀疏和低秩矩阵优化的进展

【MIT博士论文】机器学习应用中稀疏和低秩矩阵优化的进展

专知会员服务

28+阅读 · 2024年11月9日

【MIT博士论文】稀疏和低秩矩阵优化在机器学习应用中的进展

【MIT博士论文】稀疏和低秩矩阵优化在机器学习应用中的进展

专知会员服务

34+阅读 · 2024年10月17日

【斯坦福经典书】统计学稀疏性：Lasso与泛化性，362页pdf

【斯坦福经典书】统计学稀疏性：Lasso与泛化性，362页pdf

专知会员服务

37+阅读 · 2020年11月15日

【伯克利Payam博士论文】大规模稀疏图的问题探究: 图压缩与负载均衡，268页pdf

【伯克利Payam博士论文】大规模稀疏图的问题探究: 图压缩与负载均衡，268页pdf

专知会员服务

20+阅读 · 2020年11月4日

低秩稀疏矩阵优化问题的模型与算法

专知会员服务

46+阅读 · 2020年7月29日

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

复杂的序列数据分析：现有算法的系统文献综述，Complex Sequential Data Analysis: A Systematic Literature Review of Existing Algorithms

专知会员服务

27+阅读 · 2020年7月24日

【SIGMOD2020】稀疏数据半监督学习的分解图表示，Factorized Graph Representations for Semi-Supervised Learning from Sparse Data

【SIGMOD2020】稀疏数据半监督学习的分解图表示，Factorized Graph Representations for Semi-Supervised Learning from Sparse Data

专知会员服务

15+阅读 · 2020年3月7日

热门VIP内容

开通专知VIP会员享更多权益服务

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

《履带式无人地面战车技术发展现状》

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

相关资讯

【2022新书】用回归来解决比较、估计、预测和因果推断的实际问题，546页pdf

【2022新书】用回归来解决比较、估计、预测和因果推断的实际问题，546页pdf

专知

26+阅读 · 2022年2月2日

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

深度强化学习实验室

43+阅读 · 2020年7月6日

稀疏性的3个优势 -《稀疏统计学习及其应用》

稀疏性的3个优势 -《稀疏统计学习及其应用》

遇见数学

15+阅读 · 2018年10月24日

数据分析师应该知道的16种回归方法：负二项回归

数据分析师应该知道的16种回归方法：负二项回归

数萃大数据

74+阅读 · 2018年9月16日

数据分析师应该知道的16种回归方法：泊松回归

数据分析师应该知道的16种回归方法：泊松回归

数萃大数据

35+阅读 · 2018年9月13日

数据分析师应该知道的16种回归方法：定序回归

数据分析师应该知道的16种回归方法：定序回归

数萃大数据

16+阅读 · 2018年9月9日

数据分析师应该知道的16种回归技术：偏最小二乘回归

数据分析师应该知道的16种回归技术：偏最小二乘回归

数萃大数据

14+阅读 · 2018年8月29日

数据分析师应该知道的16种回归技术：弹性网络回归

数据分析师应该知道的16种回归技术：弹性网络回归

数萃大数据

91+阅读 · 2018年8月16日

数据分析师应该知道的16种回归技术：Lasso回归

数据分析师应该知道的16种回归技术：Lasso回归

数萃大数据

16+阅读 · 2018年8月13日

数据分析师应该知道的16种回归技术：分位数回归

数据分析师应该知道的16种回归技术：分位数回归

数萃大数据

29+阅读 · 2018年8月8日

相关论文

Sparse Discovery of Functional Relationships in Solutions to Systems of Differential Equations

Arxiv

0+阅读 · 6月5日

Iterative Thresholding Pursuit with Continuation for $\ell_{1-2}$-Regularized Sparse Recovery

Arxiv

0+阅读 · 6月4日

Two-Stage Robust Sparse Gradient Methods for Regression Under Heavy-Tailed Designs

Arxiv

0+阅读 · 6月3日

Estimating equations for causal survival analysis with pooled logistic regression

Arxiv

0+阅读 · 6月3日

Sparse Bayesian Deep Functional Learning with Structured Region Selection

Arxiv

0+阅读 · 6月3日

Variance Reduction for Heavy-Tailed Monetization Metrics in Ranking Experiments via Post-Stratification

Arxiv

0+阅读 · 6月2日

Efficient Federated Estimation and Inference for High-Dimensional Tail Index Regression

Arxiv

0+阅读 · 6月2日

The Fragility of Sparsity

Arxiv

0+阅读 · 5月13日

Sparse Signal Recovery using Log-Sum Regularization and Adaptive Smoothing

Arxiv

0+阅读 · 5月11日

Adaptive Sparse Group Lasso Penalized Quantile Regression via Dual ADMM

Arxiv

0+阅读 · 4月22日

相关基金

稀疏表达下社会化正则方法与低秩分解推荐模型的研究

国家自然科学基金

1+阅读 · 2015年12月31日

非凸稀疏优化的恢复条件与低复杂度算法的研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于复杂数据的回归模型统计推断及其应用

国家自然科学基金

3+阅读 · 2015年12月31日

数据内在结构和稀疏保持的大间隔分类方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

图像复原中非凸稀疏优化问题的快速算法

国家自然科学基金

0+阅读 · 2015年12月31日

高阶张量的低秩恢复问题研究

国家自然科学基金

2+阅读 · 2014年12月31日

复杂数据模型中的分布逼近方法

国家自然科学基金

3+阅读 · 2014年12月31日

带稀疏约束不适定问题的算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

几类典型稀疏优化问题的算法、理论及应用

国家自然科学基金

3+阅读 · 2014年12月31日

稀疏优化问题的理论与方法及其应用

国家自然科学基金

1+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员