Sparsifying generalized linear models - 专知论文

会员服务 ·

0

广义线性模型 · 线性模型 · 稀疏化 · 线性的 · 泛函 ·

2023 年 11 月 29 日

Sparsifying generalized linear models

翻译：稀疏化广义线性模型

Arun Jambulapati,James R. Lee,Yang P. Liu,Aaron Sidford

We consider the sparsification of sums $F : \mathbb{R}^n \to \mathbb{R}$ where $F(x) = f_1(\langle a_1,x\rangle) + \cdots + f_m(\langle a_m,x\rangle)$ for vectors $a_1,\ldots,a_m \in \mathbb{R}^n$ and functions $f_1,\ldots,f_m : \mathbb{R} \to \mathbb{R}_+$. We show that $(1+\varepsilon)$-approximate sparsifiers of $F$ with support size $\frac{n}{\varepsilon^2} (\log \frac{n}{\varepsilon})^{O(1)}$ exist whenever the functions $f_1,\ldots,f_m$ are symmetric, monotone, and satisfy natural growth bounds. Additionally, we give efficient algorithms to compute such a sparsifier assuming each $f_i$ can be evaluated efficiently. Our results generalize the classic case of $\ell_p$ sparsification, where $f_i(z) = |z|^p$, for $p \in (0, 2]$, and give the first near-linear size sparsifiers in the well-studied setting of the Huber loss function and its generalizations, e.g., $f_i(z) = \min\{|z|^p, |z|^2\}$ for $0 < p \leq 2$. Our sparsification algorithm can be applied to give near-optimal reductions for optimizing a variety of generalized linear models including $\ell_p$ regression for $p \in (1, 2]$ to high accuracy, via solving $(\log n)^{O(1)}$ sparse regression instances with $m \le n(\log n)^{O(1)}$, plus runtime proportional to the number of nonzero entries in the vectors $a_1, \dots, a_m$.

翻译：我们考虑和式 $F : \mathbb{R}^n \to \mathbb{R}$ 的稀疏化，其中 $F(x) = f_1(\langle a_1,x\rangle) + \cdots + f_m(\langle a_m,x\rangle)$，向量 $a_1,\ldots,a_m \in \mathbb{R}^n$，函数 $f_1,\ldots,f_m : \mathbb{R} \to \mathbb{R}_+$。我们证明：当函数 $f_1,\ldots,f_m$ 对称、单调且满足自然增长界时，存在支撑规模为 $\frac{n}{\varepsilon^2} (\log \frac{n}{\varepsilon})^{O(1)}$ 的 $(1+\varepsilon)$-近似稀疏化器。此外，在假设每个 $f_i$ 可高效计算的前提下，我们给出了计算这种稀疏化器的高效算法。我们的结果推广了 $\ell_p$ 稀疏化的经典情形（其中 $f_i(z) = |z|^p$，$p \in (0, 2]$），并在 Huber 损失函数及其推广（例如 $f_i(z) = \min\{|z|^p, |z|^2\}$，$0 < p \leq 2$）这一已被充分研究的场景中首次给出了近线性规模的稀疏化器。我们的稀疏化算法可用于为多种广义线性模型的优化提供近最优的约简，包括高精度 $\ell_p$ 回归（$p \in (1, 2]$），只需求解 $(\log n)^{O(1)}$ 个满足 $m \le n(\log n)^{O(1)}$ 的稀疏回归实例，加上与向量 $a_1, \dots, a_m$ 中非零元素数量成正比的计算时间。

0

相关内容

广义线性模型

广义线性模型

【干货书】线性代数概论：计算、应用和理论，435页pdf

【干货书】线性代数概论：计算、应用和理论，435页pdf

专知会员服务

59+阅读 · 2023年1月30日

【2022新书】数据科学的实用线性代数，328页pdf

【2022新书】数据科学的实用线性代数，328页pdf

专知会员服务

138+阅读 · 2022年9月17日

【NeurIPS2021】用于文本图表示学习的 GNN 嵌套 Transformer 模型：GraphFormers

【NeurIPS2021】用于文本图表示学习的 GNN 嵌套 Transformer 模型：GraphFormers

专知会员服务

46+阅读 · 2021年11月24日

【ICCV2021】模态视频表示的跨模态对比学习

专知会员服务

16+阅读 · 2021年10月4日

分布外泛化(Out-Of-Distribution Generalization) 综述论文，22页pdf240篇文献

专知会员服务

64+阅读 · 2021年9月2日

【ICML2021】随机傅立叶特征的量化算法

专知会员服务

25+阅读 · 2021年7月31日

【ICML2021】基于子图结构的GNN解释模型

专知会员服务

50+阅读 · 2021年6月2日

【ACL2020】多模态信息抽取，365页ppt

【ACL2020】多模态信息抽取，365页ppt

专知会员服务

151+阅读 · 2020年7月6日

【亚马逊-WWW2020】不解析,生成!用于面向任务的语义分析的序列到序列体系结构，Don't Parse, Generate! A Sequence to Sequence Architecture for Task-Oriented Semantic Parsing

【亚马逊-WWW2020】不解析,生成!用于面向任务的语义分析的序列到序列体系结构，Don't Parse, Generate! A Sequence to Sequence Architecture for Task-Oriented Semantic Parsing

专知会员服务

15+阅读 · 2020年2月1日

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

专知会员服务

37+阅读 · 2019年10月17日

【2022新书】数据科学的实用线性代数，328页pdf

【2022新书】数据科学的实用线性代数，328页pdf

专知

22+阅读 · 2022年9月18日

【CVPR2021】半监督迁移学习的自适应一致性正则化

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

图节点嵌入(Node Embeddings)概述，9页pdf

图节点嵌入(Node Embeddings)概述，9页pdf

专知

15+阅读 · 2020年8月22日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

条件概率和贝叶斯公式 - 图解概率 03

条件概率和贝叶斯公式 - 图解概率 03

遇见数学

10+阅读 · 2018年6月5日

概率图模型体系：HMM、MEMM、CRF

概率图模型体系：HMM、MEMM、CRF

机器学习研究会

30+阅读 · 2018年2月10日

CNN 反向传播算法推导

CNN 反向传播算法推导

统计学习与视觉计算组

30+阅读 · 2017年12月29日

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

科技创新与创业

17+阅读 · 2017年11月17日

可解释的CNN

可解释的CNN

CreateAMind

18+阅读 · 2017年10月5日

基于LDA的主题模型实践（三）

基于LDA的主题模型实践（三）

机器学习深度学习实战原创交流

23+阅读 · 2015年10月12日

Musielak-Orlicz-Sobolev 空间中的迹嵌入及其应用

国家自然科学基金

2+阅读 · 2015年12月31日

罗巴代数的表示和罗巴代数在operad中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

低差分均匀度密码函数的构造与分析

国家自然科学基金

0+阅读 · 2015年12月31日

具有群作用CR流形上的Morse不等式

国家自然科学基金

0+阅读 · 2015年12月31日

Schr？dinger-Poisson方程守恒DDG方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

动态Gr？bner 基与GVW算法

国家自然科学基金

0+阅读 · 2014年12月31日

稳定广义有限元法的研究与若干典型工程应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于quantaloid-加载范畴的quantale值收敛理论

国家自然科学基金

1+阅读 · 2014年12月31日

一个组合猜想及其相关问题的研究

国家自然科学基金

0+阅读 · 2014年12月31日

Poisson流形上的修正Hamilton方法

国家自然科学基金

0+阅读 · 2014年12月31日

Numerical approximation of the stochastic Cahn-Hilliard equation with space-time white noise near the sharp interface limit

Arxiv

0+阅读 · 2024年1月23日

Statistical inference for radially-stable generalized Pareto distributions and return level-sets in geometric extremes

Arxiv

0+阅读 · 2024年1月23日

On the degree of polynomials computing square roots mod p

Arxiv

0+阅读 · 2024年1月23日

Comments on finite termination of the generalized Newton method for absolute value equations

Arxiv

0+阅读 · 2024年1月22日

Discrete anisotropic curve shortening flow in higher codimension

Arxiv

0+阅读 · 2024年1月22日

Canonization of a random graph by two matrix-vector multiplications

Arxiv

0+阅读 · 2024年1月22日

Bounding and computing obstacle numbers of graphs

Arxiv

0+阅读 · 2024年1月21日

Unambiguous parity-query complexity

Arxiv

0+阅读 · 2024年1月20日

Independence preserving property of Kummer laws

Arxiv

0+阅读 · 2024年1月20日

Generalized minimum 0-extension problem and discrete convexity

Arxiv

0+阅读 · 2024年1月19日

VIP会员

文章信息

相关主题

广义线性模型

最新内容

从采集到决策：美军视角下的战术情报范式重构

从采集到决策：美军视角下的战术情报范式重构

专知会员服务

10+阅读 · 8月2日

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

专知会员服务

5+阅读 · 8月2日

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

专知会员服务

8+阅读 · 8月2日

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

专知会员服务

10+阅读 · 8月2日

《履带式无人地面战车技术发展现状》

《履带式无人地面战车技术发展现状》

专知会员服务

5+阅读 · 8月2日

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

《美国空军B-2“幽灵”隐身轰炸机系统工程案例研究》117页

专知会员服务

9+阅读 · 8月1日

隐身技术前沿综述：物理机理、工程实践与战略展望

隐身技术前沿综述：物理机理、工程实践与战略展望

专知会员服务

7+阅读 · 8月1日

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

《多变海洋环境下无人水面艇与自主水下机器人对接的最优路径规划》

专知会员服务

7+阅读 · 8月1日

《以机反机：基于无人机载麦克风的空中周界入侵检测》

《以机反机：基于无人机载麦克风的空中周界入侵检测》

专知会员服务

7+阅读 · 8月1日

《无人机脆弱性利用：网络空间力量的新域》

《无人机脆弱性利用：网络空间力量的新域》

专知会员服务

5+阅读 · 8月1日

美空军如何将人工智能从战场部署至后方机关

美空军如何将人工智能从战场部署至后方机关

专知会员服务

13+阅读 · 7月31日

《美战争部指令文件：网络空间效应与使能能力测试评估》

《美战争部指令文件：网络空间效应与使能能力测试评估》

专知会员服务

9+阅读 · 7月31日

《史诗怒火行动：多域前瞻评估》49页报告

《史诗怒火行动：多域前瞻评估》49页报告

专知会员服务

12+阅读 · 7月31日

《英国防部：未来空战系统数字化战略》33页

《英国防部：未来空战系统数字化战略》33页

专知会员服务

7+阅读 · 7月31日

《面向自主飞行网络的智能体人工智能架构》

《面向自主飞行网络的智能体人工智能架构》

专知会员服务

10+阅读 · 7月31日

相关VIP内容

【干货书】线性代数概论：计算、应用和理论，435页pdf

【干货书】线性代数概论：计算、应用和理论，435页pdf

专知会员服务

59+阅读 · 2023年1月30日

【2022新书】数据科学的实用线性代数，328页pdf

【2022新书】数据科学的实用线性代数，328页pdf

专知会员服务

138+阅读 · 2022年9月17日

【NeurIPS2021】用于文本图表示学习的 GNN 嵌套 Transformer 模型：GraphFormers

【NeurIPS2021】用于文本图表示学习的 GNN 嵌套 Transformer 模型：GraphFormers

专知会员服务

46+阅读 · 2021年11月24日

【ICCV2021】模态视频表示的跨模态对比学习

专知会员服务

16+阅读 · 2021年10月4日

分布外泛化(Out-Of-Distribution Generalization) 综述论文，22页pdf240篇文献

专知会员服务

64+阅读 · 2021年9月2日

【ICML2021】随机傅立叶特征的量化算法

专知会员服务

25+阅读 · 2021年7月31日

【ICML2021】基于子图结构的GNN解释模型

专知会员服务

50+阅读 · 2021年6月2日

【ACL2020】多模态信息抽取，365页ppt

【ACL2020】多模态信息抽取，365页ppt

专知会员服务

151+阅读 · 2020年7月6日

【亚马逊-WWW2020】不解析,生成!用于面向任务的语义分析的序列到序列体系结构，Don't Parse, Generate! A Sequence to Sequence Architecture for Task-Oriented Semantic Parsing

【亚马逊-WWW2020】不解析,生成!用于面向任务的语义分析的序列到序列体系结构，Don't Parse, Generate! A Sequence to Sequence Architecture for Task-Oriented Semantic Parsing

专知会员服务

15+阅读 · 2020年2月1日

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

Connections between Support Vector Machines, Wasserstein distance and gradient-penalty GANs

专知会员服务

37+阅读 · 2019年10月17日

热门VIP内容

开通专知VIP会员享更多权益服务

乌克兰“德尔塔”系统揭示无人机、数据与领导力如何重塑现代安全格局

《北约概念开发与实验（CD&E）手册：概念开发者工具箱》100页手册

从采集到决策：美军视角下的战术情报范式重构

大规模作战中的参谋流程：作为联合兵种作战组成部分的目标锁定

相关资讯

【2022新书】数据科学的实用线性代数，328页pdf

【2022新书】数据科学的实用线性代数，328页pdf

专知

22+阅读 · 2022年9月18日

【CVPR2021】半监督迁移学习的自适应一致性正则化

【CVPR2021】半监督迁移学习的自适应一致性正则化

专知

41+阅读 · 2021年3月7日

图节点嵌入(Node Embeddings)概述，9页pdf

图节点嵌入(Node Embeddings)概述，9页pdf

专知

15+阅读 · 2020年8月22日

disentangled-representation-papers

disentangled-representation-papers

CreateAMind

26+阅读 · 2018年9月12日

条件概率和贝叶斯公式 - 图解概率 03

条件概率和贝叶斯公式 - 图解概率 03

遇见数学

10+阅读 · 2018年6月5日

概率图模型体系：HMM、MEMM、CRF

概率图模型体系：HMM、MEMM、CRF

机器学习研究会

30+阅读 · 2018年2月10日

CNN 反向传播算法推导

CNN 反向传播算法推导

统计学习与视觉计算组

30+阅读 · 2017年12月29日

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

基于位置注意力机制模型和带标签数据来提升槽填充（EMNLP outstanding paper）

科技创新与创业

17+阅读 · 2017年11月17日

可解释的CNN

可解释的CNN

CreateAMind

18+阅读 · 2017年10月5日

基于LDA的主题模型实践（三）

基于LDA的主题模型实践（三）

机器学习深度学习实战原创交流

23+阅读 · 2015年10月12日

相关论文

Numerical approximation of the stochastic Cahn-Hilliard equation with space-time white noise near the sharp interface limit

Arxiv

0+阅读 · 2024年1月23日

Statistical inference for radially-stable generalized Pareto distributions and return level-sets in geometric extremes

Arxiv

0+阅读 · 2024年1月23日

On the degree of polynomials computing square roots mod p

Arxiv

0+阅读 · 2024年1月23日

Comments on finite termination of the generalized Newton method for absolute value equations

Arxiv

0+阅读 · 2024年1月22日

Discrete anisotropic curve shortening flow in higher codimension

Arxiv

0+阅读 · 2024年1月22日

Canonization of a random graph by two matrix-vector multiplications

Arxiv

0+阅读 · 2024年1月22日

Bounding and computing obstacle numbers of graphs

Arxiv

0+阅读 · 2024年1月21日

Unambiguous parity-query complexity

Arxiv

0+阅读 · 2024年1月20日

Independence preserving property of Kummer laws

Arxiv

0+阅读 · 2024年1月20日

Generalized minimum 0-extension problem and discrete convexity

Arxiv

0+阅读 · 2024年1月19日

相关基金

Musielak-Orlicz-Sobolev 空间中的迹嵌入及其应用

国家自然科学基金

2+阅读 · 2015年12月31日

罗巴代数的表示和罗巴代数在operad中的应用

国家自然科学基金

0+阅读 · 2015年12月31日

低差分均匀度密码函数的构造与分析

国家自然科学基金

0+阅读 · 2015年12月31日

具有群作用CR流形上的Morse不等式

国家自然科学基金

0+阅读 · 2015年12月31日

Schr？dinger-Poisson方程守恒DDG方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

动态Gr？bner 基与GVW算法

国家自然科学基金

0+阅读 · 2014年12月31日

稳定广义有限元法的研究与若干典型工程应用

国家自然科学基金

0+阅读 · 2014年12月31日

基于quantaloid-加载范畴的quantale值收敛理论

国家自然科学基金

1+阅读 · 2014年12月31日

一个组合猜想及其相关问题的研究

国家自然科学基金

0+阅读 · 2014年12月31日

Poisson流形上的修正Hamilton方法

国家自然科学基金

0+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员