Deep Learning Model Deployment in Multiple Cloud Providers: an Exploratory Study Using Low Computing Power Environments - 专知论文

会员服务 ·

0

学习模型 · GPU · 深度学习模型 · 深度学习 · 云提供商 ·

Deep Learning Model Deployment in Multiple Cloud Providers: an Exploratory Study Using Low Computing Power Environments

翻译：深度学习模型在多云环境中的部署：基于低算力环境的探索性研究

Elayne Lemos,Rodrigo Oliveira,Jairson Rodrigues,Rosalvo F. Oliveira Neto

from arxiv, 15 pages, 7 figures

The deployment of Machine Learning models in the cloud has grown among tech companies. Hardware requirements are higher when these models involve Deep Learning techniques, and the cloud providers' costs may be a barrier. We explore deploying Deep Learning models, using for experiments the GECToR model, a Deep Learning solution for Grammatical Error Correction, across three of the major cloud providers (Amazon Web Services, Google Cloud Platform, and Microsoft Azure). We evaluate real-time latency, hardware usage, and cost at each cloud provider in 7 execution environments with 10 experiments reproduced. We found that while Graphics Processing Units (GPUs) excel in performance, they had an average cost 300% higher than solutions without a GPU. Our analysis also suggests that processor cache memory size is a key variable for CPU-only deployments, and setups with sufficient cache achieved a 50% cost reduction compared to GPU-based deployments. This study indicates the feasibility and affordability of cloud-based Deep Learning inference solutions without a GPU, benefiting resource-constrained users such as startups and small research groups.

翻译：机器学习模型在云端的部署已在科技公司中日益普及。当这些模型涉及深度学习技术时，硬件需求更高，而云服务提供商的成本可能构成障碍。本研究探索了深度学习模型在三大主流云提供商（Amazon Web Services、Google Cloud Platform 和 Microsoft Azure）中的部署，并以语法纠错深度学习解决方案 GECToR 模型作为实验对象。我们在 7 种执行环境中对每个云提供商评估了实时延迟、硬件使用率和成本，并复现了 10 组实验。研究发现，虽然图形处理器（GPU）在性能上表现优异，但其平均成本比无 GPU 解决方案高出 300%。分析还表明，处理器缓存大小是仅使用 CPU 部署的关键变量，具备足够缓存的配置相比基于 GPU 的部署可实现 50% 的成本降低。本研究表明，无需 GPU 的云端深度学习推理解决方案具有可行性和经济性，可为资源受限的用户（如初创企业和小型研究团队）带来益处。

0

相关内容

学习模型

可解释的机器学习模型和架构

可解释的机器学习模型和架构

专知会员服务

92+阅读 · 2023年9月17日

【普林斯顿博士论文】深度学习中的模型和数据效率，177页pdf

【普林斯顿博士论文】深度学习中的模型和数据效率，177页pdf

专知会员服务

65+阅读 · 2023年2月4日

【干货书】创建和部署深度学习应用，Programming PyTorch for Deep Learning Creating and Deploying Deep Learning Applications

【干货书】创建和部署深度学习应用，Programming PyTorch for Deep Learning Creating and Deploying Deep Learning Applications

专知会员服务

133+阅读 · 2022年3月17日

深度学习如何规模化？GMU微软等最新《大规模深度学习服务系统优化研究》综述论文，阐述大规模深度学习推理系统优化挑战与机遇

深度学习如何规模化？GMU微软等最新《大规模深度学习服务系统优化研究》综述论文，阐述大规模深度学习推理系统优化挑战与机遇

专知会员服务

33+阅读 · 2021年12月5日

机器学习模型部署都有哪些坑？剑桥研究者梳理了99篇相关研究

专知会员服务

41+阅读 · 2020年12月13日

深度学习模型终端环境自适应方法研究

深度学习模型终端环境自适应方法研究

专知会员服务

34+阅读 · 2020年11月13日

深度学习模型可解释性的研究进展

专知会员服务

223+阅读 · 2020年8月1日

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

专知会员服务

109+阅读 · 2019年12月31日

【O'Reilly TensorFlow Conference 2019】使用TensorFlow服务的高级模型部署（Advanced model deployments with TensorFlow Serving），谷歌开发专家Hannes Hapke

【O'Reilly TensorFlow Conference 2019】使用TensorFlow服务的高级模型部署（Advanced model deployments with TensorFlow Serving），谷歌开发专家Hannes Hapke

专知会员服务

23+阅读 · 2019年11月13日

【O'Reilly AI Conference 2019】使用GPU和Docker容器进行Horovod和Spark深度学习（Deep learning with Horovod and Spark using GPUs and Docker containers），BlueData的联合创始人兼首席架构师Thomas Phelan

【O'Reilly AI Conference 2019】使用GPU和Docker容器进行Horovod和Spark深度学习（Deep learning with Horovod and Spark using GPUs and Docker containers），BlueData的联合创始人兼首席架构师Thomas Phelan

专知会员服务

21+阅读 · 2019年11月5日

【干货书】Pytorch创建和部署深度学习应用，294页pdf

【干货书】Pytorch创建和部署深度学习应用，294页pdf

专知

41+阅读 · 2022年3月18日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

基于虚拟现实环境的深度学习模型构建

基于虚拟现实环境的深度学习模型构建

MOOC

24+阅读 · 2019年9月28日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

手把手教你如何部署深度学习模型

手把手教你如何部署深度学习模型

全球人工智能

18+阅读 · 2018年2月5日

深度学习 | 免费使用Google Colab的GPU云计算平台

深度学习 | 免费使用Google Colab的GPU云计算平台

沈浩老师

12+阅读 · 2018年2月4日

展望：模型驱动的深度学习

展望：模型驱动的深度学习

人工智能学家

12+阅读 · 2018年1月23日

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

AI研习社

11+阅读 · 2018年1月4日

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

面向云计算数据隐私保护的访问控制策略模型与技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

云计算环境下基于图模型的海量RDF数据管理关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

可信多云协作关键安全问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

云市场下云服务商与终端用户间利益均衡的优化模型与算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

面向隐私保护的云数据访问模型与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

云架构接入网中面向多业务的计算与无线资源分配研究

国家自然科学基金

2+阅读 · 2014年12月31日

BOA Constrictor: Squeezing Performance out of GPUs in the Cloud via Budget-Optimal Allocation

Arxiv

0+阅读 · 2月1日

Yunque DeepResearch Technical Report

Arxiv

0+阅读 · 1月27日

Cloud and AI Infrastructure Cost Optimization: A Comprehensive Review of Strategies and Case Studies

Arxiv

1+阅读 · 1月27日

High-fidelity lunar topographic reconstruction across diverse terrain and illumination environments using deep learning

Arxiv

0+阅读 · 1月14日

GroupNL: Low-Resource and Robust CNN Design over Cloud and Device

Arxiv

0+阅读 · 1月14日

High-Performance Serverless Computing: A Systematic Literature Review on Serverless for HPC, AI, and Big Data

Arxiv

0+阅读 · 1月14日

Hybrid Cloud Architectures for Research Computing: Applications and Use Cases

Arxiv

0+阅读 · 1月7日

Performance and Security Aware Distributed Service Placement in Fog Computing

Arxiv

0+阅读 · 1月3日

A Comprehensive Study of Deep Learning Model Fixing Approaches

Arxiv

0+阅读 · 2025年12月26日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

231+阅读 · 2023年4月7日

VIP会员

文章信息

相关主题

深度学习模型

最新内容

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

专知会员服务

3+阅读 · 6月1日

综述 | OPSD：大语言模型的在线策略自蒸馏

综述 | OPSD：大语言模型的在线策略自蒸馏

专知会员服务

3+阅读 · 6月1日

算法化战争：人工智能时代的新范式（万字长文）

算法化战争：人工智能时代的新范式（万字长文）

专知会员服务

7+阅读 · 6月1日

帕兰蒂尔Maven：军事人工智能的新纪元

帕兰蒂尔Maven：军事人工智能的新纪元

专知会员服务

7+阅读 · 6月1日

《军事网络取证系统中的人工智能驱动情报融合：帕兰蒂尔公司“Maven智能系统”案例研究》

《军事网络取证系统中的人工智能驱动情报融合：帕兰蒂尔公司“Maven智能系统”案例研究》

专知会员服务

9+阅读 · 6月1日

《扩展主权人工智能操作系统：将Symphony作为帕兰蒂尔Foundry与英伟达的计算本体》

《扩展主权人工智能操作系统：将Symphony作为帕兰蒂尔Foundry与英伟达的计算本体》

专知会员服务

8+阅读 · 6月1日

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

美以伊冲突中的人工智能应用：人工智能工具、部署策略及作战影响分析

专知会员服务

13+阅读 · 5月31日

比利时发布用于实时战场军事装备识别的离线人工智能系统

比利时发布用于实时战场军事装备识别的离线人工智能系统

专知会员服务

6+阅读 · 5月31日

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

《经济冲击与战略损失：美伊军事冲突的不可持续成本》

专知会员服务

5+阅读 · 5月31日

超越网格：作战环境对炮兵的影响

超越网格：作战环境对炮兵的影响

专知会员服务

3+阅读 · 5月31日

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

KDD 2026 | MixRAGRec：面向LLM推荐的混合专家KG-RAG框架

专知会员服务

9+阅读 · 5月31日

综述 | 推理时控制：可信大语言模型的运行时治理全景

综述 | 推理时控制：可信大语言模型的运行时治理全景

专知会员服务

4+阅读 · 5月31日

BES：让语言模型通过双向进化搜索自我改进

BES：让语言模型通过双向进化搜索自我改进

专知会员服务

6+阅读 · 5月30日

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

ICML 2026 | 揭开视觉语言模型计数瓶颈：看得到，却说不出

专知会员服务

7+阅读 · 5月30日

以色列-美国-伊朗战争中的无人机：关键要点

以色列-美国-伊朗战争中的无人机：关键要点

专知会员服务

7+阅读 · 5月30日

相关VIP内容

可解释的机器学习模型和架构

可解释的机器学习模型和架构

专知会员服务

92+阅读 · 2023年9月17日

【普林斯顿博士论文】深度学习中的模型和数据效率，177页pdf

【普林斯顿博士论文】深度学习中的模型和数据效率，177页pdf

专知会员服务

65+阅读 · 2023年2月4日

【干货书】创建和部署深度学习应用，Programming PyTorch for Deep Learning Creating and Deploying Deep Learning Applications

【干货书】创建和部署深度学习应用，Programming PyTorch for Deep Learning Creating and Deploying Deep Learning Applications

专知会员服务

133+阅读 · 2022年3月17日

深度学习如何规模化？GMU微软等最新《大规模深度学习服务系统优化研究》综述论文，阐述大规模深度学习推理系统优化挑战与机遇

深度学习如何规模化？GMU微软等最新《大规模深度学习服务系统优化研究》综述论文，阐述大规模深度学习推理系统优化挑战与机遇

专知会员服务

33+阅读 · 2021年12月5日

机器学习模型部署都有哪些坑？剑桥研究者梳理了99篇相关研究

专知会员服务

41+阅读 · 2020年12月13日

深度学习模型终端环境自适应方法研究

深度学习模型终端环境自适应方法研究

专知会员服务

34+阅读 · 2020年11月13日

深度学习模型可解释性的研究进展

专知会员服务

223+阅读 · 2020年8月1日

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新3D点云深度学习综述论文，带你全面了解最新点云学习方法

专知会员服务

109+阅读 · 2019年12月31日

【O'Reilly TensorFlow Conference 2019】使用TensorFlow服务的高级模型部署（Advanced model deployments with TensorFlow Serving），谷歌开发专家Hannes Hapke

【O'Reilly TensorFlow Conference 2019】使用TensorFlow服务的高级模型部署（Advanced model deployments with TensorFlow Serving），谷歌开发专家Hannes Hapke

专知会员服务

23+阅读 · 2019年11月13日

【O'Reilly AI Conference 2019】使用GPU和Docker容器进行Horovod和Spark深度学习（Deep learning with Horovod and Spark using GPUs and Docker containers），BlueData的联合创始人兼首席架构师Thomas Phelan

【O'Reilly AI Conference 2019】使用GPU和Docker容器进行Horovod和Spark深度学习（Deep learning with Horovod and Spark using GPUs and Docker containers），BlueData的联合创始人兼首席架构师Thomas Phelan

专知会员服务

21+阅读 · 2019年11月5日

热门VIP内容

开通专知VIP会员享更多权益服务

综述 | OPSD：大语言模型的在线策略自蒸馏

帕兰蒂尔Maven：军事人工智能的新纪元

ICML 2026 | Sheaf-ADMM：用可微优化学习多智能体协调

算法化战争：人工智能时代的新范式（万字长文）

相关资讯

【干货书】Pytorch创建和部署深度学习应用，294页pdf

【干货书】Pytorch创建和部署深度学习应用，294页pdf

专知

41+阅读 · 2022年3月18日

深度学习模型可解释性的研究进展

深度学习模型可解释性的研究进展

专知

26+阅读 · 2020年8月1日

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

国防科技大学发布最新「3D点云深度学习」综述论文，带你全面了解最新点云学习方法

专知

21+阅读 · 2019年12月31日

基于虚拟现实环境的深度学习模型构建

基于虚拟现实环境的深度学习模型构建

MOOC

24+阅读 · 2019年9月28日

【边缘智能】边缘计算驱动的深度学习加速技术

【边缘智能】边缘计算驱动的深度学习加速技术

产业智能官

20+阅读 · 2019年2月8日

深度学习时代的图模型，清华发文综述图网络

深度学习时代的图模型，清华发文综述图网络

GAN生成式对抗网络

13+阅读 · 2018年12月23日

手把手教你如何部署深度学习模型

手把手教你如何部署深度学习模型

全球人工智能

18+阅读 · 2018年2月5日

深度学习 | 免费使用Google Colab的GPU云计算平台

深度学习 | 免费使用Google Colab的GPU云计算平台

沈浩老师

12+阅读 · 2018年2月4日

展望：模型驱动的深度学习

展望：模型驱动的深度学习

人工智能学家

12+阅读 · 2018年1月23日

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

资深算法工程师万宫玺：Java 工程师转型 AI 的秘密法宝——深度学习框架 Deeplearning4j | 分享总结

AI研习社

11+阅读 · 2018年1月4日

相关论文

BOA Constrictor: Squeezing Performance out of GPUs in the Cloud via Budget-Optimal Allocation

Arxiv

0+阅读 · 2月1日

Yunque DeepResearch Technical Report

Arxiv

0+阅读 · 1月27日

Cloud and AI Infrastructure Cost Optimization: A Comprehensive Review of Strategies and Case Studies

Arxiv

1+阅读 · 1月27日

High-fidelity lunar topographic reconstruction across diverse terrain and illumination environments using deep learning

Arxiv

0+阅读 · 1月14日

GroupNL: Low-Resource and Robust CNN Design over Cloud and Device

Arxiv

0+阅读 · 1月14日

High-Performance Serverless Computing: A Systematic Literature Review on Serverless for HPC, AI, and Big Data

Arxiv

0+阅读 · 1月14日

Hybrid Cloud Architectures for Research Computing: Applications and Use Cases

Arxiv

0+阅读 · 1月7日

Performance and Security Aware Distributed Service Placement in Fog Computing

Arxiv

0+阅读 · 1月3日

A Comprehensive Study of Deep Learning Model Fixing Approaches

Arxiv

0+阅读 · 2025年12月26日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

231+阅读 · 2023年4月7日

相关基金

针对大规模环境下复杂任务的策略搜索强化学习方法研究

国家自然科学基金

43+阅读 · 2015年12月31日

复杂环境下机器学习的理论研究

国家自然科学基金

21+阅读 · 2015年12月31日

面向云计算数据隐私保护的访问控制策略模型与技术研究

国家自然科学基金

4+阅读 · 2015年12月31日

基于深度学习的海量截获卫星数据分析技术研究

国家自然科学基金

1+阅读 · 2015年12月31日

云计算环境下基于图模型的海量RDF数据管理关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

可信多云协作关键安全问题研究

国家自然科学基金

0+阅读 · 2015年12月31日

云市场下云服务商与终端用户间利益均衡的优化模型与算法研究

国家自然科学基金

0+阅读 · 2014年12月31日

基于深度学习的三维模型检索技术

国家自然科学基金

13+阅读 · 2014年12月31日

面向隐私保护的云数据访问模型与方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

云架构接入网中面向多业务的计算与无线资源分配研究

国家自然科学基金

2+阅读 · 2014年12月31日

微信扫码咨询专知VIP会员