Serviços
Contate-nos

Principais 60+ Provedores de GPU

Sedat Dogan
Sedat Dogan
atualizado em 3 jul. 2026

Os provedores de GPU na nuvem se dividem em três níveis. Os hiperscalers operam plataformas abrangentes com aluguel de GPU como um produto entre muitos. Os neoclouds especialistas focam em infraestrutura de GPU e IA como seu produto principal. Os mercados comunitários agregam inventário de muitos pequenos operadores, muitas vezes no piso da faixa de preços publicada.

Monitoramos 64 provedores de GPU na nuvem e 14 famílias de modelos de GPU curadas abrangendo mais de 2.500 configurações distintas de instância.

Preços por nível de provedor

Loading Chart

Escolha um modelo de GPU e um nível de provedor para comparar trajetórias de preços sob demanda dentro desse nível nos últimos 23 meses.

Tabela de comparação de provedores

Definições de colunas:

  • Modelos: famílias distintas de modelos de GPU oferecidas por todos os fornecedores (NVIDIA + AMD + Intel). H100 e H100 NVL contam como uma família.
  • Combinações: SKUs de instância distintas (GPU model, GPU count) em todo o catálogo público.
  • Níveis de faturamento: quantos dos níveis Sob demanda, Spot e Reservado de 1 ano o provedor expõe (máx 3).
  • De ponta: Sim se o provedor listar qualquer um dos B200, B300, MI300X ou RTX 5090.

Classificação: os patrocinadores são vinculados e destacados no topo da tabela. Os demais provedores são classificados pela profundidade do catálogo (coluna Combinações) em ordem decrescente.

IONOS

IONOS é uma plataforma de nuvem europeia com sede na Alemanha. O catálogo público de GPU cobre quatro SKUs de GPU única:

O SKU RTX PRO 6000 Blackwell é um dos poucos cartões da geração Blackwell listados publicamente a menos de $2/GPU/hora no lado da UE. A IONOS não lista H100 publicamente. O faturamento é apenas sob demanda, com um limite máximo mensal postado em cada SKU. A hospedagem e os data centers estão na UE/EEE, o que é importante para compradores com requisitos de residência de dados do GDPR.

Provedores hiperscaler

Os hiperscalers operam plataformas de nuvem abrangentes com aluguel de GPU como um produto entre muitos, juntamente com computação, armazenamento, rede, identidade e serviços gerenciados. Eles geralmente cobram de 3 a 6 vezes mais do que os neoclouds especialistas pelo mesmo GPU porque a capacidade alugada vem bundled com SLA empresarial, certificações de conformidade e integração entre serviços.

Amazon Web Services

A AWS é o maior hiperscaler. O catálogo abrange 15 famílias de modelos de GPU e publica H100 através da família de instâncias p5. Dois níveis de faturamento são listados publicamente (sob demanda e reservado de 1 ano); o preço spot existe, mas é roteado por um fluxo de solicitação separado. O EC2 G7e foi adicionado no início de 2026 com NVIDIA RTX PRO 6000 Blackwell, inicialmente em us-east-1 e us-east-2.1 2 3

A AWS também oferece seus próprios aceleradores de IA (Trainium para treinamento, Inferentia para inferência), que ficam fora do escopo de aluguel de GPU desta comparação. SageMaker, Redshift e o catálogo mais amplo de serviços gerenciados são razões comuns pelas quais as empresas escolhem a AWS, apesar do prêmio de taxa de GPU.

A aprovação de cota é necessária para a maioria dos tipos de instância de GPU. Recebemos uma cota para todos os tipos H100 e A100 dentro de um dia após a aplicação em nosso teste.

Microsoft Azure

O Azure publica H100 através da série ND H100 v5 (H100 SXM); configurações menores de H100 PCIe estão disponíveis através da série NC. O catálogo abrange 10 famílias de modelos de GPU e inclui B200 (ND B200) e AMD MI300X (ND MI300X v5).4 5

Os três níveis de faturamento são listados publicamente. O Azure também tem desenvolvido seu próprio programa de acelerador de IA (Maia) para cargas de trabalho de treinamento internas; esses chips não são alugáveis através da API padrão de instância de GPU.6

Google Cloud Platform

O GCP publica o H100 mais barato no nível de hiperscaler, mas a listagem colapsa três SKUs (a3-highgpu, a3-megagpu, a3-edgegpu) em uma única linha nas capturas de tela do catálogo público. A variante A3 Mega geralmente é listada em ~$14,19/GPU/hora, enquanto a A3 Standard fica em ~$11,06, e a mediana visível se move conforme uma variante entra ou sai da listagem pública. O catálogo abrange 10 famílias de modelos de GPU e inclui B200 através da família A3 Ultra.7

Os três níveis de faturamento são listados publicamente. O GCP também oferece aceleradores TPU (v5p, v6e, Trillium) como uma linha de produtos separada fora do escopo de aluguel de GPU desta comparação.

Oracle Cloud Infrastructure

O OCI usa uma abordagem metal nu (bare-metal-first): a maioria das ofertas de GPU roda diretamente no hardware do host sem uma camada de hipervisor. O catálogo abrange 13 famílias de modelos de GPU, incluindo AMD MI300X e MI355X. Entre os hiperscalers, o metal nu por padrão do OCI e a rede de cluster RoCE v2 são diferenciais para cargas de trabalho de treinamento de vários nós fortemente acoplados. Cohere, um cliente inicial, executa treinamento de LLM em clusters OCI; o Oracle também investiu na Cohere como apoiador estratégico.8

Outras nuvens gerais de nível de hiperscaler

OVHcloud (com sede na França), Scaleway (França, com o supercomputador Nabu 2023 detendo 1.016 H100 GPUs), DigitalOcean, Vultr e Linode/Akamai completam o nível de hiperscaler. Estas são plataformas de nuvem de propósito geral com aluguel de GPU como um componente. As sediadas na Europa (OVHcloud, Scaleway, IONOS) são posicionadas para residência de dados da UE e alegações de sustentabilidade; a Scaleway opera inteiramente com energia renovável em três regiões da UE.9 10 11 12 13 14

O Alibaba Cloud é o único hiperscaler importante com disponibilidade no continente chinês. O catálogo é mais estreito (4 famílias de modelos de GPU) e empresas dos EUA/UE com cargas de trabalho regulamentadas geralmente o excluem por questões de jurisdição.15

Provedores neocloud

Os neoclouds focam em infraestrutura de GPU e IA como seu produto principal. Eles geralmente undercutam os preços dos hiperscalers em 50-80% pelo mesmo GPU porque pulam a sobrecarga da plataforma abrangente. A compensação é um catálogo de serviços mais estreito: computação e armazenamento básico são bem cobertos; identidade, bancos de dados gerenciados e integração entre serviços não são.

Lambda Labs

O Lambda Labs afirma atender mais de 10.000 equipes de pesquisa. O catálogo abrange 8 famílias de modelos de GPU e é apenas GPU por design. O Lambda Cloud vem pré-equipado com PyTorch, TensorFlow, drivers CUDA e um notebook Jupyter por instância, mais próximo de "clique e treine" do que outros neoclouds. O Lambda também vende hardware de GPU diretamente (desktops, servidores), com as raízes históricas da empresa. O preço é apenas sob demanda na listagem pública; compromissos de várias semanas e vários anos são baseados em cotação.16

CoreWeave

O CoreWeave é o maior neocloud especialista e foi selecionado como o primeiro provedor de serviços em nuvem Elite da NVIDIA. A empresa afirma ter 45.000 GPUs em seus data centers e conta com a NVIDIA entre seus investidores. Dois níveis de faturamento são expostos (sob demanda e spot). O catálogo abrange 10 famílias de modelos de GPU, incluindo B200 e B300.17

O programa ARENA do CoreWeave (AI-Ready Native Applications) permite que os clientes avaliem cargas de trabalho em escala de produção contra infraestrutura real antes de se comprometerem com a capacidade. O preço fica mais próximo do nível de hiperscaler do que outros neoclouds, refletindo o posicionamento empresarial de alto nível.

RunPod

O RunPod opera dois níveis: Secure Cloud (metal nu dedicado) e Community Cloud (metal nu compartilhado a taxas mais baixas sem SLA). O catálogo abrange 18 famílias de modelos de GPU, incluindo AMD MI300X. Três níveis de faturamento são expostos publicamente (sob demanda, spot e reservado). A inicialização da instância é subminuto, a mais rápida em nossas medições.18

Atualizações recentes incluem rollback de lançamento do GitHub para endpoints Serverless, endpoints de balanceamento de carga em beta e integração do Vercel AI SDK através do pacote @runpod/ai-sdk-provider. O catálogo de Endpoints Públicos cobre modelos de texto, imagem, vídeo e áudio com modelos de implantação pré-construídos.

Crusoe

O Crusoe opera data centers em gás natural encalhado e queimado, um arbitragem de custo e emissões que financia uma construção agressiva de capacidade de H100 e B200. O catálogo abrange 9 famílias de modelos de GPU, incluindo AMD MI300X.19

FluidStack, Hyperstack, Nebius

O FluidStack agrega capacidade de GPU de vários operadores de data center. O Hyperstack é uma das fontes de H100 com os preços mais baixos no nível neocloud, com uma pegada baseada no Reino Unido e três níveis de faturamento. O Nebius é sediado na Europa (Holanda) com B200 e B300 de ponta em seu catálogo.20 21 22

Paperspace by DigitalOcean

O Paperspace foi adquirido pela DigitalOcean e afirma atender mais de 650.000 usuários. O catálogo abrange 12 famílias de modelos de GPU. A interface de notebook Jupyter pré-carregada e o gerenciamento visual de instâncias são os diferenciais históricos; usuários avançados geralmente substituem a GUI por fluxos de trabalho nativos do Jupyter ou SSH.23

Outros neoclouds especialistas

TensorDock, CUDO Compute, Hot Aisle (foco em AMD MI300X), Sesterce, Lyceum, Cirrascale (apenas reservado, inclui opções Cerebras e Graphcore), Together (nível de inferência) e Replicate (serverless) completam o nível especialista. A maioria opera apenas sob demanda e visa equipes de desenvolvimento de IA pequenas a médias.24 25 26 27 28 29 30 31

Datacrunch e Seeweb (especialistas europeus)

O Datacrunch é um neocloud baseado na Finlândia operando com 100% de energia renovável com H100, A100, RTX 6000 e V100 em grupos de 1, 2, 4 ou 8. O Seeweb é um neocloud italiano também operando com 100% de energia renovável com cinco famílias de modelos de GPU e suporte ao Terraform para fluxos de trabalho de infraestrutura como código.32 33

Não perca os nossos benchmarks e insights baseados em dados. O botão abre o Google; selecionar a AIMultiple confirma que deseja ver a AIMultiple com mais frequência nos resultados de pesquisa do Google.
GoogleAdicionar como fonte preferencial

Mercados comunitários

Os mercados comunitários agregam capacidade de GPU de muitos pequenos operadores, muitas vezes no piso da faixa de preços listada publicamente. A compensação é a variabilidade: metal nu compartilhado, SLA de tempo de atividade menos consistente e inventário que depende de quantos operadores de host estão online no momento da solicitação.

Vast.ai

O Vast.ai agrega 42 famílias de modelos de GPU e 106 configurações distintas de GPU múltipla, o catálogo mais profundo entre todos os provedores que monitoramos. Três níveis de faturamento são expostos. O mercado oferece lances de inventário entre muitos pequenos operadores de host, o que significa que uma cotação de preço no painel reflete a disponibilidade atual e pode não se manter cinco minutos depois. O catálogo também inclui hardware legado (GTX 1080, era K80) que nenhum outro provedor rastreado lista, útil para experimentação orientada a custos e cargas de trabalho acadêmicas.34

Salad

O Salad roda em hardware de consumo distribuído (computadores de jogos participando da rede durante o tempo ocioso). O H100 não é listado publicamente; o catálogo tende para RTX 4090, RTX 5090 e outros cartões de nível de consumidor no piso dessas classes de GPU entre todos os provedores.35

Theta EdgeCloud

O Theta EdgeCloud abrange 28 famílias de modelos de GPU em uma pegada de rede de borda. A arquitetura distribuída na borda é o diferencial para inferência sensível à região; o preço é apenas sob demanda e o inventário varia por nó de borda.36

Modelos de implantação

Os serviços de aluguel de GPU chegam em três formatos de implantação. Cada formato troca controle por conveniência.

GPU Serverless

Os serviços de GPU Serverless gerenciam provisionamento, dimensionamento e desmontagem em nome do comprador. O provedor cobra por segundo ou por milissegundo de uso real de GPU; o tempo ocioso é grátis. O formato é adequado para cargas de trabalho esporádicas, inferência em lote e aplicações de IA generativa voláteis onde a utilização média é baixa.

Provedores comuns de GPU Serverless incluem Replicate, RunPod Serverless, Modal, Fal.ai e Together. O rendimento por dólar geralmente supera a GPU provisionada quando a utilização está abaixo de 30-40%; acima desse limite, instâncias de GPU sob demanda ou reservadas são mais baratas.37 38 39 40 41

GPU Virtual (vGPU)

As GPUs Virtuais são o formato mais comum. Um hipervisor particiona uma GPU física em uma ou mais fatias virtuais, cada uma rodando dentro de uma máquina virtual. Todos os principais hiperscalers e a maioria dos neoclouds usam esse formato por padrão. As compensações: custo previsível, ampla disponibilidade entre provedores e pequena sobrecarga de latência da camada de virtualização.

GPU Metal Nu

Os serviços de GPU Metal Nu entregam um servidor de GPU físico dedicado sem camada de virtualização. O comprador obtém acesso direto ao hardware para máximo desempenho e latência mínima. O formato se encaixa em grandes execuções de treinamento, cargas de trabalho HPC e qualquer caso em que a sobrecarga de virtualização importe. OCI, CoreWeave e Lambda Labs oferecem opções de metal nu. AWS e Azure o expõem através de famílias de instâncias específicas (p5d na AWS, série ND no Azure).

Perguntas frequentes

Os hiperscalers operam plataformas de nuvem abrangentes com aluguel de GPU como uma linha de produtos entre muitas. Os neoclouds especialistas focam em infraestrutura de GPU e IA como seu produto principal. Os hiperscalers cobram de 3 a 6 vezes mais do que os neoclouds pelo mesmo GPU; a lacuna reflete serviços empresariais bundled em vez de silício bruto. Para comparação sustentada de tendências de preços entre níveis, consulte o Índice de Preço de Aluguel de GPU na Nuvem.

Use serverless quando a utilização média de GPU estiver abaixo de 30-40%, quando as cargas de trabalho forem voláteis ou quando a sobrecarga de operações for um custo maior do que a taxa por hora. A GPU provisionada em um neocloud é mais barata em alta utilização sustentada.

Para cargas de trabalho com requisitos de residência de dados da UE ou compradores atendendo clientes da UE em caminhos sensíveis à latência, sim. IONOS, OVHcloud, Scaleway, Nebius, Datacrunch e Seeweb são opções sediadas na UE. Os preços geralmente correspondem ou superam ligeiramente os neoclouds baseados nos EUA; o prêmio é para residência, jurisdição e alegações de sustentabilidade, em vez de computação bruta.

Leitura adicional

Cite este benchmark

Escolha o formato adequado ao local onde você vai publicar. Colar a versão com link no seu CMS preserva o backlink.

Sedat Dogan and Ekrem Sarı (2026) - "Principais 60+ Provedores de GPU". Publicado on-line em AIMultiple.com. Acessado em 3 Julho 2026, em: https://aimultiple.com/cloud-gpu-providers [Recurso on-line]

Dogan, S., & Sarı, E. (2026, 3 Julho). Principais 60+ Provedores de GPU. AIMultiple. https://aimultiple.com/cloud-gpu-providers

@misc{dogan2026,
  author = {Dogan, Sedat and Sarı, Ekrem},
  title  = {{Principais 60+ Provedores de GPU}},
  year   = {2026},
  month  = jul,
  howpublished    = {\url{https://aimultiple.com/cloud-gpu-providers}},
  note   = {AIMultiple. Acessado em 3 Julho 2026}
}
Baixar todos os dados

Resultados e carimbos de data/hora de 233 pontos de dados. Baixe os dados utilizados neste artigo como um arquivo ZIP contendo 2 arquivos CSV e um README.

Última atualização: 3 Julho 2026
Baixar

Links de referência

1.
Instance Types
2.
Amazon EC2 P5 Instances – AWS
3.
What’s New at AWS – Cloud Innovation & News
4.
Pricing - Linux Virtual Machines | Microsoft Azure
5.
Virtual machine sizes overview - Azure Virtual Machines | Microsoft Learn
6.
Microsoft Source
7.
VM instance pricing | Google Cloud
8.
GPU, Virtual Machines and Bare Metal | Oracle
9.
Cloud GPU – Cloud instances for AI | OVHcloud Worldwide
10.
GPU-powered infrastructure | Scaleway
11.
Entreprise dedicated server rental: from €4.99 | Scaleway | Scaleway
12.
GPU Droplets | DigitalOcean
13.
Vultr Cloud GPU | Globally Available Cloud GPU Computing on Demand - Vultr.com
Vultr
14.
Cloud’s AI Infrastructure | GPU | Blackwell | Quadro RTX | Akamai
15.
Elastic GPU Service
16.
AI Cloud Pricing | GPU Compute & AI Infrastructure | Lambda
17.
CoreWeave Cloud Pricing | CoreWeave
18.
Pricing | Runpod
Runpod
19.
Crusoe Cloud Pricing for AI Compute & Inference | NVIDIA & AMD GPUs
Crusoe
20.
Contact Fluidstack: AI Cloud Experts
21.
Hyperstack AI Cloud Pricing | On-Demand, Reserved and Spot GPU VMs
22.
NVIDIA GPU Pricing | Nebius AI Cloud
23.
Pricing | DigitalOcean
24.
GPU Cloud — TensorDock
25.
Pricing - CUDO Compute
26.
https://hotaisle.xyz/pricing/
27.
Train your AI model with Sesterce GPU Cloud On-Demand VMs
28.
lyceum.ai for sale | Spaceship.com
29.
Cirrascale | Private AI Cloud for Training & Inference
30.
Pricing | Together AI
31.
Pricing – Replicate
32.
GPU Instances — Verda (formerly DataCrunch)
Verda
33.
Cloud Server GPU - Cloud GPU Computing for AI and Machine Learning | Seeweb
34.
GPU Pricing — Live Platform Rates | Vast.ai
Vast.ai
35.
Salad GPU Cloud Pricing | Rent GPUs from $0.02/hr
36.
Theta EdgeCloud
37.
GPU Cloud Ramp Rate: A Data-Backed Look
38.
Pricing – Replicate
39.
Serverless GPU Inference | Runpod
Runpod
40.
Plan Pricing | Modal
41.
GenAI API Pricing: Haliuo, Vidu, Pixverse | Pay-Per-Use | fal
Sedat Dogan
Sedat Dogan
CTO
Sedat é um líder em tecnologia e segurança da informação com experiência em desenvolvimento de software, coleta de dados web e cibersegurança. Sedat: - Possui 20 anos de experiência como hacker ético e guru de desenvolvimento, com vasta expertise em linguagens de programação e arquiteturas de servidores. - É consultor de executivos de alto nível e membros do conselho de administração de empresas com operações tecnológicas de alto tráfego e missão crítica, como infraestrutura de pagamentos. - Possui grande perspicácia comercial, além de sua expertise técnica.
Ver perfil completo
Revisado tecnicamente por
Ekrem Sarı
Ekrem Sarı
Pesquisador de IA
Ekrem é pesquisador de IA na AIMultiple, com foco em automação inteligente, GPUs, agentes de IA e frameworks RAG.
Ver perfil completo

Comentários 4

Compartilhe suas ideias

Seu endereço de e-mail não será publicado. Todos os campos são obrigatórios. Os comentários são deixados em seu idioma original.

0/450
Alisdair
Alisdair
Oct 22, 2024 at 05:36

Nice article, Cem! Could you add Koyeb and a few other serverless GPU providers?

Cem Dilmegani
Cem Dilmegani
Nov 10, 2024 at 07:13

Sure, thank you for the suggestion, we will consider it in the next edit.

Jesper
Jesper
Oct 06, 2024 at 03:58

Hi Cem, please also check out Dataoorts at https://dataoorts.com. We'd greatly appreciate being listed here.

Cem Dilmegani
Cem Dilmegani
Oct 22, 2024 at 03:18

Sure, we'll review to see if we can include Dataoorts in the next edit.

Jerry
Jerry
Jul 24, 2024 at 09:56

Hi Cem, we just launched Atlascloud.ai with the lowest H100 pricing on internet 2.48 on demand. Would love to get on your list.

Cem Dilmegani
Cem Dilmegani
Jul 28, 2024 at 10:24

Sure, we'll be reaching out to understand what Atlascloud.ai is offering.

Evgenii Pavlov
Evgenii Pavlov
Jun 14, 2024 at 15:23

Where is Nebius.ai ???

Cem Dilmegani
Cem Dilmegani
Jul 14, 2024 at 08:45

Thank you! It is added now.