Os provedores de GPU na nuvem se dividem em três níveis. Os hiperscalers operam plataformas abrangentes com aluguel de GPU como um produto entre muitos. Os neoclouds especialistas focam em infraestrutura de GPU e IA como seu produto principal. Os mercados comunitários agregam inventário de muitos pequenos operadores, muitas vezes no piso da faixa de preços publicada.
Monitoramos 64 provedores de GPU na nuvem e 14 famílias de modelos de GPU curadas abrangendo mais de 2.500 configurações distintas de instância.
Preços por nível de provedor
Escolha um modelo de GPU e um nível de provedor para comparar trajetórias de preços sob demanda dentro desse nível nos últimos 23 meses.
Tabela de comparação de provedores
Definições de colunas:
- Modelos: famílias distintas de modelos de GPU oferecidas por todos os fornecedores (NVIDIA + AMD + Intel). H100 e H100 NVL contam como uma família.
- Combinações: SKUs de instância distintas (GPU model, GPU count) em todo o catálogo público.
- Níveis de faturamento: quantos dos níveis Sob demanda, Spot e Reservado de 1 ano o provedor expõe (máx 3).
- De ponta: Sim se o provedor listar qualquer um dos B200, B300, MI300X ou RTX 5090.
Classificação: os patrocinadores são vinculados e destacados no topo da tabela. Os demais provedores são classificados pela profundidade do catálogo (coluna Combinações) em ordem decrescente.
IONOS
IONOS é uma plataforma de nuvem europeia com sede na Alemanha. O catálogo público de GPU cobre quatro SKUs de GPU única:
O SKU RTX PRO 6000 Blackwell é um dos poucos cartões da geração Blackwell listados publicamente a menos de $2/GPU/hora no lado da UE. A IONOS não lista H100 publicamente. O faturamento é apenas sob demanda, com um limite máximo mensal postado em cada SKU. A hospedagem e os data centers estão na UE/EEE, o que é importante para compradores com requisitos de residência de dados do GDPR.
Provedores hiperscaler
Os hiperscalers operam plataformas de nuvem abrangentes com aluguel de GPU como um produto entre muitos, juntamente com computação, armazenamento, rede, identidade e serviços gerenciados. Eles geralmente cobram de 3 a 6 vezes mais do que os neoclouds especialistas pelo mesmo GPU porque a capacidade alugada vem bundled com SLA empresarial, certificações de conformidade e integração entre serviços.
Amazon Web Services
A AWS é o maior hiperscaler. O catálogo abrange 15 famílias de modelos de GPU e publica H100 através da família de instâncias p5. Dois níveis de faturamento são listados publicamente (sob demanda e reservado de 1 ano); o preço spot existe, mas é roteado por um fluxo de solicitação separado. O EC2 G7e foi adicionado no início de 2026 com NVIDIA RTX PRO 6000 Blackwell, inicialmente em us-east-1 e us-east-2.1 2 3
A AWS também oferece seus próprios aceleradores de IA (Trainium para treinamento, Inferentia para inferência), que ficam fora do escopo de aluguel de GPU desta comparação. SageMaker, Redshift e o catálogo mais amplo de serviços gerenciados são razões comuns pelas quais as empresas escolhem a AWS, apesar do prêmio de taxa de GPU.
A aprovação de cota é necessária para a maioria dos tipos de instância de GPU. Recebemos uma cota para todos os tipos H100 e A100 dentro de um dia após a aplicação em nosso teste.
Microsoft Azure
O Azure publica H100 através da série ND H100 v5 (H100 SXM); configurações menores de H100 PCIe estão disponíveis através da série NC. O catálogo abrange 10 famílias de modelos de GPU e inclui B200 (ND B200) e AMD MI300X (ND MI300X v5).4 5
Os três níveis de faturamento são listados publicamente. O Azure também tem desenvolvido seu próprio programa de acelerador de IA (Maia) para cargas de trabalho de treinamento internas; esses chips não são alugáveis através da API padrão de instância de GPU.6
Google Cloud Platform
O GCP publica o H100 mais barato no nível de hiperscaler, mas a listagem colapsa três SKUs (a3-highgpu, a3-megagpu, a3-edgegpu) em uma única linha nas capturas de tela do catálogo público. A variante A3 Mega geralmente é listada em ~$14,19/GPU/hora, enquanto a A3 Standard fica em ~$11,06, e a mediana visível se move conforme uma variante entra ou sai da listagem pública. O catálogo abrange 10 famílias de modelos de GPU e inclui B200 através da família A3 Ultra.7
Os três níveis de faturamento são listados publicamente. O GCP também oferece aceleradores TPU (v5p, v6e, Trillium) como uma linha de produtos separada fora do escopo de aluguel de GPU desta comparação.
Oracle Cloud Infrastructure
O OCI usa uma abordagem metal nu (bare-metal-first): a maioria das ofertas de GPU roda diretamente no hardware do host sem uma camada de hipervisor. O catálogo abrange 13 famílias de modelos de GPU, incluindo AMD MI300X e MI355X. Entre os hiperscalers, o metal nu por padrão do OCI e a rede de cluster RoCE v2 são diferenciais para cargas de trabalho de treinamento de vários nós fortemente acoplados. Cohere, um cliente inicial, executa treinamento de LLM em clusters OCI; o Oracle também investiu na Cohere como apoiador estratégico.8
Outras nuvens gerais de nível de hiperscaler
OVHcloud (com sede na França), Scaleway (França, com o supercomputador Nabu 2023 detendo 1.016 H100 GPUs), DigitalOcean, Vultr e Linode/Akamai completam o nível de hiperscaler. Estas são plataformas de nuvem de propósito geral com aluguel de GPU como um componente. As sediadas na Europa (OVHcloud, Scaleway, IONOS) são posicionadas para residência de dados da UE e alegações de sustentabilidade; a Scaleway opera inteiramente com energia renovável em três regiões da UE.9 10 11 12 13 14
O Alibaba Cloud é o único hiperscaler importante com disponibilidade no continente chinês. O catálogo é mais estreito (4 famílias de modelos de GPU) e empresas dos EUA/UE com cargas de trabalho regulamentadas geralmente o excluem por questões de jurisdição.15
Provedores neocloud
Os neoclouds focam em infraestrutura de GPU e IA como seu produto principal. Eles geralmente undercutam os preços dos hiperscalers em 50-80% pelo mesmo GPU porque pulam a sobrecarga da plataforma abrangente. A compensação é um catálogo de serviços mais estreito: computação e armazenamento básico são bem cobertos; identidade, bancos de dados gerenciados e integração entre serviços não são.
Lambda Labs
O Lambda Labs afirma atender mais de 10.000 equipes de pesquisa. O catálogo abrange 8 famílias de modelos de GPU e é apenas GPU por design. O Lambda Cloud vem pré-equipado com PyTorch, TensorFlow, drivers CUDA e um notebook Jupyter por instância, mais próximo de "clique e treine" do que outros neoclouds. O Lambda também vende hardware de GPU diretamente (desktops, servidores), com as raízes históricas da empresa. O preço é apenas sob demanda na listagem pública; compromissos de várias semanas e vários anos são baseados em cotação.16
CoreWeave
O CoreWeave é o maior neocloud especialista e foi selecionado como o primeiro provedor de serviços em nuvem Elite da NVIDIA. A empresa afirma ter 45.000 GPUs em seus data centers e conta com a NVIDIA entre seus investidores. Dois níveis de faturamento são expostos (sob demanda e spot). O catálogo abrange 10 famílias de modelos de GPU, incluindo B200 e B300.17
O programa ARENA do CoreWeave (AI-Ready Native Applications) permite que os clientes avaliem cargas de trabalho em escala de produção contra infraestrutura real antes de se comprometerem com a capacidade. O preço fica mais próximo do nível de hiperscaler do que outros neoclouds, refletindo o posicionamento empresarial de alto nível.
RunPod
O RunPod opera dois níveis: Secure Cloud (metal nu dedicado) e Community Cloud (metal nu compartilhado a taxas mais baixas sem SLA). O catálogo abrange 18 famílias de modelos de GPU, incluindo AMD MI300X. Três níveis de faturamento são expostos publicamente (sob demanda, spot e reservado). A inicialização da instância é subminuto, a mais rápida em nossas medições.18
Atualizações recentes incluem rollback de lançamento do GitHub para endpoints Serverless, endpoints de balanceamento de carga em beta e integração do Vercel AI SDK através do pacote @runpod/ai-sdk-provider. O catálogo de Endpoints Públicos cobre modelos de texto, imagem, vídeo e áudio com modelos de implantação pré-construídos.
Crusoe
O Crusoe opera data centers em gás natural encalhado e queimado, um arbitragem de custo e emissões que financia uma construção agressiva de capacidade de H100 e B200. O catálogo abrange 9 famílias de modelos de GPU, incluindo AMD MI300X.19
FluidStack, Hyperstack, Nebius
O FluidStack agrega capacidade de GPU de vários operadores de data center. O Hyperstack é uma das fontes de H100 com os preços mais baixos no nível neocloud, com uma pegada baseada no Reino Unido e três níveis de faturamento. O Nebius é sediado na Europa (Holanda) com B200 e B300 de ponta em seu catálogo.20 21 22
Paperspace by DigitalOcean
O Paperspace foi adquirido pela DigitalOcean e afirma atender mais de 650.000 usuários. O catálogo abrange 12 famílias de modelos de GPU. A interface de notebook Jupyter pré-carregada e o gerenciamento visual de instâncias são os diferenciais históricos; usuários avançados geralmente substituem a GUI por fluxos de trabalho nativos do Jupyter ou SSH.23
Outros neoclouds especialistas
TensorDock, CUDO Compute, Hot Aisle (foco em AMD MI300X), Sesterce, Lyceum, Cirrascale (apenas reservado, inclui opções Cerebras e Graphcore), Together (nível de inferência) e Replicate (serverless) completam o nível especialista. A maioria opera apenas sob demanda e visa equipes de desenvolvimento de IA pequenas a médias.24 25 26 27 28 29 30 31
Datacrunch e Seeweb (especialistas europeus)
O Datacrunch é um neocloud baseado na Finlândia operando com 100% de energia renovável com H100, A100, RTX 6000 e V100 em grupos de 1, 2, 4 ou 8. O Seeweb é um neocloud italiano também operando com 100% de energia renovável com cinco famílias de modelos de GPU e suporte ao Terraform para fluxos de trabalho de infraestrutura como código.32 33
Mercados comunitários
Os mercados comunitários agregam capacidade de GPU de muitos pequenos operadores, muitas vezes no piso da faixa de preços listada publicamente. A compensação é a variabilidade: metal nu compartilhado, SLA de tempo de atividade menos consistente e inventário que depende de quantos operadores de host estão online no momento da solicitação.
Vast.ai
O Vast.ai agrega 42 famílias de modelos de GPU e 106 configurações distintas de GPU múltipla, o catálogo mais profundo entre todos os provedores que monitoramos. Três níveis de faturamento são expostos. O mercado oferece lances de inventário entre muitos pequenos operadores de host, o que significa que uma cotação de preço no painel reflete a disponibilidade atual e pode não se manter cinco minutos depois. O catálogo também inclui hardware legado (GTX 1080, era K80) que nenhum outro provedor rastreado lista, útil para experimentação orientada a custos e cargas de trabalho acadêmicas.34
Salad
O Salad roda em hardware de consumo distribuído (computadores de jogos participando da rede durante o tempo ocioso). O H100 não é listado publicamente; o catálogo tende para RTX 4090, RTX 5090 e outros cartões de nível de consumidor no piso dessas classes de GPU entre todos os provedores.35
Theta EdgeCloud
O Theta EdgeCloud abrange 28 famílias de modelos de GPU em uma pegada de rede de borda. A arquitetura distribuída na borda é o diferencial para inferência sensível à região; o preço é apenas sob demanda e o inventário varia por nó de borda.36
Modelos de implantação
Os serviços de aluguel de GPU chegam em três formatos de implantação. Cada formato troca controle por conveniência.
GPU Serverless
Os serviços de GPU Serverless gerenciam provisionamento, dimensionamento e desmontagem em nome do comprador. O provedor cobra por segundo ou por milissegundo de uso real de GPU; o tempo ocioso é grátis. O formato é adequado para cargas de trabalho esporádicas, inferência em lote e aplicações de IA generativa voláteis onde a utilização média é baixa.
Provedores comuns de GPU Serverless incluem Replicate, RunPod Serverless, Modal, Fal.ai e Together. O rendimento por dólar geralmente supera a GPU provisionada quando a utilização está abaixo de 30-40%; acima desse limite, instâncias de GPU sob demanda ou reservadas são mais baratas.37 38 39 40 41
GPU Virtual (vGPU)
As GPUs Virtuais são o formato mais comum. Um hipervisor particiona uma GPU física em uma ou mais fatias virtuais, cada uma rodando dentro de uma máquina virtual. Todos os principais hiperscalers e a maioria dos neoclouds usam esse formato por padrão. As compensações: custo previsível, ampla disponibilidade entre provedores e pequena sobrecarga de latência da camada de virtualização.
GPU Metal Nu
Os serviços de GPU Metal Nu entregam um servidor de GPU físico dedicado sem camada de virtualização. O comprador obtém acesso direto ao hardware para máximo desempenho e latência mínima. O formato se encaixa em grandes execuções de treinamento, cargas de trabalho HPC e qualquer caso em que a sobrecarga de virtualização importe. OCI, CoreWeave e Lambda Labs oferecem opções de metal nu. AWS e Azure o expõem através de famílias de instâncias específicas (p5d na AWS, série ND no Azure).
Perguntas frequentes
Os hiperscalers operam plataformas de nuvem abrangentes com aluguel de GPU como uma linha de produtos entre muitas. Os neoclouds especialistas focam em infraestrutura de GPU e IA como seu produto principal. Os hiperscalers cobram de 3 a 6 vezes mais do que os neoclouds pelo mesmo GPU; a lacuna reflete serviços empresariais bundled em vez de silício bruto. Para comparação sustentada de tendências de preços entre níveis, consulte o Índice de Preço de Aluguel de GPU na Nuvem.
Use serverless quando a utilização média de GPU estiver abaixo de 30-40%, quando as cargas de trabalho forem voláteis ou quando a sobrecarga de operações for um custo maior do que a taxa por hora. A GPU provisionada em um neocloud é mais barata em alta utilização sustentada.
Para cargas de trabalho com requisitos de residência de dados da UE ou compradores atendendo clientes da UE em caminhos sensíveis à latência, sim. IONOS, OVHcloud, Scaleway, Nebius, Datacrunch e Seeweb são opções sediadas na UE. Os preços geralmente correspondem ou superam ligeiramente os neoclouds baseados nos EUA; o prêmio é para residência, jurisdição e alegações de sustentabilidade, em vez de computação bruta.
Leitura adicional
- Benchmark Multi-GPU: B200 vs H200 vs H100 vs MI300X
- Principais 30 Provedores de GPU na Nuvem & Suas GPUs
- Benchmark de Concorrência de GPU
- Principais 25+ Fabricantes de Chips de IA: NVIDIA & Seus Concorrentes
- Índice de Preço de Aluguel de GPU na Nuvem
Cite este benchmark
Escolha o formato adequado ao local onde você vai publicar. Colar a versão com link no seu CMS preserva o backlink.
@misc{dogan2026,
author = {Dogan, Sedat and Sarı, Ekrem},
title = {{Principais 60+ Provedores de GPU}},
year = {2026},
month = jul,
howpublished = {\url{https://aimultiple.com/cloud-gpu-providers}},
note = {AIMultiple. Acessado em 3 Julho 2026}
}Resultados e carimbos de data/hora de 233 pontos de dados. Baixe os dados utilizados neste artigo como um arquivo ZIP contendo 2 arquivos CSV e um README.
Comentários 4
Compartilhe suas ideias
Seu endereço de e-mail não será publicado. Todos os campos são obrigatórios. Os comentários são deixados em seu idioma original.
Nice article, Cem! Could you add Koyeb and a few other serverless GPU providers?
Sure, thank you for the suggestion, we will consider it in the next edit.
Hi Cem, please also check out Dataoorts at https://dataoorts.com. We'd greatly appreciate being listed here.
Sure, we'll review to see if we can include Dataoorts in the next edit.
Hi Cem, we just launched Atlascloud.ai with the lowest H100 pricing on internet 2.48 on demand. Would love to get on your list.
Sure, we'll be reaching out to understand what Atlascloud.ai is offering.
Where is Nebius.ai ???
Thank you! It is added now.