Serviços
Contate-nos

Índice de Preços de Aluguel de GPU em Nuvem

Ekrem Sarı
Ekrem Sarı
atualizado em 17 jun. 2026

As taxas sob demanda para as GPUs (GPUs) de última geração em nuvem (B200, B300, MI300X, RTX 5090) dobraram aproximadamente no último ano, enquanto as placas principais (H100, H200, A100) mantiveram uma faixa estreita. Compilamos o índice de GPU mensalmente a partir de 58 provedores e 17 modelos de GPU, cobrindo as camadas sob demanda, spot e reservadas de 1 ano.

Tendências de preços por geração de GPU

Loading Chart

O gráfico mostra o preço mediano mensal publicado em três categorias de data de lançamento. Dividimos 17 modelos de GPU em três categorias por data de lançamento:

A maior parte do aumento veio de listagens B200 e B300 expandindo de provedores neocloud para planilhas de preços de hyperscalers. Essas listagens de hyperscaler são tipicamente 2x-3x mais altas, elevando a mediana da categoria à medida que entram no dataset.

As GPUs modernas subiram ~25%, mas o movimento é amplamente estatístico. Google Cloud adicionou sua variante A3z Mega H100 à listagem padrão-A3, elevando a mediana da coorte H100 de ~$2 para ~$3. Por baixo, a tendência de H100 neocloud caiu. Destacamos isso na próxima seção.

As GPUs legadas caíram de $1,78 para $0,97 durante a janela, impulsionadas pela coorte V100 perdendo suas âncoras de hyperscaler de alto nível à medida que as empresas aposentam o SKU. Apenas um ou dois provedores por placa Legada permanecem em nosso dataset: AWS lista K80 a $0,90, P40 fica no Vast.ai a $0,11, e o resto são casos de borda de listagem única semelhantes.

O mercado de contratos moveu-se de forma diferente: compromissos de H100 de 1 ano tenderam para cima durante a mesma janela, enquanto nossa mediana de H100 sob demanda foi aproximadamente plana. Isso mostra uma diferença crescente entre preços mensais e compromissos de 1 ano.

Veja nossa GPU index methodology para saber como isso é calculado.

Tendências de preços por modelo de GPU

O gráfico abaixo cobre 10 GPUs: 5 Modernas, 4 Últimos lançados e a V100 como referência Legada.

GPUs (GPUs) Modernas (H100, H200, A100, L40S, RTX 4090)

H100 é listada por 37 provedores, a mais ampla de qualquer acelerador atual. A mediana da coorte agora é de cerca de $2,95/GPU-hora, abaixo de mais de $7 no início de 2024. Thunder Compute, Vast.ai e RunPod ficam na parte inferior da dispersão; Microsoft Azure e Google Cloud carregam a cauda superior acima de $10. A linha do Google Cloud é ela própria uma mistura de três SKUs (a3-highgpu, a3-megagpu, a3-edgegpu) colapsados sob um rótulo nvidia-h100, o que eleva sua mediana de coorte.

O intervalo do H200 varia de $2,29 (Theta EdgeCloud) a $13,78 (Microsoft Azure), com uma mediana de coorte em torno de $3,39. O piso depende de como você trata listagens de nível comunitário ou compartilhamento de instância como comparáveis à capacidade dedicada. Uma vez que essas são separadas, a mediana de trabalho fica na faixa de $3-4.

A100 mantém uma faixa neocloud estreita em torno de $1,62, com um ou dois outliers de inferência sem servidor (Replicate a $5,04) puxando a cauda alta para cima. Trate as taxas sem servidor separadamente ao comparar provedores de IaaS.

L40S se estabeleceu em torno de $1,55 de mediana, com AWS a $7,58 definindo o teto. RTX 4090 é a placa de treinamento mais barata no índice a $0,44 de mediana, com Salad a $0,18 e Beam a $1,61 delimitando a dispersão. Ambos visam inferência sub-100B e ajuste fino em lote, onde frequentemente substituem A100 por uma fração do preço.

Últimos lançados GPUs (B200, B300, MI300X, RTX 5090)

B200 mediana $5,24, intervalo $3,75 (Packet AI) a $14,24 (AWS). B300 mediana $6,99, intervalo $6,10 (Nebius) a $18,00 (Oracle). MI300X mediana $1,99, intervalo $1,99 (RunPod) a $7,86 (Azure). RTX 5090 mediana $0,69, intervalo $0,27 (Salad) a $1,34 (Vast.ai).

O padrão se repete da curva anterior do H100: hyperscalers carregam novos aceleradores a 3-5x os pisos neocloud durante o primeiro ano. B300 é a única linha no gráfico ainda tendendo para cima, pois listagens adicionais de hyperscaler continuam elevando a mediana. MI300X é o outlier de oferta; RunPod e TensorWave a precificam abaixo do piso H100, mas roda em ROCm e nem toda carga de trabalho CUDA portar limpa.

Referência Legada (V100)

V100 é a única placa Legada no gráfico, incluída como uma linha de referência de geração de 2017. A mediana da coorte caiu de $1,84 em meados de 2024 para cerca de $0,97 hoje em 18 provedores. Hyperscalers mantêm SKUs V100 para clientes de conformidade executando cargas de trabalho imutáveis; Neoclouds as abandonaram na maior parte.

Tendências de preços por provedor

Para a mesma GPU, os preços publicados de hyperscaler são tipicamente 3x-6x mais altos que as listagens neocloud mais baixas no dataset. A profundidade do catálogo varia por provedor, GPU, região e tipo de cobrança.

Oferta e disponibilidade

A oferta varia mais amplamente que os preços de destaque. O gráfico abaixo mostra a participação de cada listagem de GPU relatando estoque confirmado hoje, ordenada da mais apertada para a mais disponível.

B300 fica em 6% confirmado; os 94% restantes estão listados, mas os provedores ainda não prometem o chip. MI300X e L40S chegam a 35-36%, mais estreito que o nível principal. H100, H200, A100 e B200 agrupam perto de 41-51%, onde aproximadamente metade do catálogo é estoque confirmado e metade depende de provisionamento. RTX 4090 e RTX 5090 atingem 86%, refletindo oferta mais profunda de placas de consumidor e menor demanda empresarial por placa.

Se seu projeto depende de um chip específico de última geração, planeje o tempo de antecedência de aquisição além do orçamento. A participação da lista de espera permanece próxima de zero porque a maioria das listagens não confirmadas é rastreada como "estoque desconhecido", não "lista de espera": os provedores relatam o estado do estoque, não a posição na fila.

Escolhendo uma GPU e provedor

A escolha de GPU é moldada por três eixos: carga de trabalho, duração e região. Preços Spot vs. sob demanda se sobrepõem a todos os três.

Por carga de trabalho

Por duração

Menos de uma semana: Neocloud sob demanda no piso da dispersão.

Múltiplas semanas: Solicite um orçamento (Neoclouds tipicamente descontam 15-30% para compromissos de 4-12 semanas; hyperscalers oferecem camadas reservadas de 1 ano).

Múltiplos anos: negocie diretamente com provedores, já que taxas sob demanda publicadas não capturam descontos de prazo comprometido.

Economias de reserva

O desconto reservado de 1 ano tipicamente varia de 9-32% abaixo da taxa sob demanda publicada, com as economias mais acentuadas em AMD MI300X e L40S de nível de inferência, onde os provedores competem mais fortemente por capacidade comprometida.

H100 e H200 veem descontos modestos de dígito único a baixos dois dígitos; seu mercado sob demanda já é competitivo o suficiente para que os provedores não sacrifiquem muita margem por compromissos. Reservas B200 em -20% abaixo, MI300X em -32%, L40S em -29%. O gráfico mostra a mediana entre provedores para ambas as camadas de cobrança; orçamentos individuais de provedores podem ir mais fundo para prazos de múltiplos anos não refletidos aqui.

Spot vs sob demanda

O gráfico de rastreador de desconto spot mostra o desconto mediano spot vs. sob demanda por categoria. Nos últimos seis meses, moderno economiza ~50%, últimos lançados ~48%, legado ~77% (Legado é mais ruidoso do que parece; poucos provedores ainda publicam taxas spot para essas placas).

Se sua carga de trabalho tolera interrupções de 5-15 minutos, spot é a alavanca de custo individual mais significativa disponível. Alterne o menu suspenso de cobrança no gráfico explorador no topo para ver a taxa spot lado a lado com sob demanda para qualquer provedor em sua lista curta.

Veja mais dos nossos benchmarks e insights baseados em dados na Pesquisa Google.
GoogleAdicionar como fonte preferencial

GPU index methodology

O índice cobre preços de aluguel de GPU em nuvem publicados por hora em camadas sob demanda, spot e reservadas de 1 ano (onde os provedores listam publicamente). Não cobre contratos de múltiplos anos, taxas negociadas por empresas, combinações spot-plus-plano de economia ou custo total de propriedade.

Nossos dados são snapshots mensais ao longo de 23 meses (julho de 2024 a maio de 2026), filtrados para 17 modelos de GPU curados em 58 provedores. Cada snapshot relata, para cada célula (provedor, GPU, tipo de cobrança, mês), o mínimo, máximo, média e mediana da taxa horária por GPU, além da contagem de ofertas por trás desses números.

Preços de H100, A100, H200, B200, B300 e V100 são medianas tiradas de várias versões físicas da placa (PCIe, SXM ou interconexão NVL; para A100 e V100, também 40/80 GB ou 16/32 GB VRAM) que os provedores listam sob um nome.

Como cada gráfico é calculado

Usamos mediana de medianas em todo o processo: provedores e GPUs entram no número principal com peso igual, para que um provedor de 38 listagens não afunde um novato de 5 listagens.

Resumo de mercado (três linhas de categoria):

O menu suspenso de cobrança reexecuta os Passos 2-3 contra a camada selecionada (sob demanda, spot ou reserva). Uma quarta opção "Média" plota a média aritmética das medianas de três camadas por categoria por mês, restrita a meses onde todas as três camadas têm dados.

Explorador Provedor × cobrança:

Para o provedor e camada de cobrança que você seleciona, cada linha traça a mediana mensal de uma GPU ao longo do tempo. Nenhuma agregação entre provedores é aplicada: o ponto de cada mês é simplesmente o preço mediano nas listagens daquele provedor para aquela GPU e aquela camada de cobrança. A linha termina onde a oferta desaparece do catálogo.

GPUs (GPUs) Modernas lado a lado:

Mesmos Passos 1-2 que o resumo de mercado, escopado apenas para preços sob demanda. Cada linha é a mediana mensal entre provedores para uma GPU. Nenhuma agregação entre GPUs. Oito séries.

Rastreador de desconto spot:

Isso emparelha cada preço spot com seu contraparte sob demanda do mesmo provedor, mesma GPU, mesmo mês, para que o desconto reflita a dispersão real que um comprador naquele provedor veria, não uma diferença de ruído entre mercados.

Snapshot de disponibilidade:

Apenas snapshot, sem agregação de tempo. Listagens relatadas como estoque desconhecido, lista de espera ou indisponíveis ainda são contadas no denominador, mas não desenhadas separadamente no gráfico, já que o sinal acionável pelo comprador é a participação confirmada-disponível.

Economias de reserva:

Perguntas frequentes

Publicamos uma visão mediana mensal atualizada todos os meses. Os números refletem dados até o mês anterior.

A GPU é a mesma; o pacote não é. Hyperscalers precificam conformidade (HIPAA, SOC 2, FedRAMP), SLAs empresariais, integração de identidade e rede e suporte 24/7. Neoclouds precificam metal nu ou acesso a VM com orquestração gerenciada opcional. Se você não precisa do pacote, o preço Neocloud é a comparação certa.

Sim, se sua carga de trabalho faz checkpoint e tolera interrupções de 5-15 minutos. O desconto spot de GPU moderna fica perto de 50% nos últimos seis meses, e as economias se acumulam durante treinamento de vários dias. Spot é a escolha errada para inferência sensível à latência, serviços de réplica única sem failover ou execuções de avaliação que precisam de uma comparação limpa de tempo de relógio.

O menu suspenso de cobrança do gráfico de tendências de preços por provedor alterna entre camadas sob demanda, spot e reservadas de 1 ano sempre que os provedores publicam essas taxas. Contratos de múltiplos anos e descontos negociados por empresas não estão incluídos. Solicite um orçamento diretamente do provedor para esses.

Leitura adicional

Cite esta pesquisa

Escolha o formato adequado ao local onde você vai publicar. Colar a versão com link no seu CMS preserva o backlink.

Ekrem Sarı (2026) - "Índice de Preços de Aluguel de GPU em Nuvem". Publicado on-line em AIMultiple.com. Acessado em Junho 17, 2026, em: https://aimultiple.com/gpu-index [Recurso on-line]

Sarı, E. (2026, Junho 17). Índice de Preços de Aluguel de GPU em Nuvem. AIMultiple. https://aimultiple.com/gpu-index

@misc{sar2026,
  author = {Sarı, Ekrem},
  title  = {{Índice de Preços de Aluguel de GPU em Nuvem}},
  year   = {2026},
  month  = jun,
  howpublished    = {\url{https://aimultiple.com/gpu-index}},
  note   = {AIMultiple. Retrieved Junho 17, 2026}
}
Ekrem Sarı
Ekrem Sarı
Pesquisador de IA
Ekrem é pesquisador de IA na AIMultiple, com foco em automação inteligente, GPUs, agentes de IA e frameworks RAG.
Ver perfil completo

Seja o primeiro a comentar

Seu endereço de e-mail não será publicado. Todos os campos são obrigatórios. Os comentários são deixados em seu idioma original.

0/450