Comparação de Recursos

Índice de Preços de Aluguel de GPU em Nuvem

atualizado em 6 jul. 2026

As taxas sob demanda para as GPUs de nuvem da mais nova geração (B200, B300, MI300X, RTX 5090) praticamente dobraram no último ano, enquanto as placas mainstream (H100, H200, A100) mantiveram uma faixa estreita. Compilamos o índice de GPU mensalmente de 63 provedores e 17 modelos de GPU, abrangendo os planos sob demanda, spot e reservado de 1 ano.

Tendências de preços por geração de GPU

Billing type

Loading Chart

O gráfico mostra o preço mensal médio publicado em três faixas de data de lançamento. Dividimos 17 modelos de GPU em três categorias por data de lançamento:

Categoria	GPUs	Função
Últimos lançamentos (2024 e posteriores)	B200, B300, MI300X, RTX 5090	Geração mais recente
Modernos (2020 a 2023)	H100, H200, A100, L40S, RTX 4090, A10G, T4, L4	Executores de carga de trabalho mainstream
Legado (pré-2020)	V100, P100, K80, M60, P40	Ainda alugáveis, principalmente neoclouds de nível comunitário

A maior parte do aumento veio das listagens B200 e B300 se expandindo de provedores neocloud para planilhas de preços de hyperscalers. Essas listagens de hyperscalers são tipicamente 2x-3x mais altas, elevando a mediana da categoria à medida que entram no conjunto de dados.

As GPUs modernas subiram cerca de 25%, mas o movimento é em grande parte estatístico. Google Cloud adicionou sua variante A3z Mega H100 à listagem padrão A3, elevando a mediana do grupo H100 de ~$2 para ~$3. Por baixo, o H100 neocloud teve tendência de queda. Sinalizamos isso na próxima seção.

As GPUs legadas caíram de $1.78 para $0.99 no período, impulsionadas pela perda dos âncoras hyperscalers de alto padrão do grupo V100 à medida que as empresas descontinuam o SKU. Um ou dois provedores por placa Legacy permanecem em nosso conjunto de dados: AWS lista K80 a $0.90, P40 está na Vast.ai a $0.11, e o restante são casos marginais de listagem única semelhante.

O mercado de contratos se moveu de forma diferente: os compromissos de H100 de 1 ano tiveram tendência de alta no mesmo período, enquanto nossa mediana sob demanda de H100 ficou praticamente estável. Isso mostra uma diferença cada vez maior entre os preços mensais e os compromissos de 1 ano.

Veja nossa GPU metodologia do índice para saber como isso é calculado.

Tendências de preços por modelo de GPU

O gráfico a seguir abrange 10 GPUs: 5 modernas, 4 de últimos lançamentos e a V100 como referência Legacy.

GPUs modernas (H100, H200, A100, L40S, RTX 4090)

IONOS cobre este segmento a partir da UE: T4 sob demanda, A10 e RTX PRO 6000 Blackwell, além de servidores dedicados H100 e H200 a uma taxa fixa de $3,990/mês com residência de dados na UE.

H100 é listado por 46 provedores, a cobertura mais ampla de qualquer acelerador atual. A mediana do grupo agora está em torno de $2.99/GPU-hora, abaixo dos $7 do início de 2024. Thunder Compute, Vast.ai e RunPod estão na parte inferior da faixa; Microsoft Azure e Google Cloud carregam a ponta superior acima de $10. A linha do Google Cloud é, na verdade, uma mistura de três SKUs (a3-highgpu, a3-megagpu, a3-edgegpu) colapsados sob um único rótulo nvidia-h100, o que eleva sua mediana de grupo.

A faixa do H200 vai de $2.30 (FluidStack) a $13.78 (Microsoft Azure), com uma mediana de grupo em torno de $4.00. O limite inferior depende de você considerar as listagens de nível comunitário ou de compartilhamento de instância como comparáveis à capacidade dedicada. Deixando essas de lado, a mediana de trabalho fica na faixa de $3-4.

O A100 mantém uma faixa neocloud apertada em torno de $1.79, com um ou dois outliers de inferência sem servidor (Replicate a $5.04) puxando a ponta superior para cima. Trate as taxas sem servidor separadamente ao comparar provedores IaaS.

O L40S se estabilizou em uma mediana de cerca de $1.56, com AWS a $7.58 estabelecendo o teto. A RTX 4090 é a placa de classe de treinamento mais barata do índice, com mediana de $0.52, com Salad a $0.18 e Beam a $1.61 delimitando a faixa. Ambos visam inferência abaixo de 100B e fine‑tuning em lote, onde muitas vezes substituem a A100 por uma fração do preço.

GPUs de últimos lançamentos (B200, B300, MI300X, RTX 5090)

Mediana do B200: $6.11, faixa: $3.44 (Vast.ai) a $16.11 (Google Cloud). Mediana do B300: $7.92, faixa: $5.44 (Vast.ai) a $18.00 (Oracle Cloud). Mediana do MI300X: $2.72, faixa: $1.99 (DigitalOcean) a $7.86 (Microsoft Azure). Mediana da RTX 5090: $0.66, faixa: $0.27 (Salad) a $2.00 (Vast.ai).

O padrão se repete a partir da curva anterior do H100: os hyperscalers carregam novos aceleradores com 3-5x os pisos neocloud durante o primeiro ano. O B300 ainda está em tendência de alta no gráfico, à medida que novas listagens de hyperscalers continuam elevando a mediana. O MI300X é o outlier de oferta; é listado abaixo do piso do H100 na DigitalOcean e TensorWave, mas roda em ROCm e nem toda carga de trabalho CUDA é portada perfeitamente.

Referência legado (V100)

A V100, a placa Legacy no gráfico, está incluída como linha de referência da geração de 2017. A mediana do grupo caiu de $1.84 em meados de 2024 para cerca de $0.99 hoje, em 17 provedores. Os hyperscalers mantêm SKUs V100 para clientes de conformidade com cargas de trabalho imutáveis; os neoclouds, na maioria, já as abandonaram.

Tendências de preços por provedor

Para a mesma GPU, os preços publicados pelos hyperscalers são tipicamente 3x-6x mais altos do que as listagens neocloud mais baixas no conjunto de dados. A profundidade do catálogo varia por provedor, GPU, região e tipo de faturamento.

Oferta e disponibilidade

A oferta varia mais amplamente do que os preços principais. O gráfico a seguir mostra a parcela de cada GPU que relata estoque confirmado hoje, ordenada da mais escassa para a mais disponível.

MI300X e L40S são as mais escassas, com 44%, seguidas por B200 e B300 com 52-54%. H100, A100 e H200 se agrupam perto de 63-70%, onde cerca de dois terços do catálogo são estoque confirmado e o restante depende de provisionamento. RTX 4090 e RTX 5090 alcançam 93-97%, refletindo maior oferta de placas de consumo e menor demanda empresarial por placa.

article.automate_process_description

article.automate_process_button

Escolhendo uma GPU e um provedor

A escolha da GPU é moldada por três eixos: carga de trabalho, duração e região. A precificação spot vs. sob demanda se sobrepõe a todos os três.

Por carga de trabalho

Carga de trabalho	GPU recomendada	Segmento de provedor	Por quê
Inferência de LLM, modelos 7-13B	L4, L40S	Neocloud	Abaixo de $2/h, otimizada para inferência
Inferência de LLM, 30-70B	A100 80GB, H100	Neocloud	VRAM suficiente, H100 para SLA de latência apertado
Inferência de LLM, 70B+ limitada por memória	H200, MI300X	Neocloud	141-192 GB HBM permite KV-cache maior
Fine‑tuning 7-13B	A100, H100	Neocloud	Custo-eficiente, amplamente disponível
Treinamento de grandes modelos do zero	H100, B200 multi‑nó	Hyperscaler ou grande neocloud	HBM multi-GPU e interconexão rápida
Experimentação, prototipagem	T4, A10G, L4, RTX 4090	Neocloud de nível comunitário	Barato por hora, rápido para iniciar
Produção regulamentada (HIPAA/SOC2/FedRAMP)	Qualquer uma acima	Hyperscaler	Certificações de conformidade

Por duração

Menos de uma semana: Neocloud sob demanda, no piso da faixa.

Várias semanas: Solicite uma cotação (neoclouds normalmente dão desconto de 15-30% para compromissos de 4-12 semanas; hyperscalers oferecem planos reservados de 1 ano).

Vários anos: negocie diretamente com os provedores, pois as taxas publicadas sob demanda não capturam os descontos de compromissos de longo prazo.

Economia com reservas

O desconto de 1 ano reservado normalmente fica entre 16-39% abaixo da taxa sob demanda publicada, com as maiores economias em B200, AMD MI300X e na placa de inferência L40S, onde os provedores competem mais fortemente por capacidade comprometida.

H100 e H200 veem descontos modestos de um dígito a baixos adolescentes; seu mercado sob demanda é competitivo o suficiente para que os provedores não sacrifiquem margem por compromissos. B200 reservado com -39%, MI300X com -31%, L40S com -30%. O gráfico mostra a mediana entre provedores para ambos os planos de faturamento; cotações individuais de provedores podem ser mais profundas para prazos plurianuais não refletidos aqui.

Spot vs sob demanda

O gráfico do rastreador de desconto spot mostra a mediana do desconto spot vs. sob demanda por categoria. Nos últimos seis meses, modernas economizam ~50%, últimas lançamentos ~49%, legadas ~75% (Legado é mais ruidoso do que parece; poucos provedores ainda publicam taxas spot para essas placas).

Se sua carga de trabalho tolera interrupções de 5-15 minutos, o spot é a maior alavanca de custo disponível. Alterne o menu de faturamento no gráfico explorador no topo para ver a taxa spot lado a lado com a sob demanda para qualquer provedor da sua lista.

Metodologia do índice de GPU

O índice cobre os preços por hora publicados de aluguel de GPU em nuvem nos planos sob demanda, spot e reservado de 1 ano (onde os provedores os listam publicamente). Ele não cobre contratos plurianuais, taxas negociadas empresarialmente, combinações de spot com planos de economia ou custo total de propriedade.

Nossos dados são capturas mensais ao longo de 24 meses (julho de 2024 a junho de 2026), filtrados para 17 modelos de GPU curados em 63 provedores. Cada captura relata, para cada célula (provedor, GPU, tipo de faturamento, mês), o mínimo, máximo, média e mediana da taxa por GPU por hora, além da contagem de ofertas por trás desses números.

Os preços de H100, A100, H200, B200, B300 e V100 são medianas calculadas entre várias versões físicas da placa (interconexão PCIe, SXM ou NVL; para A100 e V100, também 40/80 GB ou 16/32 GB de VRAM) que os provedores listam sob um único nome.

Como cada gráfico é calculado

Usamos mediana de medianas em todo o processo: provedores e GPUs entram no número principal com peso igual, de modo que um provedor com 38 listagens não sufoque um novo com 5 listagens.

Resumo do mercado (três linhas de categoria):

1Step 1  For each provider + GPU + billing tier + month, take the median price.
2Step 2  Take the median across providers, leaving one value per GPU + billing tier + month.
3Step 3  Take the median across GPUs in the same category, leaving one value per category + billing tier + month.

O menu de faturamento reexecuta os passos 2-3 para o plano selecionado (sob demanda, spot ou reserva). Uma quarta opção "Média" traça a média aritmética das três medianas de planos por categoria por mês, restrita aos meses em que os três planos têm dados.

Explorador provedor × faturamento:

Para o provedor e plano de faturamento que você selecionar, cada linha traça a mediana mensal de uma GPU ao longo do tempo. Nenhuma agregação entre provedores é aplicada: cada ponto do mês é o preço mediano entre as listagens daquele provedor para aquela GPU e aquele plano. A linha termina onde a oferta desaparece do catálogo.

GPUs modernas lado a lado:

Mesmos passos 1-2 do resumo de mercado, restrito à precificação sob demanda. Cada linha é a mediana mensal entre provedores para uma GPU. Nenhuma agregação entre GPUs. Oito séries.

Rastreador de desconto spot:

1Step 1  Keep the provider + GPU + month cells where both an on-demand and a spot price exist.
2Step 2  Per cell, compute: discount % = (on-demand − spot) / on-demand × 100.
3Step 3  Per GPU per month, take the median discount across providers.
4Step 4  Per category per month, take the median discount across GPUs.

Isso emparelha cada preço spot com seu equivalente sob demanda do mesmo provedor, mesma GPU, mesmo mês, de modo que o desconto reflete a diferença real que um comprador naquele provedor veria, e não uma diferença de ruído entre mercados.

Instantâneo de disponibilidade:

1Step 1  Take the current snapshot of listings, one row per provider + SKU + billing tier.
2Step 2  Per GPU, compute: % available = confirmed listings / total listings × 100.
3Step 3  Sort GPUs ascending by % available, so tightest supply appears leftmost.

Apenas instantâneo, sem agregação temporal. Listagens relatadas como estoque desconhecido, lista de espera ou indisponível ainda são contadas no denominador, mas não são desenhadas separadamente no gráfico, pois o sinal acionável para o comprador é a parcela confirmada como disponível.

Economia com reservas:

1Step 1  Filter the latest weekly snapshot to on-demand and reservation listings.
2Step 2  Per GPU per tier, take the median of cross-provider monthly medians.
3Step 3  Pair the two tiers per GPU and render as grouped bars.

Não perca os nossos benchmarks e insights baseados em dados. O botão abre o Google; selecionar a AIMultiple confirma que deseja ver a AIMultiple com mais frequência nos resultados de pesquisa do Google.

Adicionar como fonte preferencial

Perguntas frequentes

Publicamos uma visão mediana mensal atualizada a cada mês. Os números refletem os dados até o mês anterior.

A GPU é a mesma; o pacote não é. Os hyperscalers incluem no preço conformidade (HIPAA, SOC 2, FedRAMP), SLAs empresariais, integração de identidade e rede e suporte 24/7. Os neoclouds precificam acesso bare metal ou VM com orquestração gerenciada opcional. Se você não precisa do pacote, o preço Neocloud é a comparação correta.

Sim, se sua carga de trabalho faz pontos de verificação e tolera interrupções de 5-15 minutos. O desconto spot de GPU moderna fica próximo de 50% nos últimos seis meses, e as economias se acumulam em treinamentos de vários dias. Spot é a escolha errada para inferência sensível à latência, serviços de réplica única sem failover ou execuções de avaliação que precisam de uma comparação limpa de tempo decorrido.

O menu de faturamento do gráfico de tendências de preços por provedor alterna entre os planos sob demanda, spot e reservado de 1 ano onde os provedores publicam essas taxas. Contratos plurianuais e descontos negociados empresarialmente não estão incluídos. Solicite uma cotação diretamente ao provedor para esses.

Leitura adicional

Cite esta pesquisa

Escolha o formato adequado ao local onde você vai publicar. Colar a versão com link no seu CMS preserva o backlink.

Ekrem Sarı (2026) - "Índice de Preços de Aluguel de GPU em Nuvem". Publicado on-line em AIMultiple.com. Acessado em 6 Julho 2026, em: https://aimultiple.com/gpu-index [Recurso on-line]

Sarı, E. (2026, 6 Julho). Índice de Preços de Aluguel de GPU em Nuvem. AIMultiple. https://aimultiple.com/gpu-index

@misc{sar2026,
  author = {Sarı, Ekrem},
  title  = {{Índice de Preços de Aluguel de GPU em Nuvem}},
  year   = {2026},
  month  = jul,
  howpublished    = {\url{https://aimultiple.com/gpu-index}},
  note   = {AIMultiple. Acessado em 6 Julho 2026}
}

Ekrem Sarı

Pesquisador de IA

Ekrem é pesquisador de IA na AIMultiple, com foco em automação inteligente, GPUs, agentes de IA e frameworks RAG.

Ver perfil completo