Serviços
Contate-nos
Nenhum resultado encontrado.

Índice de preços de aluguel de GPUs na nuvem

Ekrem Sarı
Ekrem Sarı
atualizado em Mai 20, 2026

As taxas sob demanda para as GPUs de nuvem de última geração (B200, B300, MI300X, RTX 5090) praticamente dobraram no último ano, enquanto as placas convencionais (H100, H200, A100) mantiveram-se estáveis. Compilamos o índice de GPUs mensalmente a partir de dados de 58 provedores e 17 modelos de GPU, abrangendo opções sob demanda, spot e com reserva anual.

Tendências de preços por geração de GPU

Loading Chart

O gráfico mostra o preço médio mensal anunciado em três faixas de data de lançamento. Dividimos 17 modelos de GPU em três categorias por data de lançamento:

A maior parte do aumento veio das listagens das categorias B200 e B300, que passaram de provedores de neocloud para tabelas de preços de hiperescaladores. Essas listagens de hiperescaladores são tipicamente de 2 a 3 vezes mais caras, elevando a mediana da categoria à medida que entram no conjunto de dados.

As GPUs modernas subiram cerca de 25%, mas essa variação é em grande parte estatística. A Cloud adicionou sua variante A3z Mega H100 à lista de placas de vídeo padrão A3, elevando a mediana do grupo H100 de aproximadamente US$ 2 para US$ 3. Em seguida, a Neocloud H100 apresentou uma tendência de queda. Destacaremos isso na próxima seção.

As GPUs legadas caíram de US$ 1,78 para US$ 0,97 durante o período analisado, impulsionadas pela perda de seus principais fornecedores em hiperescaladores de ponta, à medida que as empresas descontinuam o modelo. Apenas um ou dois fornecedores por placa legada permanecem em nosso conjunto de dados: a AWS lista a K80 a US$ 0,90, a P40 está na Vast.ai a US$ 0,11, e os demais são casos isolados semelhantes, com apenas um fornecedor listado.

O mercado de contratos apresentou uma tendência diferente: os contratos H100 com duração de 1 ano subiram no mesmo período, enquanto a mediana do H100 sob demanda permaneceu praticamente estável. Isso demonstra uma diferença crescente entre os preços mensais e os preços com contrato anual.

Consulte nossa metodologia de índice de GPU para saber como isso é calculado.

Tendências de preços por modelo de GPU

O gráfico abaixo abrange as oito GPUs modernas.

GPUs modernas (H100, A100, L4 e similares)

O H100 está listado por 36 provedores. A mediana da coorte caiu de mais de USD 7/hora de GPU no início de 2024 para menos de USD 3/hora de GPU em 2026. As listagens Azure ND e Google Cloud A3 Mega elevam o limite superior da distribuição.

O H200 possui um preço de entrada significativamente inferior à média dos demais fornecedores. O preço listado para o H200 no RunPod representa uma fração da mediana do grupo, enquanto o preço do próximo fornecedor disponível é várias vezes maior. Isso torna a mediana e a amplitude de preços sensíveis à disponibilidade confirmada e à configuração comparável do produto com o menor preço.

Os preços do A100 se agrupam em uma faixa estreita no mercado de neocloud, com algumas listagens de inferência sem servidor elevando o limite superior. Compare as taxas de computação sem servidor separadamente das taxas horárias de GPU para IaaS.

L40S, RTX 4090, A10G, T4 e L4 abrangem a camada de inferência. Suas cargas de trabalho se sobrepõem, incluindo inferência abaixo de 100 bilhões de bytes, geração e ajuste fino em lote, tornando a comparação de preços relevante. A pequena variação de preço do A10G reflete o fato de que ele é, efetivamente, um SKU exclusivo da AWS em nossa lista.

Últimas GPUs lançadas (B200, B300, MI300X, RTX 5090)

Preço médio do B200: US$ 5,50, variando de US$ 3,75 (Packet AI) a US$ 14,24 (AWS). Preço médio do B300: US$ 7,50, variando de US$ 6,10 (Nebius) a US$ 17,80 (AWS). Preço médio do MI300X: US$ 2,72, variando de US$ 0,50 (RunPod) a US$ 7,86 (Azure). Preço médio do RTX 5090: US$ 0,67, variando de US$ 0,27 (Salad) a US$ 0,72 (Novita).

A distribuição é semelhante à dos preços anteriores do H100: os preços dos novos aceleradores em hiperescaladores são cerca de 3 vezes maiores do que os preços mais baixos em plataformas de nuvem durante o período de disponibilidade inicial. O MI300X tem preço abaixo do limite inferior do H100 na RunPod e na TensorWave, mas cargas de trabalho baseadas em ROCm podem exigir validação para aplicações que dependem de CUDA.

GPUs legadas (V100, P100, K80, M60, P40)

A V100 ainda aparece em 16 fornecedores (mediana de aproximadamente US$ 0,97), a P100 em 5 (mediana de aproximadamente US$ 1,46), a K80 apenas na AWS (US$ 0,90) e a P40 apenas na Vast.ai (aproximadamente US$ 0,11). SKUs legados ainda são listados por um número limitado de fornecedores. Listagens de hiperescaladores podem persistir para clientes com restrições de compatibilidade, conformidade ou migração, enquanto muitos provedores de neocloud não listam mais essas GPUs. Para novas implantações, essas placas parecem menos relevantes, a menos que a carga de trabalho tenha uma dependência específica de hardware, drivers ou ambientes de software legados.

Tendências de preços por fornecedor

Para a mesma GPU, os preços anunciados pelos provedores de hiperescala são normalmente de 3 a 6 vezes maiores do que os preços mais baixos listados pela Neocloud no conjunto de dados. A profundidade do catálogo varia de acordo com o provedor, a GPU, a região e o tipo de faturamento.

Fornecimento e disponibilidade

A disponibilidade varia muito mais do que os preços anunciados. O gráfico abaixo mostra a porcentagem de anúncios de cada GPU com estoque confirmado hoje, classificados do mais restrito ao mais disponível.

O chip B300 tem 6% de disponibilidade confirmada; os 94% restantes estão listados, mas os fornecedores ainda não o prometeram. Os chips MI300X e L40S atingem 35-36%, uma porcentagem menor do que a da linha principal. Os chips H100, H200, A100 e B200 se agrupam em torno de 41-51%, onde aproximadamente metade do catálogo tem estoque confirmado e a outra metade depende de provisionamento. As placas RTX 4090 e RTX 5090 chegam a 86%, refletindo uma oferta maior de placas para o consumidor final e uma demanda menor por placa para o mercado corporativo.

Se o seu projeto depende de um chip específico de última geração, planeje o prazo de aquisição além do orçamento. A taxa de espera permanece próxima de zero porque a maioria dos pedidos não confirmados são rastreados como "estoque desconhecido", e não como "lista de espera": os fornecedores informam o status do estoque, não a posição na fila.

Como escolher uma GPU e um fornecedor

A escolha da GPU é determinada por três fatores: carga de trabalho, duração e região. A precificação spot versus sob demanda se sobrepõe a esses três.

Por carga de trabalho

Por duração

Em menos de uma semana: Neocloud sob demanda no limite mínimo do spread.

Contratos de várias semanas: Solicite um orçamento (a Neoclouds geralmente oferece descontos de 15 a 30% para contratos de 4 a 12 semanas; os provedores de hiperescala oferecem planos com reserva anual).

Contratos plurianuais: negocie diretamente com os fornecedores, uma vez que as tarifas sob demanda anunciadas não incluem os descontos para contratos de prazo determinado.

Economia na reserva

O desconto para reservas com duração de 1 ano geralmente varia de 9 a 32% sobre a tarifa sob demanda anunciada, com as maiores economias nos modelos AMD MI300X e L40S de nível de inferência, onde os provedores competem mais acirradamente pela capacidade contratada.

Os planos H100 e H200 apresentam descontos modestos, na faixa de um dígito a pouco mais de 10%; seu mercado sob demanda já é competitivo o suficiente para que os provedores não sacrifiquem muita margem para contratos de longo prazo. O plano B200 tem um desconto de -20%, o MI300X de -32% e o L40S de -29%. O gráfico mostra a mediana entre os provedores para ambos os níveis de faturamento; as cotações de provedores individuais podem apresentar descontos maiores para contratos plurianuais não refletidos aqui.

Spot vs. sob demanda

O gráfico de acompanhamento de descontos spot mostra a mediana dos descontos spot em comparação com os descontos sob demanda por categoria. Nos últimos seis meses, os cartões modernos economizaram cerca de 50%, os recém-lançados cerca de 48% e os antigos cerca de 77% (os dados dos cartões antigos são mais voláteis do que parecem; poucos provedores ainda divulgam as taxas spot para esses cartões).

Se sua carga de trabalho tolera interrupções de 5 a 15 minutos, o modelo spot é a opção mais vantajosa em termos de custo. Ative a opção de faturamento no gráfico do explorador na parte superior para ver a tarifa spot lado a lado com a tarifa sob demanda para qualquer provedor da sua lista.

metodologia de índice de GPU

O índice abrange os preços de aluguel de GPUs na nuvem por hora, em planos sob demanda, spot e com reserva anual (quando os provedores os divulgam publicamente). Ele não inclui contratos plurianuais, tarifas negociadas com empresas, combinações de planos spot com descontos ou o custo total de propriedade.

Nossos dados consistem em capturas mensais ao longo de 23 meses (julho de 2024 a maio de 2026), filtradas para 17 modelos de GPU selecionados em 58 provedores. Cada captura mensal apresenta, para cada célula (provedor, GPU, tipo de cobrança, mês), a taxa horária mínima, máxima, média e mediana por GPU, além da quantidade de ofertas correspondentes a esses valores.

Como cada gráfico é calculado

Utilizamos a mediana das medianas em todo o processo: provedores e GPUs (Plataformas de Listagem de Vídeo) contribuem com o mesmo peso para o número principal, de modo que um provedor com 38 listagens não ofusque um recém-chegado com apenas 5 listagens.

Resumo do mercado (três categorias):

O menu suspenso de faturamento repete as etapas 2 e 3 para o nível selecionado (sob demanda, disponível no momento ou com reserva). Uma quarta opção, "Média", exibe a média aritmética das medianas dos três níveis por categoria por mês, restrita aos meses em que todos os três níveis possuem dados.

Explorador de faturamento do provedor:

Para o provedor e o plano de faturamento selecionados, cada linha representa a mediana mensal de uma GPU ao longo do tempo. Não há agregação entre provedores: o ponto de cada mês é simplesmente o preço mediano entre os anúncios daquele provedor para aquela GPU e aquele plano de faturamento. A linha termina onde a oferta desaparece do catálogo.

GPUs modernas lado a lado:

Os mesmos passos 1 e 2 do resumo de mercado, porém com foco apenas em preços sob demanda. Cada linha representa a mediana mensal entre diferentes fornecedores para uma GPU. Sem agregação entre GPUs. Oito séries.

Rastreador de descontos pontuais:

Isso compara cada preço à vista com seu equivalente sob demanda do mesmo provedor, mesma GPU e mesmo mês, de modo que o desconto reflita a diferença real que um comprador desse provedor veria, e não uma diferença de ruído entre mercados.

Visão geral da disponibilidade:

Captura instantânea, sem agregação temporal. Os anúncios reportados como estoque desconhecido, lista de espera ou indisponíveis ainda são contabilizados no denominador, mas não são exibidos separadamente no gráfico, visto que o sinal que permite a ação do comprador é a ação confirmada como disponível.

Economia na reserva:

Perguntas frequentes

Publicamos uma visão mediana mensal atualizada todos os meses. Os números refletem os dados do mês anterior.

A GPU é a mesma; o pacote, não. Os hiperescaladores oferecem preços que incluem conformidade (HIPAA, SOC 2, FedRAMP), SLAs corporativos, integração de identidade e rede, e suporte 24 horas por dia, 7 dias por semana. A Neocloud oferece acesso a servidores físicos ou máquinas virtuais com orquestração gerenciada opcional. Se você não precisa do pacote, o preço da Neocloud é a comparação correta.

Sim, se sua carga de trabalho tiver pontos de verificação e tolerar interrupções de 5 a 15 minutos. O desconto em serviços spot de GPUs modernas está próximo de 50% nos últimos seis meses, e a economia se acumula ao longo de treinamentos de vários dias. Serviços spot não são a escolha certa para inferência sensível à latência, serviços de réplica única sem failover ou execuções de avaliação que precisam de uma comparação precisa em tempo real.

O menu suspenso do gráfico de tendências de preços por fornecedor permite alternar entre os planos sob demanda, spot e com reserva anual, sempre que os fornecedores publicarem essas tarifas. Contratos plurianuais e descontos negociados para empresas não estão incluídos. Solicite um orçamento diretamente ao fornecedor para obter essas informações.

Leitura complementar

Cite esta pesquisa

Escolha o formato adequado ao local onde você vai publicar. Colar a versão com link no seu CMS preserva o backlink.

Ekrem Sarı (2026) - "Índice de preços de aluguel de GPUs na nuvem". Publicado on-line em AIMultiple.com. Acessado em Maio 20, 2026, em: https://aimultiple.com/gpu-index [Recurso on-line]

Sarı, E. (2026, Maio 20). Índice de preços de aluguel de GPUs na nuvem. AIMultiple. https://aimultiple.com/gpu-index

@misc{sar2026,
  author = {Sarı, Ekrem},
  title  = {{Índice de preços de aluguel de GPUs na nuvem}},
  year   = {2026},
  month  = may,
  howpublished    = {\url{https://aimultiple.com/gpu-index}},
  note   = {AIMultiple. Retrieved Maio 20, 2026}
}
Ekrem Sarı
Ekrem Sarı
Pesquisador de IA
Ekrem é pesquisador de IA na AIMultiple, com foco em automação inteligente, GPUs, agentes de IA e frameworks RAG.
Ver perfil completo

Seja o primeiro a comentar

Seu endereço de e-mail não será publicado. Todos os campos são obrigatórios.

0/450