Avaliação em Mundo Aberto

GPU Mercado: Vast.ai vs Shadeform vs Prime Intellect

atualizado em 3 jun. 2026

Encontrar capacidade de GPU disponível a preços razoáveis tornou-se um desafio crítico para equipas de IA. Embora grandes fornecedores de cloud como AWS e Google Cloud ofereçam instâncias de GPU, estas estão frequentemente esgotadas ou são caras. Os agregadores de mercado de GPU surgiram como alternativa, ligando os utilizadores a dezenas de fornecedores através de uma única interface.

Veja abaixo a repartição da quota de mercado de pesquisa dos últimos 12 meses dos principais mercados de GPU:

Loading Chart

Vast.ai

Vast.ai é um dos mercados de GPU originais, fundado em 2018 e que opera como uma bolsa peer-to-peer que liga arrendatários a indivíduos, data centers Tier-4 e outros participantes. Muitas vezes descrito como o “Airbnb das GPUs”, lista a oferta de um vasto conjunto de anfitriões e permite que a concorrência de preços defina as taxas, conferindo-lhe um dos catálogos de hardware mais profundos do mercado.

Principais características:

Motor de pesquisa do marketplace que filtra ofertas ao vivo por tipo de GPU, VRAM, CPU, largura de banda e preço
Tanto inventário verificado de data centers “Secure Cloud” como capacidade comunitária/de anfitrião de baixo custo numa única interface
Faturação ao segundo com opções interrompíveis (tipo spot) e sob demanda
Modelos Docker pré-construídos e personalizados com um clique para implementação rápida
A mais ampla gama de modelos de GPU na categoria, desde placas RTX de consumo até H100/H200/B200 de data center

Melhor para: Programadores sensíveis a custos, investigadores e equipas independentes que querem a seleção de hardware mais vasta e os preços mais baixos, e podem tolerar qualidade variável de anfitrião.

TensorDock

TensorDock é um mercado de GPU que intermedeia capacidade entre fornecedores com hardware ocioso e utilizadores que precisam dele, semelhante ao Vast.ai, mas com requisitos de anfitrião mais rigorosos e foco no controlo total da máquina virtual. Anuncia acesso a até 30.000 GPUs através de parceiros em mais de 100 localizações de data centers.

Principais características:

Modelo de marketplace/corretor com preços competitivos de fornecedores, frequentemente mais baixos que clouds de taxa fixa
Controlo total de VM com isolamento KVM, incluindo acesso root e controladores/SO personalizados
RAM, vCPU e armazenamento personalizáveis
Mistura de GPUs empresariais (A100/H100) e de consumo em data centers Tier 3/4
Faturação ao segundo, API REST, e CLI, e suporte 24/7 incluídos no aluguer

Melhor para: Equipas com restrições orçamentais que querem preços de marketplace mas precisam de mais configurabilidade, isolamento e suporte do que um marketplace puramente comunitário normalmente oferece.

Shadeform

Shadeform é um mercado de cloud de GPU fundado em 2023 que liga programadores a recursos de computação em mais de 20 fornecedores de cloud, incluindo Lambda, Nebius e Crusoe. A plataforma oferece uma API e consola unificadas para provisionar GPUs em qualquer fornecedor, eliminando a necessidade de gerir várias contas e APIs.

Principais características:

Acesso a uma única API para mais de 20 fornecedores de cloud
Sistema automatizado de corretagem de computação para obter cotações de mais de 11 fornecedores em 24 horas
Preços em tempo real e dados de disponibilidade em todos os fornecedores
Faturação centralizada em várias clouds
Sem taxas adicionais; os utilizadores pagam o mesmo preço que pagariam diretamente aos fornecedores
Lance GPUs em contas de cloud prontas a usar geridas pela Shadeform

Melhor para: Equipas que necessitam de acesso imediato a GPU em várias clouds sem a sobrecarga de gerir contas e relações com fornecedores separadas.

Demonstração Shadeform IA

SF Compute

A San Francisco Compute Company (SF Compute) gere um mercado spot para clusters de GPU em grande escala. Não possui nenhuma das GPUs a que dá acesso e, em vez disso, gere mais de $100 milhões em hardware de terceiros. A sua característica distintiva é o preço: não há um preço único por GPU-hora, e cada bloco de computação tem um preço independente com base no tamanho e duração.

Principais características:

Preços de mercado spot para clusters H100 e H200, com capacidade desde uma GPU até centenas, por apenas uma hora
Sem compromissos de longo prazo
Sem taxas de saída de dados ao mover cargas de trabalho para fora da plataforma
Provisionamento via CLI e painel de controlo, com clusters de VM em rede InfiniBand

Melhor para: Equipas que executam grandes tarefas elásticas de treino ou inferência que querem preços de cluster à taxa de mercado e a flexibilidade de aumentar ou reduzir sem se comprometerem com um contrato fixo.

Prime Intellect

A Prime Intellect opera uma bolsa de computação que agrega recursos de GPU dos principais fornecedores, com 12 clouds integradas e muitas mais em preparação. A plataforma oferece H100s a preços competitivos e permite aos utilizadores aceder a recursos de computação sem contratos de longo prazo.

Principais características:

Pool unificado de recursos de mais de 12 fornecedores de cloud integrados.
Acesso instantâneo a até 8 GPUs sob demanda, com planos para clusters de 16-128+ GPUs.
Integra recursos dos principais fornecedores de GPU centralizados e descentralizados, incluindo Akash Network, io.net, Vast.ai e Lambda Cloud.
Foco em frameworks de treino distribuído para treino multi-nó em clusters.
Avaliações contribuídas por utilizadores que classificam a velocidade e fiabilidade dos fornecedores de computação.

Melhor para: Investigadores de IA e equipas que executam cargas de trabalho de treino distribuído que precisam de dados transparentes sobre o desempenho dos fornecedores.

Painel do marketplace GPU Prime Intellect

GPU modelos de preços do marketplace explicados

Compreender os modelos de preços é fundamental para otimizar os seus custos de GPU. A maioria dos marketplaces oferece três estruturas de preços principais:

Preços sob demanda

Pagamento por utilização sem compromissos de longo prazo. Os preços são normalmente faturados por minuto ou por hora.

Custos típicos:

H100 SXM: $2.25-$8.00/hora dependendo do fornecedor
A100 80GB: $1.29-$4.00/hora
RTX 4090: $0.34-$0.50/hora

Melhor para: Projetos de curto prazo, testes, desenvolvimento e cargas de trabalho imprevisíveis.

Instâncias spot/interrompíveis

Aceda a capacidade de GPU excedente com descontos de 60-90%, com a contrapartida de que as instâncias podem ser interrompidas com um aviso de 30 segundos a 2 minutos quando os fornecedores precisam de recuperar capacidade.

Poupanças típicas:

Instâncias H100: Até 85% de desconto sobre o preço sob demanda
Instâncias A100: Descontos de 60-75%
Série RTX: Poupanças de 50-70%

Melhor para: Processamento em lote, treino de modelos com checkpointing, inferência não crítica e ambientes de desenvolvimento.

Capacidade reservada

Comprometa-se com tipos específicos de GPU por 1 a 3 anos em troca de descontos de 40-72%. Alguns fornecedores exigem pagamento adiantado.

Descontos típicos:

Compromisso de 1 ano: Poupança de 30-50%
Compromisso de 3 anos: Poupança de 50-72%

Melhor para: Cargas de trabalho de produção com requisitos de GPU previsíveis e consistentes.

O que é um marketplace de GPU?

Um marketplace de GPU é uma plataforma onde os utilizadores podem aceder a unidades de processamento gráfico (GPUs) para tarefas computacionais como treino de IA, inferência, renderização e computação científica. No entanto, nem todos os marketplaces de GPU funcionam da mesma forma.

Os marketplaces de GPU dividem-se em duas categorias: fornecedores de cloud diretos que possuem a sua infraestrutura, e plataformas agregadoras que o ligam a vários fornecedores. Este guia foca-se nos agregadores, plataformas que funcionam como sites de reserva de viagens para capacidade de GPU, dando-lhe acesso a dezenas de clouds através de uma única interface.

Diferenças principais: Fornecedores vs. gateways

Propriedade da infraestrutura

Fornecedores diretos: Possuem e operam os seus data centers, hardware e infraestrutura de rede
Gateways: Não possuem infraestrutura; agregam capacidade de vários fornecedores

Estrutura de preços

Fornecedores diretos: Definem os seus próprios preços com base nos custos de hardware, despesas gerais e posicionamento no mercado
Gateways: Normalmente não cobram taxas adicionais, com os utilizadores a pagar o mesmo que pagariam diretamente aos fornecedores

Gestão de contas

Fornecedores diretos: Exigem configuração de conta individual, gestão de quotas e faturação separada
Gateways: Fornecem gestão de conta centralizada e faturação unificada em todos os fornecedores

Integração e API

Fornecedores diretos: Cada um tem APIs, SDKs e interfaces de gestão únicas
Gateways: Oferecem uma única API unificada que funciona em todos os fornecedores integrados

Flexibilidade e aprisionamento tecnológico

Fornecedores diretos: Podem levar ao aprisionamento tecnológico à medida que a infraestrutura e os fluxos de trabalho se tornam específicos do fornecedor
Gateways: Reduzem o aprisionamento ao permitir uma troca fácil entre fornecedores através da mesma interface

Suporte e SLAs

Fornecedores Diretos: Relação direta com as equipas de suporte e SLAs específicos do fornecedor
Gateways: Podem ter uma camada de suporte adicional, mas, em última análise, dependem dos SLAs do fornecedor subjacente

Deixe nossa equipe automatizar um dos seus processos de negócio com agentes de IA, gratuitamente.

Automatizar um processo

Benefícios de utilizar marketplaces de GPU

1. Gestão multi-cloud simplificada

Os agregadores eliminam a necessidade de criar contas, obter quotas e navegar pelas complexidades de vários fornecedores. Em vez de gerir credenciais em mais de 10 plataformas, gere-as através de uma única consola. Isto é especialmente valioso durante a escassez de GPU, quando a capacidade pode aparecer e desaparecer rapidamente entre fornecedores.

2. Comparação e otimização de preços em tempo real

Compare tipos de GPU, tamanhos de memória e níveis de desempenho em tempo real entre vários fornecedores concorrentes. Vê que uma H100 custa $3,20/hora no Fornecedor A, mas $2,60/hora no Fornecedor B? Implemente no Fornecedor B instantaneamente. Os modelos de preços dinâmicos permitem que fornecedores com recursos ociosos ajustem as taxas, promovendo marketplaces competitivos que evitam a monopolização de preços.

3. Disponibilidade e acesso à capacidade

Ao agregar recursos sob o mesmo teto, estas plataformas aumentam as suas hipóteses de encontrar capacidade disponível. Durante períodos de pico de procura, se a AWS ficar sem A100s em us-east-1, o seu gateway pode encontrar capacidade na CoreWeave, Lambda ou Vast.ai sem que tenha de alterar uma única linha de código.

4. Complexidade de infraestrutura reduzida

Em vez de aprender as interfaces e APIs de várias plataformas de cloud, os programadores usam uma experiência única e consistente, independentemente do fornecedor subjacente. A sua equipa de DevOps não precisa de se tornar especialista em 15 plataformas de cloud diferentes; só precisa de dominar uma API de gateway.

5. Eficiência de custos através da concorrência de mercado

Os gateways criam marketplaces transparentes onde os fornecedores competem em preço e disponibilidade. Esta concorrência reduz naturalmente os preços em comparação com cenários monopolistas de fornecedor único. Algumas equipas relatam poupanças de custos de 40-60% ao mudar dos principais fornecedores de cloud para gateways de GPU.

6. Failover instantâneo e redundância

Se um fornecedor sofrer tempo de inatividade ou atingir limites de capacidade, os gateways podem fazer failover automaticamente para fornecedores alternativos. Esta diversidade geográfica e de fornecedores cria uma infraestrutura de IA mais resiliente.

Disponibilidade e escassez de GPU

O mercado de GPU enfrenta restrições de oferta significativas, especialmente para chips de alta procura como o NVIDIA H100 e H200. A escassez de GPU torna difícil e caro obter GPUs nos principais fornecedores de cloud, razão pela qual os agregadores se tornaram infraestrutura essencial.

Fatores-chave que afetam a disponibilidade:

Procura impulsionada pelo boom da IA: A explosão da IA generativa e do treino de grandes modelos de linguagem criou uma elevada procura de GPU
Capacidade de fabrico limitada: A produção da NVIDIA não consegue acompanhar a procura global
Atraso na construção de data centers: Novas instalações demoram 18-24 meses a entrar em funcionamento
Concentração geográfica: A maior parte da capacidade de GPU está concentrada nos EUA e em data centers europeus

Os gateways de marketplace de GPU ajudam a navegar a escassez, dando-lhe visibilidade sobre a capacidade em dezenas de fornecedores simultaneamente. Quando as grandes clouds estão esgotadas, os fornecedores regionais mais pequenos têm frequentemente disponibilidade.

Não perca os nossos benchmarks e insights baseados em dados. O botão abre o Google; selecionar a AIMultiple confirma que deseja ver a AIMultiple com mais frequência nos resultados de pesquisa do Google.

Adicionar como fonte preferencial

Desafios do marketplace de GPU

Dependência dos fornecedores subjacentes

A qualidade e fiabilidade do serviço dependem, em última análise, da infraestrutura do fornecedor subjacente. Um gateway não pode resolver problemas fundamentais com o hardware ou rede de um fornecedor.

Limitações de abstração

Os gateways podem não suportar todas as funcionalidades específicas do fornecedor. Se precisar de serviços especializados da AWS como o SageMaker ou TPUs do GCP, precisará de acesso direto ao fornecedor.

Fragmentação do mercado

A padronização limitada significa que ainda não existem mercados spot estabelecidos ou contratos de futuros. A transparência de preços varia entre gateways e nem todos os fornecedores estão disponíveis em todas as plataformas.

Variabilidade de desempenho

Fornecedores diferentes têm diferentes topologias de rede, configurações de armazenamento e opções de interconexão. Uma H100 no Fornecedor A pode ter um desempenho diferente de uma H100 no Fornecedor B para treino multi-nó devido a diferenças de rede.

Infraestrutura alternativa de GPU

Redes descentralizadas de GPU

As Redes de Infraestrutura Física Descentralizada (DePIN) estão a amadurecer como alternativas prontas para produção, mudando fundamentalmente a forma como a capacidade de GPU é obtida.

io.net agregou mais de um milhão de GPUs de data centers independentes e mineradores de criptomoedas. A plataforma afirma ter poupanças de custos até 70% em comparação com fornecedores de cloud centralizados, com implementação de clusters de GPU em menos de 2 minutos.¹
Akash Network funciona como um marketplace de leilão reverso onde os utilizadores especificam os preços desejados e os fornecedores competem para satisfazer os pedidos. A rede mantém uma utilização de 70% em 736 GPUs e gera mais de $4,3 milhões em receita anual.

Considerações de adoção: Embora as redes descentralizadas ofereçam economias atraentes, permanecem desafios em torno da latência, segurança e compatibilidade de software. As plataformas estão a implementar Provas de Conhecimento Zero e sistemas de verificação automatizados para resolver estas preocupações. Para empresas com cargas de trabalho flexíveis e prioridades de otimização de custos, as redes descentralizadas oferecem cada vez mais alternativas viáveis.

Disponibilidade de hardware específico para IA

O cenário competitivo para inferência de IA está a mudar à medida que hardware especializado desafia o domínio da NVIDIA.

Groq (Adquirida pela NVIDIA): A NVIDIA adquiriu a tecnologia Language Processing Unit da Groq por $20 mil milhões em dezembro de 2025. As LPUs da Groq alcançaram velocidades de inferência sem precedentes ao usar SRAM no chip em vez de memória fora do chip. A próxima plataforma Vera Rubin da NVIDIA, esperada para o final de 2026, irá incorporar esta tecnologia. .²
Motor Wafer-Scale da Cerebras: A Cerebras garantiu um acordo de $10 mil milhões por três anos com a OpenAI em janeiro de 2026 para fornecer até 750 megawatts de poder de computação. O seu chip WSE-3 contém 4 biliões de transístores e 900.000 núcleos de IA, alegando custos operacionais 32% mais baixos do que o NVIDIA Blackwell para cargas de trabalho de inferência. ³

Considerações de segurança e conformidade

Ao utilizar gateways de marketplace de GPU, a segurança depende tanto do operador do gateway como dos fornecedores subjacentes. A maioria dos gateways implementa:

Encriptação de dados: Encriptação de ponta a ponta para dados em trânsito e em repouso
Controlos de acesso: Controlo de acesso baseado em funções (RBAC) e gestão de chaves de API
Certificações de conformidade: Conformidade com SOC 2, ISO 27001 e GDPR, quando disponível
Isolamento de rede: Opções de rede privada e suporte VPC

Para empresas com requisitos rigorosos de soberania de dados, verifique se o seu gateway suporta a seleção de regiões geográficas e fornecedores específicos que atendam às suas necessidades de conformidade.

Escolher a abordagem certa para a sua carga de trabalho

Escolha fornecedores de cloud de GPU diretos quando:

Precisa de integração profunda com serviços específicos do fornecedor (por exemplo, AWS SageMaker, GCP Vertex IA)
O suporte empresarial e SLAs rigorosos são críticos para cargas de trabalho de produção
Está a construir com ferramentas e serviços nativos do fornecedor que não são abstraídos pelos gateways
A conformidade exige certificações de data center ou trilhas de auditoria específicas
Prefere relações diretas com fornecedores para aquisição e suporte
A sua carga de trabalho requer configurações de hardware especializadas apenas disponíveis em fornecedores específicos

Escolha gateways de marketplace de GPU quando:

Precisa de flexibilidade entre vários fornecedores para evitar restrições de capacidade
A otimização de preços é uma prioridade e quer aproveitar a concorrência do mercado
Quer evitar o aprisionamento tecnológico e manter a portabilidade da infraestrutura
A gestão simplificada entre clouds é importante para a sua equipa de DevOps
Precisa de acesso rápido à capacidade disponível no mercado global
A sua equipa é pequena e não pode dedicar recursos à gestão de múltiplas relações com clouds
Está a executar cargas de trabalho experimentais ou de investigação onde a flexibilidade importa mais do que funcionalidades específicas do fornecedor

Perguntas frequentes

Os gateways de GPU proporcionam frequentemente aos programadores acesso a preços em tempo real e maior disponibilidade, agregando a oferta em dezenas de fornecedores, incluindo AWS, clouds de GPU especializadas e redes descentralizadas. Em vez de estarem limitados ao inventário de um único fornecedor, os utilizadores podem comparar preços, desempenho de inferência, memória e tipos de instância lado a lado. Isto é especialmente útil para empresas que executam grandes cargas de trabalho de IA que sofrem picos de procura rápidos. Os gateways também ajudam as organizações a gerir implementações multi-cloud a partir de uma única consola, permitindo-lhes iniciar recursos em segundos e pagar apenas pelos recursos de computação que utilizam.

Sim, a maioria dos gateways é criada tendo em mente a segurança e a conformidade, mas a fiabilidade depende, em última análise, dos fornecedores subjacentes. Os gateways abstraem a complexidade, ao mesmo tempo que dão acesso a infraestrutura de IA robusta, instâncias de GPU de alto desempenho e configurações personalizadas para treino, inferência e ajuste fino. Para empresas que precisam de escalar para centenas ou mesmo milhares de GPUs, os gateways reduzem a sobrecarga operacional, permitindo que as equipas continuem a utilizar SLAs nativos do fornecedor. Esta abordagem híbrida ajuda a equilibrar custo, potência, requisitos de carga de trabalho e fatores de crescimento futuro.

As instâncias interrompíveis podem ser altamente económicas para tarefas de computação de IA flexíveis, como treino distribuído, inferência, renderização ou processamento de cargas de trabalho em lote. Através de um gateway de GPU, os programadores podem criar e iniciar clusters em menos de um minuto e reiniciar tarefas interrompidas em minutos usando checkpointing. Embora os mercados spot de cloud direta variem por região, os gateways analisam todo o mercado de GPU para descobrir os melhores preços, disponibilidade e desempenho entre fornecedores. Isto ajuda os programadores a construir mais rapidamente, a pagar apenas pelo que utilizam e a escolher a instância ou configuração de GPU única que melhor se adapta aos seus casos de uso, sem ficarem presos a uma única plataforma.

Leituras adicionais

Se precisar de ajuda para encontrar um fornecedor ou tiver alguma dúvida, sinta-se gratuito para nos contactar:

Encontre os Fornecedores Certos

Obtenha o nosso apoio gratuito na seleção do fornecedor certo para o seu negócio

Cite esta pesquisa

Escolha o formato adequado ao local onde você vai publicar. Colar a versão com link no seu CMS preserva o backlink.

Cem Dilmegani (2026) - "GPU Mercado: Vast.ai vs Shadeform vs Prime Intellect". Publicado on-line em AIMultiple.com. Acessado em 3 Junho 2026, em: https://aimultiple.com/gpu-marketplace [Recurso on-line]

Dilmegani, C. (2026, 3 Junho). GPU Mercado: Vast.ai vs Shadeform vs Prime Intellect. AIMultiple. https://aimultiple.com/gpu-marketplace

@misc{dilmegani2026,
  author = {Dilmegani, Cem},
  title  = {{GPU Mercado: Vast.ai vs Shadeform vs Prime Intellect}},
  year   = {2026},
  month  = jun,
  howpublished    = {\url{https://aimultiple.com/gpu-marketplace}},
  note   = {AIMultiple. Acessado em 3 Junho 2026}
}

Links de referência

How Decentralized GPU Networks Are Powering the Next Generation of AI

Nvidia buying AI chip startup Groq for about $20 billion, biggest deal

CNBC

reuters.com

Cem Dilmegani

Analista Principal

Cem tem sido o analista principal do AIMultiple desde 2017. O AIMultiple informa centenas de milhares de empresas (de acordo com o similarWeb), incluindo 60% das empresas da Fortune 500 todos os meses. O trabalho de Cem foi citado por publicações globais de destaque, incluindo Business Insider, Forbes, Washington Post, empresas globais como Deloitte, HPE e ONGs como o Fórum Econômico Mundial e organizações supranacionais como a Comissão Europeia. Ao longo de sua carreira, Cem atuou como consultor de tecnologia, comprador de tecnologia e empreendedor de tecnologia. Ele aconselhou empresas em suas decisões de tecnologia na McKinsey & Company e na Altman Solon por mais de uma década. Ele também publicou um relatório da McKinsey sobre digitalização. Ele liderou a estratégia de tecnologia e aquisições de uma empresa de telecomunicações, reportando-se ao CEO. Ele também liderou o crescimento comercial da empresa de tecnologia profunda Hypatos, que alcançou uma receita recorrente anual de 7 dígitos e uma avaliação de 9 dígitos partindo do zero em 2 anos. O trabalho de Cem na Hypatos foi coberto por publicações de tecnologia de destaque como TechCrunch e Business Insider. Cem fala regularmente em conferências internacionais de tecnologia. Ele se formou na Universidade Bogazici como engenheiro de computação e possui um MBA pela Columbia Business School.

Ver perfil completo