Servizi
Contattaci
Nessun risultato trovato.

Indice dei prezzi di noleggio delle GPU cloud

Ekrem Sarı
Ekrem Sarı
aggiornato il Mag 20, 2026

Le tariffe on-demand per le GPU cloud di ultima generazione (B200, B300, MI300X, RTX 5090) sono praticamente raddoppiate nell'ultimo anno, mentre le schede mainstream (H100, H200, A100) hanno mantenuto prezzi pressoché invariati. Compiliamo mensilmente l'indice GPU da 58 provider e 17 modelli di GPU, coprendo le tariffe on-demand, spot e con abbonamento annuale.

Andamento dei prezzi per generazione di GPU

Loading Chart

Il grafico mostra il prezzo mediano mensile pubblicato in base a tre fasce di data di rilascio. Abbiamo suddiviso 17 modelli di GPU in tre categorie in base alla data di lancio:

La maggior parte dell'aumento è derivata dall'espansione delle inserzioni B200 e B300, che ora includono non più solo i fornitori di neocloud, ma anche gli hyperscaler. Queste inserzioni degli hyperscaler presentano prezzi in genere da 2 a 3 volte superiori, innalzando la mediana della categoria man mano che entrano nel set di dati.

Le GPU moderne hanno registrato un aumento di circa il 25%, ma la variazione è in gran parte statistica. Google Cloud ha aggiunto la sua variante A3z Mega H100 all'elenco standard-A3, portando la mediana del gruppo H100 da circa 2 a circa 3 dollari. Al di sotto, neocloud H100 ha mostrato una tendenza al ribasso. Segnaliamo questo nella sezione successiva.

Le GPU legacy sono scese da 1,78 a 0,97 dollari nel periodo considerato, a causa della perdita dei principali fornitori di fascia alta per la serie V100, dovuta al ritiro di questo modello da parte delle aziende. Nel nostro set di dati rimangono solo uno o due fornitori per ogni scheda legacy: AWS elenca la K80 a 0,90 dollari, la P40 è disponibile su Vast.ai a 0,11 dollari, e gli altri sono casi limite simili con un solo fornitore.

Il mercato dei contratti ha mostrato un andamento diverso: gli impegni H100 a 1 anno hanno registrato una tendenza al rialzo nello stesso periodo, mentre la mediana degli impegni H100 on-demand è rimasta pressoché invariata. Ciò evidenzia una crescente differenza tra i prezzi mensili e quelli con impegno annuale.

Per i dettagli sul calcolo dell'indice GPU, consultare la nostra metodologia .

Andamento dei prezzi per modello di GPU

La tabella seguente illustra le otto GPU moderne.

GPU moderne (H100, A100, L4 e simili)

H100 è elencato da 36 fornitori. La mediana della coorte è diminuita da oltre 7 USD/ora GPU all'inizio del 2024 a meno di 3 USD/ora GPU nel 2026. Azure ND e Google Le inserzioni Cloud A3 Mega innalzano il limite superiore della distribuzione.

L'H200 ha un prezzo di listino nella fascia bassa che è significativamente inferiore rispetto al resto della distribuzione dei fornitori. Il prezzo dell'H200 indicato da RunPod è una frazione della mediana del gruppo, mentre il prezzo del fornitore successivo disponibile è diverse volte superiore. Ciò rende la mediana e l'intervallo sensibili alla disponibilità confermata e alla configurazione comparabile dell'offerta con il prezzo più basso.

I prezzi dell'A100 si concentrano in un intervallo ristretto tipico del neocloud, con alcune offerte di inferenza serverless che si posizionano nella fascia più alta. Confronta le tariffe serverless separatamente dalle tariffe orarie GPU dell'IaaS.

L40S, RTX 4090, A10G, T4 e L4 coprono il livello di inferenza. I loro carichi di lavoro si sovrappongono, includendo inferenza inferiore a 100 byte, generazione e fine-tuning batch, il che rende rilevante il confronto dei prezzi. Lo spread ridotto di A10G riflette il fatto che si tratta di fatto di un SKU disponibile solo su AWS nel nostro elenco.

GPU rilasciate di recente (B200, B300, MI300X, RTX 5090)

B200 mediana $5,50, intervallo $3,75 (Packet AI) a $14,24 (AWS). B300 mediana $7,50, intervallo $6,10 (Nebius) a $17,80 (AWS). MI300X mediana $2,72, intervallo $0,50 (RunPod) a $7,86 (Azure). RTX 5090 mediana $0,67, intervallo $0,27 (Salad) a $0,72 (Novita).

La distribuzione dei prezzi è simile a quella precedente dell'H100: i prezzi dei nuovi acceleratori offerti dagli hyperscaler sono circa 3 volte superiori rispetto a quelli dei neocloud a prezzo inferiore durante il periodo di disponibilità iniziale. Il prezzo di MI300X è inferiore a quello della fascia bassa dell'H100 presso RunPod e TensorWave, ma i carichi di lavoro basati su ROCm potrebbero richiedere una convalida per le applicazioni dipendenti da CUDA.

GPU di vecchia generazione (V100, P100, K80, M60, P40)

La V100 è ancora presente presso 16 fornitori (prezzo mediano ~$0,97), la P100 presso 5 (prezzo mediano ~$1,46), la K80 solo su AWS ($0,90) e la P40 solo su Vast.ai (~$0,11). Le SKU legacy rimangono elencate da un numero limitato di fornitori. Gli elenchi degli hyperscaler potrebbero persistere per i clienti con vincoli di compatibilità, conformità o migrazione, mentre molti fornitori di neocloud non elencano più queste GPU. Per le nuove implementazioni, queste schede sembrano meno rilevanti a meno che il carico di lavoro non abbia una dipendenza specifica da hardware, driver o ambienti software legacy.

Andamento dei prezzi per fornitore

A parità di GPU, i prezzi pubblicati dagli hyperscaler sono in genere da 3 a 6 volte superiori rispetto alle offerte più economiche di Neocloud presenti nel set di dati. La profondità del catalogo varia in base al provider, alla GPU, alla regione e al tipo di fatturazione.

Offerta e disponibilità

La disponibilità varia in modo più significativo rispetto ai prezzi di listino. Il grafico seguente mostra la percentuale di schede video per le quali è stata confermata la disponibilità a magazzino, ordinate dalla più scarsa alla più disponibile.

Il B300 si attesta al 6% di disponibilità confermata; il restante 94% è elencato, ma i fornitori non hanno ancora garantito la disponibilità del chip. MI300X e L40S si attestano al 35-36%, una percentuale inferiore rispetto alla fascia mainstream. H100, H200, A100 e B200 si raggruppano intorno al 41-51%, dove circa metà del catalogo è costituito da stock confermati e l'altra metà è soggetta a disponibilità. RTX 4090 e RTX 5090 raggiungono l'86%, a testimonianza di una maggiore offerta di schede per il mercato consumer e di una minore domanda per singola scheda da parte delle aziende.

Se il tuo progetto dipende da uno specifico chip di ultima generazione, considera i tempi di approvvigionamento oltre al budget. La percentuale di articoli in lista d'attesa rimane prossima allo zero perché la maggior parte degli articoli non confermati viene tracciata come "scorte sconosciute", non come "lista d'attesa": i fornitori segnalano lo stato delle scorte, non la posizione in coda.

Scelta della GPU e del fornitore

La scelta della GPU è influenzata da tre fattori: carico di lavoro, durata e regione. A questi si aggiungono le differenze di prezzo tra utilizzo a richiesta e utilizzo immediato.

In base al carico di lavoro

Per durata

Meno di una settimana: Neocloud on-demand al livello più basso dello spread.

Contratti plurisettimanali: Richiedi un preventivo (i servizi neocloud in genere offrono sconti dal 15% al 30% per contratti da 4 a 12 settimane; i fornitori di servizi hyperscale offrono piani tariffari riservati per un anno).

Contratti pluriennali: negoziare direttamente con i fornitori, poiché le tariffe pubblicate per i contratti a richiesta non includono gli sconti previsti per i contratti a lungo termine.

Risparmi sulle prenotazioni

Lo sconto per prenotazioni annuali si aggira in genere tra il 9% e il 32% rispetto alla tariffa on-demand pubblicata, con i risparmi maggiori per AMD MI300X e il livello di inferenza L40S, dove i fornitori competono maggiormente per la capacità garantita.

H100 e H200 registrano sconti modesti, a una cifra o a due cifre basse; il loro mercato on-demand è già sufficientemente competitivo da non costringere i fornitori a sacrificare grandi margini per gli impegni. Le prenotazioni B200 sono scontate del 20%, MI300X del 32% e L40S del 29%. Il grafico mostra la mediana tra i vari fornitori per entrambi i livelli di fatturazione; i preventivi dei singoli fornitori potrebbero essere più elevati per i contratti pluriennali non riportati qui.

Spot vs su richiesta

Il grafico di monitoraggio degli sconti spot mostra lo sconto mediano spot rispetto allo sconto on-demand per categoria. Negli ultimi sei mesi, le carte moderne hanno consentito un risparmio di circa il 50%, le ultime rilasciate di circa il 48% e le carte legacy di circa il 77% (le carte legacy sono più variabili di quanto sembri; pochi fornitori pubblicano ancora i tassi spot per queste carte).

Se il tuo carico di lavoro tollera interruzioni di 5-15 minuti, la tariffa spot è la leva di costo più importante disponibile. Attiva il menu a tendina di fatturazione nel grafico esplorativo in alto per visualizzare la tariffa spot affiancata alla tariffa on-demand per qualsiasi fornitore nella tua lista.

metodologia di indicizzazione GPU

L'indice copre i prezzi orari di noleggio delle GPU cloud pubblicati per le tariffe on-demand, spot e per i contratti annuali (laddove i fornitori li rendano pubblici). Non include i contratti pluriennali, le tariffe negoziate dalle aziende, le combinazioni di tariffe spot e piani di risparmio, né il costo totale di proprietà.

I nostri dati sono istantanee mensili relative a 23 mesi (da luglio 2024 a maggio 2026), filtrate per 17 modelli di GPU selezionati da 58 provider. Ogni istantanea riporta, per ogni cella (provider, GPU, tipo di fatturazione, mese), il valore minimo, massimo, medio e mediano della tariffa oraria per GPU, oltre al numero di offerte corrispondenti a tali valori.

Come viene calcolato ciascun grafico

Utilizziamo la mediana delle mediane in tutto il processo: i fornitori e le GPU contribuiscono con lo stesso peso al numero principale, in modo che un fornitore con 38 posizioni non oscuri un nuovo arrivato con 5 posizioni.

Sintesi del mercato (tre categorie):

Il menu a tendina di fatturazione ripete i passaggi 2-3 in base al livello selezionato (su richiesta, spot o prenotazione). Una quarta opzione, "Media", visualizza la media aritmetica delle mediane dei tre livelli per categoria e per mese, limitatamente ai mesi in cui sono disponibili dati per tutti e tre i livelli.

Esploratore di fatturazione del fornitore:

Per il provider e il piano tariffario selezionati, ogni linea traccia il prezzo mediano mensile di una GPU nel tempo. Non viene applicata alcuna aggregazione tra i provider: il punto di ogni mese rappresenta semplicemente il prezzo mediano tra le offerte di quel provider per quella GPU e quel piano tariffario. La linea termina nel punto in cui l'offerta scompare dal catalogo.

GPU moderne a confronto:

Stessi passaggi 1-2 del riepilogo di mercato, limitati ai soli prezzi on-demand. Ogni riga rappresenta la mediana mensile tra i diversi fornitori per una singola GPU. Nessuna aggregazione tra GPU. Otto serie.

Strumento per il monitoraggio degli sconti a breve termine:

Questo metodo confronta ogni prezzo spot con il suo equivalente on-demand dello stesso fornitore, con la stessa GPU e nello stesso mese, in modo che lo sconto rifletta lo spread effettivo che un acquirente di quel fornitore vedrebbe, e non una semplice differenza di prezzo tra diversi mercati.

Riepilogo disponibilità:

Dati statici, senza aggregazione temporale. Gli annunci segnalati come "scorte sconosciute", "in lista d'attesa" o "non disponibili" sono comunque conteggiati al denominatore, ma non vengono rappresentati separatamente nel grafico, poiché il segnale utilizzabile dall'acquirente è la quota di disponibilità confermata.

Risparmio sulla prenotazione:

FAQ

Pubblichiamo mensilmente una stima aggiornata della mediana. I dati si riferiscono al mese precedente.

La GPU è la stessa, ma il pacchetto non lo è. Gli hyperscaler offrono prezzi conformi alle normative (HIPAA, SOC 2, FedRAMP), SLA aziendali, integrazione di identità e rete e supporto 24 ore su 24, 7 giorni su 7. Neocloud offre accesso bare metal o VM con orchestrazione gestita opzionale. Se non hai bisogno del pacchetto completo, il prezzo di Neocloud è il confronto più appropriato.

Sì, se il tuo carico di lavoro prevede checkpoint e tollera interruzioni di 5-15 minuti. Lo sconto spot sulle GPU moderne si aggira intorno al 50% negli ultimi sei mesi e i risparmi si accumulano su sessioni di training di più giorni. Lo spot non è la scelta giusta per l'inferenza sensibile alla latenza, i servizi a singola replica senza failover o le sessioni di valutazione che richiedono un confronto preciso del tempo di esecuzione.

Il grafico delle tendenze dei prezzi per fornitore mostra, tramite il menu a tendina, le opzioni di fatturazione per i piani on-demand, spot e con contratto annuale, laddove i fornitori pubblichino tali tariffe. I contratti pluriennali e gli sconti negoziati dalle aziende non sono inclusi. Per questi ultimi, si prega di richiedere un preventivo direttamente al fornitore.

Per approfondire

Cita questa ricerca

Scegli il formato adatto a dove pubblicherai. Incollare la versione con link nel tuo CMS preserva il backlink.

Ekrem Sarı (2026) - "Indice dei prezzi di noleggio delle GPU cloud". Pubblicato online su AIMultiple.com. Consultato il Maggio 20, 2026, da: https://aimultiple.com/gpu-index [Risorsa online]

Sarı, E. (2026, Maggio 20). Indice dei prezzi di noleggio delle GPU cloud. AIMultiple. https://aimultiple.com/gpu-index

@misc{sar2026,
  author = {Sarı, Ekrem},
  title  = {{Indice dei prezzi di noleggio delle GPU cloud}},
  year   = {2026},
  month  = may,
  howpublished    = {\url{https://aimultiple.com/gpu-index}},
  note   = {AIMultiple. Retrieved Maggio 20, 2026}
}
Ekrem Sarı
Ekrem Sarı
Ricercatore di intelligenza artificiale
Ekrem è un ricercatore di intelligenza artificiale presso AIMultiple, specializzato in automazione intelligente, GPU, agenti di intelligenza artificiale e framework RAG.
Visualizza il profilo completo

Sii il primo a commentare

Il tuo indirizzo email non verrà pubblicato. Tutti i campi sono obbligatori.

0/450