Les tarifs à la demande pour les GPU cloud de dernière génération (B200, B300, MI300X, RTX 5090) ont doublé au cours de l'année écoulée, tandis que les cartes grand public (H100, H200, A100) sont restées dans une fourchette étroite. Nous compilons l'index GPU mensuellement auprès de 58 fournisseurs et de 17 modèles de GPU, couvrant les niveaux à la demande, spot et réservés sur 1 an.
Évolution des prix par génération de GPU
Le graphique montre le prix médian mensuel affiché à travers trois catégories de dates de sortie. Nous avons réparti 17 modèles de GPU en trois catégories selon leur date de lancement :
La majeure partie de l'augmentation provient des annonces B200 et B300 s'étendant des fournisseurs de néo-cloud aux feuilles de prix des hyperscalers. Ces annonces d'hyperscalers sont généralement 2 à 3 fois plus élevées, augmentant la médiane de la catégorie à mesure qu'elles entrent dans l'ensemble de données.
Les GPU modernes ont grimpé d'environ 25 %, mais ce mouvement est largement statistique. Google Cloud a ajouté sa variante A3z Mega H100 à la liste standard-A3, faisant passer la médiane de la cohorte H100 d'environ 2 $ à environ 3 $. En coulisses, les H100 des néo-clouds ont tendance à la baisse. Nous signalons cela dans la section suivante.
Les GPU hérités ont glissé de 1,78 $ à 0,97 $ sur la période, entraînés par la perte des ancres d'hyperscalers haut de gamme par la cohorte V100 alors que les entreprises retirent le SKU. Un ou deux fournisseurs par carte héritée restent dans notre ensemble de données : AWS liste K80 à 0,90 $, P40 se situe chez Vast.ai à 0,11 $, et le reste sont des cas limites similaires avec une seule annonce.
Le marché des contrats a évolué différemment : les engagements H100 sur 1 an ont tendance à la hausse sur la même période, tandis que notre médiane H100 à la demande était à peu près stable. Cela montre un élargissement de la différence entre les tarifs mensuels et les tarifs engagés sur 1 an.
Voir notre GPU index methodology pour savoir comment cela est calculé.
Évolution des prix par modèle de GPU
Le graphique ci-dessous couvre 10 GPU : 5 modernes, 4 derniers sortis, et le V100 comme référence héritée.
GPU modernes (H100, H200, A100, L40S, RTX 4090)
H100 est listé par 37 fournisseurs, le plus large de tous les accélérateurs actuels. La médiane de la cohorte est maintenant d'environ 2,95 $/heure de GPU, en baisse par rapport à plus de 7 $ au début de 2024. Thunder Compute, Vast.ai et RunPod se situent au bas de l'éventail ; Microsoft Azure et Google Cloud portent la queue supérieure au-delà de 10 $. La ligne Google Cloud est elle-même un mélange de trois SKU (a3-highgpu, a3-megagpu, a3-edgegpu) regroupés sous une étiquette nvidia-h100, ce qui élève sa médiane de cohorte.
La fourchette de H200 va de 2,29 $ (Theta EdgeCloud) à 13,78 $ (Microsoft Azure), avec une médiane de cohorte d'environ 3,39 $. Le plancher dépend de la manière dont vous traitez les annonces de niveau communautaire ou de partage d'instances comme comparables à la capacité dédiée. Une fois ceux mis de côté, la médiane de travail se situe dans la fourchette de 3 à 4 $.
A100 maintient une bande étroite de néo-cloud autour de 1,62 $, avec un ou deux outliers d'inférence sans serveur (Replicate à 5,04 $) tirant la queue haute vers le haut. Traitez les tarifs sans serveur séparément lors de la comparaison des fournisseurs IaaS.
L40S s'est établi autour d'une médiane de 1,55 $, AWS à 7,58 $ fixant le plafond. RTX 4090 est la carte de formation la moins chère de l'index à une médiane de 0,44 $, avec Salad à 0,18 $ et Beam à 1,61 $ encadrant l'éventail. Les deux visent l'inférence sub-100B et le fine-tuning par lots, où ils remplacent souvent A100 à une fraction du prix.
Derniers GPU sortis (B200, B300, MI300X, RTX 5090)
B200 médiane 5,24 $, fourchette 3,75 $ (Packet AI) à 14,24 $ (AWS). B300 médiane 6,99 $, fourchette 6,10 $ (Nebius) à 18,00 $ (Oracle). MI300X médiane 1,99 $, fourchette 1,99 $ (RunPod) à 7,86 $ (Azure). RTX 5090 médiane 0,69 $, fourchette 0,27 $ (Salad) à 1,34 $ (Vast.ai).
Le motif se répète de la courbe antérieure de H100 : les hyperscalers portent les nouveaux accélérateurs à 3 à 5 fois les planchers de néo-cloud au cours de la première année. B300 est la seule ligne du graphique qui continue de monter, car les annonces supplémentaires d'hyperscalers continuent d'élever la médiane. MI300X est l'outlier de l'offre ; RunPod et TensorWave le tarifient en dessous du plancher H100, mais il fonctionne sur ROCm et pas toutes les charges de travail CUDA ne sont facilement portables.
Référence héritée (V100)
V100 est la seule carte héritée sur le graphique, incluse comme ligne de référence de la génération 2017. La médiane de la cohorte est passée de 1,84 $ au milieu de 2024 à environ 0,97 $ aujourd'hui auprès de 18 fournisseurs. Les hyperscalers maintiennent les SKU V100 pour les clients de conformité exécutant des charges de travail immuables ; les néo-clouds les ont majoritairement abandonnés.
Évolution des prix par fournisseur
Pour le même GPU, les prix affichés par les hyperscalers sont généralement 3 à 6 fois plus élevés que les annonces de néo-cloud les plus basses dans l'ensemble de données. La profondeur du catalogue varie selon le fournisseur, le GPU, la région et le type de facturation.
Offre et disponibilité
L'offre varie plus largement que les prix à la une. Le graphique ci-dessous montre la part des annonces de chaque GPU signalant un stock confirmé aujourd'hui, triées de la plus serrée à la plus disponible.
B300 se situe à 6 % confirmé ; les 94 % restants sont listés mais les fournisseurs ne promettent pas encore la puce. MI300X et L40S se situent à 35-36 %, plus étroits que le niveau grand public. H100, H200, A100 et B200 se regroupent près de 41-51 %, où environ la moitié du catalogue est un stock confirmé et l'autre moitié dépend de la provision. RTX 4090 et RTX 5090 atteignent 86 %, reflétant une offre plus profonde de cartes grand public et une demande d'entreprise par carte plus faible.
Si votre projet dépend d'une puce spécifique de dernière génération, prévoyez un délai d'approvisionnement en plus du budget. La part de la liste d'attente reste proche de zéro car la plupart des annonces non confirmées sont suivies comme « stock inconnu », et non « liste d'attente » : les fournisseurs signalent l'état du stock, pas la position dans la file d'attente.
Choisir un GPU et un fournisseur
Le choix du GPU est façonné par trois axes : charge de travail, durée et région. Les tarifs spot par rapport à la demande s'ajoutent aux trois.
Par charge de travail
Par durée
Moins d'une semaine : Néo-cloud à la demande au bas de l'éventail.
Plusieurs semaines : Demandez un devis (les néo-clouds offrent généralement une réduction de 15 à 30 % pour des engagements de 4 à 12 semaines ; les hyperscalers proposent des niveaux réservés sur 1 an).
Plusieurs années : ngociez directement avec les fournisseurs, car les tarifs à la demande affichés ne capturent pas les réductions pour engagements à long terme.
Économies de réservation
La réduction réservée sur 1 an est généralement comprise entre 9 et 32 % par rapport au tarif à la demande affiché, avec des économies plus importantes sur AMD MI300X et le niveau d'inférence L40S, où les fournisseurs se font plus concurrence pour la capacité engagée.
H100 et H200 voient des réductions modestes à un chiffre ou dans les basses dizaines ; leur marché à la demande est déjà suffisamment concurrentiel pour que les fournisseurs ne sacrifient pas beaucoup de marge pour les engagements. Réservations B200 à -20 %, MI300X à -32 %, L40S à -29 %. Le graphique montre la médiane inter-fournisseurs pour les deux niveaux de facturation ; les devis individuels des fournisseurs peuvent aller plus loin pour des engagements pluriannuels non reflétés ici.
Spot vs à la demande
Le graphique de suivi de la réduction spot montre la réduction médiane spot par rapport à la demande par catégorie. Au cours des six derniers mois, les modernes économisent environ 50 %, les derniers sortis environ 48 %, l'héritage environ 77 % (l'héritage est plus bruyant qu'il n'y paraît ; peu de fournisseurs publient encore des tarifs spot pour ces cartes).
Si votre charge de travail tolère des interruptions de 5 à 15 minutes, le spot est le levier de coût le plus important disponible. Basculez le menu déroulant de facturation dans le graphique explorateur en haut pour voir le tarif spot côte à côte avec le tarif à la demande pour tout fournisseur de votre liste courte.
GPU index methodology
L'index couvre les prix de location horaires de GPU cloud affichés à travers les niveaux à la demande, spot et réservés sur 1 an (là où les fournisseurs les listent publiquement). Il ne couvre pas les contrats pluriannuels, les tarifs négociés par les entreprises, les combinaisons spot-plus-plan d'économies ou le coût total de possession.
Nos données sont des instantanés mensuels sur 23 mois (juillet 2024 à mai 2026), filtrés sur 17 modèles de GPU sélectionnés auprès de 58 fournisseurs. Chaque instantané rapporte, pour chaque cellule (fournisseur, GPU, type de facturation, mois), le min, le max, la moyenne et la médiane du taux horaire par GPU, ainsi que le nombre d'offres derrière ces chiffres.
Les prix H100, A100, H200, B200, B300 et V100 sont des médianes prises sur plusieurs versions physiques de la carte (PCIe, SXM ou interconnexion NVL ; pour A100 et V100, également 40/80 Go ou 16/32 Go VRAM) que les fournisseurs listent sous un seul nom.
Comment chaque graphique est calculé
Nous utilisons médiane des médianes tout au long : les fournisseurs et les GPU entrent chacun dans le chiffre principal avec un poids égal, de sorte qu'un fournisseur avec 38 annonces ne noie pas un nouveau venu avec 5 annonces.
Résumé du marché (trois lignes de catégorie) :
Le menu déroulant de facturation relance les étapes 2-3 par rapport au niveau sélectionné (à la demande, spot ou réservation). Une quatrième option « Moyenne » trace la moyenne arithmétique des médianes à trois niveaux par catégorie par mois, limitée aux mois où les trois niveaux ont des données.
Explorateur Fournisseur × facturation :
Pour le fournisseur et le niveau de facturation que vous sélectionnez, chaque ligne trace la médiane mensuelle d'un GPU au fil du temps. Aucune agrégation inter-fournisseurs n'est appliquée : le point de chaque mois est simplement le prix médian parmi les annonces de ce fournisseur pour ce GPU et ce niveau de facturation. La ligne se termine là où l'offre disparaît du catalogue.
GPU modernes côte à côte :
Mêmes étapes 1-2 que le résumé du marché, limité aux tarifs à la demande uniquement. Chaque ligne est la médiane mensuelle inter-fournisseurs pour un GPU. Aucune agrégation inter-GPU. Huit séries.
Suivi de la réduction spot :
Cela associe chaque prix spot à son homologue à la demande du même fournisseur, du même GPU et du même mois, afin que la réduction reflète l'écart réel qu'un acheteur chez ce fournisseur verrait, et non une différence de bruit inter-marché.
Instantané de disponibilité :
Instantané uniquement, aucune agrégation temporelle. Les annonces signalées comme stock inconnu, liste d'attente ou indisponible sont toujours comptées dans le dénominateur mais ne sont pas tracées séparément sur le graphique, car le signal actionnable par l'acheteur est la part confirmée disponible.
Économies de réservation :
FAQ
Nous publions une vue mensuelle médiane actualisée chaque mois. Les chiffres reflètent les données jusqu'au mois précédent.
Le GPU est le même ; le bundle ne l'est pas. Les hyperscalers intègrent la conformité (HIPAA, SOC 2, FedRAMP), les SLA d'entreprise, l'intégration de l'identité et du réseau, et le support 24/7. Les néo-clouds tarifient le bare metal ou l'accès VM avec une orchestration gérée en option. Si vous n'avez pas besoin du bundle, le prix du néo-cloud est la bonne comparaison.
Oui, si votre charge de travail effectue des points de contrôle et tolère des interruptions de 5 à 15 minutes. La réduction spot des GPU modernes se situe près de 50 % au cours des six derniers mois, et les économies s'accumulent sur l'entraînement sur plusieurs jours. Le spot est le mauvais choix pour l'inférence sensible à la latence, les services à réplique unique sans basculement ou les exécutions d'évaluation qui nécessitent une comparaison propre en temps réel.
Le menu déroulant de facturation du graphique d'évolution des prix par fournisseur bascule entre les niveaux à la demande, spot et réservés sur 1 an partout où les fournisseurs publient ces tarifs. Les contrats pluriannuels et les réductions négociées par les entreprises ne sont pas inclus. Demandez un devis directement auprès du fournisseur pour ceux-ci.
Pour aller plus loin
- Benchmark multi-GPU : B200 vs H200 vs H100 vs MI300X
- Top 30 des fournisseurs de GPU cloud & leurs GPUs
- Benchmark de concurrence GPU
- Top 25+ fabricants de puces IA : NVIDIA & ses concurrents
Citer cette recherche
Choisissez le format qui correspond à votre lieu de publication. Coller la version avec lien dans votre CMS préserve le lien retour.
@misc{sar2026,
author = {Sarı, Ekrem},
title = {{Index des prix de location de GPU cloud}},
year = {2026},
month = jun,
howpublished = {\url{https://aimultiple.com/gpu-index}},
note = {AIMultiple. Retrieved Juin 17, 2026}
}
Soyez le premier à commenter
Votre adresse courriel ne sera pas publiée. Tous les champs sont obligatoires. Les commentaires sont laissés dans leur langue d'origine.