Services
Contactez-nous
Aucun résultat trouvé.

Indice des prix de location de GPU cloud

Ekrem Sarı
Ekrem Sarı
mis à jour le Mai 20, 2026

Les tarifs à la demande des GPU cloud de dernière génération (B200, B300, MI300X, RTX 5090) ont quasiment doublé au cours de l'année écoulée, tandis que ceux des cartes grand public (H100, H200, A100) sont restés relativement stables. Nous établissons mensuellement l'indice GPU à partir des données de 58 fournisseurs et 17 modèles de GPU, couvrant les offres à la demande, spot et les abonnements d'un an.

Évolution des prix par génération de GPU

Loading Chart

Le graphique présente le prix médian mensuel affiché, réparti en trois tranches de dates de sortie. Nous avons classé 17 modèles de GPU en trois catégories selon leur date de lancement :

L'augmentation est principalement due à l'intégration des tarifs des fournisseurs néocloud aux grilles tarifaires des hyperscalers dans les catégories B200 et B300. Ces tarifs sont généralement 2 à 3 fois plus élevés, ce qui fait grimper la médiane de la catégorie dès leur entrée dans l'ensemble de données.

Les GPU modernes ont progressé d'environ 25 %, mais cette hausse est surtout statistique. Cloud a ajouté sa variante A3z Mega H100 à la liste des modèles A3 standard, faisant passer le prix médian de la gamme H100 d'environ 2 $ à environ 3 $. En dessous, le prix du Neocloud H100 a baissé. Nous l'aborderons dans la section suivante.

Le prix des GPU Legacy a chuté de 1,78 $ à 0,97 $ durant cette période, en raison du retrait des références V100 des principaux fournisseurs de services cloud haut de gamme par les entreprises. Seuls un ou deux fournisseurs par carte Legacy figurent encore dans notre base de données : AWS propose la K80 à 0,90 $, Vast.ai la P40 à 0,11 $, et les autres sont des cas particuliers similaires, disponibles uniquement chez un seul fournisseur.

Le marché des contrats a évolué différemment : les engagements H100 d’un an ont progressé sur la même période, tandis que notre médiane H100 à la demande est restée globalement stable. Cela met en évidence un écart croissant entre les prix des contrats mensuels et ceux des contrats annuels.

Consultez notre méthodologie d'indexation GPU pour savoir comment cela est calculé.

Évolution des prix par modèle de GPU

Le tableau ci-dessous présente les huit GPU modernes.

GPU modernes (H100, A100, L4 et équivalents)

Le H100 est référencé par 36 fournisseurs. La médiane de la cohorte a diminué, passant de plus de 7 USD/heure de GPU début 2024 à moins de 3 USD/heure de GPU en 2026. Les référencements Azure ND et Google Cloud A3 Mega font grimper la limite supérieure de la distribution.

Le H200 est proposé à un prix d'entrée de gamme nettement inférieur à celui des autres fournisseurs. Le prix affiché par RunPod pour le H200 représente une fraction du prix médian de sa catégorie, tandis que le prix proposé par le fournisseur suivant est plusieurs fois supérieur. Par conséquent, la médiane et la fourchette de prix dépendent fortement de la disponibilité et de la configuration du produit le moins cher.

Les prix des A100 se situent dans une fourchette étroite pour Neocloud, quelques offres d'inférence sans serveur faisant grimper les tarifs les plus élevés. Comparez les tarifs sans serveur séparément des tarifs horaires des GPU IaaS.

Les processeurs L40S, RTX 4090, A10G, T4 et L4 couvrent la couche d'inférence. Leurs charges de travail se chevauchent, notamment l'inférence de moins de 100 milliards de données, la génération et l'optimisation par lots, ce qui rend la comparaison des prix pertinente. La faible dispersion des prix du processeur A10G indique qu'il s'agit, de fait, d'une référence exclusivement disponible sur AWS dans notre liste.

Dernières cartes graphiques sorties (B200, B300, MI300X, RTX 5090)

Prix médian du B200 : 5,50 $, fourchette : de 3,75 $ (Packet AI) à 14,24 $ (AWS). Prix médian du B300 : 7,50 $, fourchette : de 6,10 $ (Nebius) à 17,80 $ (AWS). Prix médian du MI300X : 2,72 $, fourchette : de 0,50 $ (RunPod) à 7,86 $ (Azure). Prix médian du RTX 5090 : 0,67 $, fourchette : de 0,27 $ (Salad) à 0,72 $ (Novita).

La distribution est similaire à celle des précédents H100 : les prix des nouveaux accélérateurs chez Hyperscaler sont environ trois fois supérieurs à ceux des accélérateurs Neocloud moins chers lors de leur disponibilité initiale. Le MI300X est proposé à un prix inférieur à celui du H100 d'entrée de gamme chez RunPod et TensorWave, mais les charges de travail basées sur ROCm peuvent nécessiter une validation pour les applications dépendantes de CUDA.

Cartes graphiques anciennes (V100, P100, K80, M60, P40)

La V100 est toujours disponible chez 16 fournisseurs (prix médian d'environ 0,97 $), la P100 chez 5 (prix médian d'environ 1,46 $), la K80 uniquement chez AWS (0,90 $) et la P40 uniquement chez Vast.ai (environ 0,11 $). Les références plus anciennes restent proposées par un nombre limité de fournisseurs. Les offres des hyperscalers peuvent persister pour les clients confrontés à des contraintes de compatibilité, de conformité ou de migration, tandis que de nombreux fournisseurs de néocloud ne proposent plus ces GPU. Pour les nouveaux déploiements, ces cartes semblent moins pertinentes, sauf si la charge de travail dépend spécifiquement d'environnements matériels, de pilotes ou logiciels anciens.

Évolution des prix par fournisseur

Pour une même carte graphique, les prix affichés par les hyperscalers sont généralement 3 à 6 fois supérieurs aux offres les plus basses de Neocloud dans l'ensemble de données. La profondeur du catalogue varie selon le fournisseur, la carte graphique, la région et le type de facturation.

Approvisionnement et disponibilité

L'offre varie davantage que les prix affichés. Le graphique ci-dessous présente la part des GPU listés aujourd'hui qui font état d'un stock confirmé, classés de la plus rare à la plus abondante.

Le B300 est confirmé à 6 % ; les 94 % restants sont listés, mais les fournisseurs ne s'engagent pas encore à les fournir. Les MI300X et L40S représentent entre 35 et 36 %, une part plus faible que celle du segment grand public. Les H100, H200, A100 et B200 se regroupent autour de 41 à 51 %, la moitié du catalogue étant confirmée en stock et l'autre moitié étant soumise à des délais de livraison. Les RTX 4090 et RTX 5090 atteignent 86 %, ce qui reflète une offre plus importante de cartes grand public et une demande plus faible par carte de la part des entreprises.

Si votre projet dépend d'une puce de dernière génération spécifique, prévoyez un délai d'approvisionnement en plus de votre budget. Le taux d'attente reste quasi nul car la plupart des annonces non confirmées sont enregistrées comme « stock inconnu », et non comme « liste d'attente » : les fournisseurs indiquent l'état des stocks, et non la position dans la file d'attente.

Choisir un GPU et un fournisseur

Le choix du GPU est déterminé par trois axes : la charge de travail, la durée et la région. La tarification Spot et à la demande vient s’ajouter à ces trois éléments.

Par charge de travail

Par durée

En moins d'une semaine : Neocloud à la demande au plus bas de l'échelle.

Plusieurs semaines : Demandez un devis (les Neoclouds offrent généralement une réduction de 15 à 30 % pour les engagements de 4 à 12 semaines ; les hyperscalers proposent des niveaux réservés d’un an).

Contrat pluriannuel : négociez directement avec les fournisseurs, car les tarifs à la demande affichés ne tiennent pas compte des remises pour les contrats à durée déterminée.

Économies sur les réservations

La réduction réservée sur 1 an s'élève généralement à 9-32% du tarif à la demande affiché, les économies les plus importantes étant réalisées sur AMD MI300X et le niveau d'inférence L40S, où les fournisseurs se livrent à une concurrence plus intense pour la capacité engagée.

Les tarifs H100 et H200 bénéficient de remises modestes, de l'ordre de 10 à 15 %. Leur marché à la demande étant déjà suffisamment concurrentiel, les prestataires n'ont pas à sacrifier beaucoup de marge pour s'engager. Les réservations B200 sont assorties d'une remise de 20 %, les réservations MI300X de 32 % et les réservations L40S de 29 %. Le graphique présente la médiane inter-prestataires pour les deux niveaux de facturation ; les offres individuelles des prestataires peuvent proposer des remises plus importantes pour les contrats pluriannuels non représentés ici.

Spot vs à la demande

Le graphique de suivi des remises au comptant affiche la remise médiane par catégorie, calculée sur la base des tarifs au comptant par rapport aux tarifs à la demande. Au cours des six derniers mois, les cartes modernes ont permis d'économiser environ 50 %, les dernières cartes émises environ 48 % et les anciennes cartes environ 77 % (le taux de change des anciennes cartes est plus fluctuant qu'il n'y paraît ; peu de fournisseurs publient encore les tarifs au comptant pour ces cartes).

Si votre charge de travail tolère des interruptions de 5 à 15 minutes, la facturation au comptant est le principal levier de réduction des coûts. Déroulez le menu de facturation dans le graphique en haut de la page pour comparer le tarif au comptant avec le tarif à la demande pour chaque fournisseur présélectionné.

Méthodologie d'indexation GPU

L'indice couvre les prix horaires de location de GPU cloud publiés pour les offres à la demande, spot et les contrats réservés sur un an (lorsque les fournisseurs les indiquent publiquement). Il ne couvre pas les contrats pluriannuels, les tarifs négociés pour les entreprises, les offres combinant spot et plans d'économies, ni le coût total de possession.

Nos données sont des instantanés mensuels sur 23 mois (de juillet 2024 à mai 2026), filtrés sur 17 modèles de GPU sélectionnés parmi 58 fournisseurs. Chaque instantané indique, pour chaque cellule (fournisseur, GPU, type de facturation, mois), le tarif horaire minimal, maximal, moyen et médian par GPU, ainsi que le nombre d'offres correspondant à ces chiffres.

Comment chaque graphique est calculé

Nous utilisons la médiane des médianes tout au long du processus : les fournisseurs et les GPU entrent chacun dans le chiffre principal avec un poids égal, de sorte qu'un fournisseur listé à 38 n'éclipse pas un nouveau venu listé à 5.

Résumé du marché (trois catégories) :

Le menu déroulant de facturation réexécute les étapes 2 et 3 en fonction du niveau sélectionné (à la demande, au comptant ou sur réservation). Une quatrième option, « Moyenne », affiche la moyenne arithmétique des médianes des trois niveaux par catégorie et par mois, pour les mois où des données sont disponibles pour les trois niveaux.

Explorateur de facturation des fournisseurs :

Pour le fournisseur et le niveau de facturation sélectionnés, chaque ligne représente le prix médian mensuel d'un GPU au fil du temps. Aucun regroupement inter-fournisseurs n'est effectué : chaque point mensuel correspond simplement au prix médian des offres de ce fournisseur pour ce GPU et ce niveau de facturation. La ligne s'arrête lorsque l'offre disparaît du catalogue.

Comparaison des GPU modernes :

Mêmes étapes 1 et 2 que pour le résumé du marché, mais limitées aux prix à la demande. Chaque ligne représente la médiane mensuelle inter-fournisseurs pour un GPU donné. Aucun regroupement inter-GPU. Huit séries.

Suivi des remises ponctuelles :

Cela permet d'associer chaque prix spot à son équivalent à la demande du même fournisseur, du même GPU et du même mois, de sorte que la réduction reflète l'écart réel qu'un acheteur chez ce fournisseur verrait, et non une différence due au bruit du marché.

Aperçu de la disponibilité :

Instantané uniquement, sans agrégation temporelle. Les titres signalés comme inconnus, en liste d'attente ou indisponibles sont toujours comptabilisés dans le dénominateur, mais ne sont pas représentés séparément sur le graphique, car le signal d'achat pertinent est le titre confirmé disponible.

Économies sur la réservation :

FAQ

Nous publions chaque mois une vue médiane mensuelle actualisée. Les chiffres reflètent les données du mois précédent.

Le GPU est identique ; le pack, en revanche, est différent. Les hyperscalers incluent dans leurs prix la conformité aux normes (HIPAA, SOC 2, FedRAMP), les SLA d'entreprise, l'intégration des identités et du réseau, ainsi qu'une assistance 24h/24 et 7j/7. Les Neoclouds proposent un accès à des serveurs physiques ou à des machines virtuelles, avec une orchestration gérée en option. Si le pack ne vous est pas indispensable, le prix des Neoclouds est la comparaison la plus pertinente.

Oui, si votre charge de travail comporte des points de contrôle et tolère des interruptions de 5 à 15 minutes. La réduction sur les GPU Spot modernes avoisine les 50 % depuis six mois, et les économies s'accumulent sur des entraînements de plusieurs jours. Le mode Spot n'est pas adapté aux inférences sensibles à la latence, aux services à réplique unique sans basculement, ni aux évaluations nécessitant une comparaison précise des performances réelles.

Le menu déroulant « Facturation » du graphique des tendances tarifaires par fournisseur permet de choisir entre les options à la demande, au comptant et avec réservation annuelle, selon les tarifs publiés par les fournisseurs. Les contrats pluriannuels et les remises négociées pour les entreprises ne sont pas inclus. Veuillez demander un devis directement au fournisseur pour ces services.

Pour en savoir plus

Citer cette recherche

Choisissez le format qui correspond à votre lieu de publication. Coller la version avec lien dans votre CMS préserve le lien retour.

Ekrem Sarı (2026) - "Indice des prix de location de GPU cloud". Publié en ligne sur AIMultiple.com. Consulté le Mai 20, 2026, à : https://aimultiple.com/gpu-index [Ressource en ligne]

Sarı, E. (2026, Mai 20). Indice des prix de location de GPU cloud. AIMultiple. https://aimultiple.com/gpu-index

@misc{sar2026,
  author = {Sarı, Ekrem},
  title  = {{Indice des prix de location de GPU cloud}},
  year   = {2026},
  month  = may,
  howpublished    = {\url{https://aimultiple.com/gpu-index}},
  note   = {AIMultiple. Retrieved Mai 20, 2026}
}
Ekrem Sarı
Ekrem Sarı
Chercheur en IA
Ekrem est chercheur en IA chez AIMultiple, spécialisé dans l'automatisation intelligente, les GPU, les agents IA et les frameworks RAG.
Voir le profil complet

Soyez le premier à commenter

Votre adresse courriel ne sera pas publiée. Tous les champs sont obligatoires.

0/450