Comparaison des Fonctionnalités

Indice des prix de location de GPU cloud

mis à jour le 6 juil. 2026

Les tarifs à la demande pour les GPU cloud de dernière génération (B200, B300, MI300X, RTX 5090) ont à peu près doublé au cours de l'année dernière, tandis que les cartes grand public (H100, H200, A100) sont restées dans une fourchette serrée. Nous compilons l'indice GPU mensuellement à partir de 63 fournisseurs et 17 modèles de GPU, couvrant les niveaux à la demande, spot et réservés sur 1 an.

Tendances des prix par génération de GPU

Billing type

Loading Chart

Le graphique montre le prix mensuel médian affiché sur trois tranches de date de sortie. Nous répartissons 17 modèles de GPU en trois catégories selon la date de lancement :

Catégorie	GPUs	Rôle
Dernière version (2024 et après)	B200, B300, MI300X, RTX 5090	Cohorte de la dernière génération
Moderne (2020 à 2023)	H100, H200, A100, L40S, RTX 4090, A10G, T4, L4	Exécutants de charges de travail grand public
Ancienne (avant 2020)	V100, P100, K80, M60, P40	Toujours louables, principalement des neoclouds de niveau communautaire

La majeure partie de l'augmentation provient des annonces B200 et B300 passant des fournisseurs neocloud aux grilles tarifaires hyperscaler. Ces annonces hyperscaler sont généralement 2x-3x plus élevées, ce qui élève la médiane de la catégorie à mesure qu'elles entrent dans l'ensemble de données.

Les GPU modernes ont augmenté d'environ 25%, mais ce mouvement est en grande partie statistique. Google Cloud a ajouté sa variante A3z Mega H100 à l'annonce standard A3, portant la médiane de la cohorte H100 d'environ 2 $ à environ 3 $. En dessous, les H100 neocloud ont baissé. Nous le signalons dans la section suivante.

Les GPU anciens ont glissé de 1,78 $ à 0,99 $ sur la période, entraînés par la perte des ancres hyperscaler haut de gamme de la cohorte V100 à mesure que les entreprises abandonnent ce SKU. Un ou deux fournisseurs par carte ancienne restent dans notre ensemble de données : AWS répertorie la K80 à 0,90 $, la P40 se situe chez Vast.ai à 0,11 $, et le reste sont des cas marginaux similaires avec une seule annonce.

Le marché des contrats a évolué différemment : les engagements sur 1 an pour les H100 ont augmenté sur la même période, tandis que notre médiane à la demande pour les H100 est restée à peu près stable. Cela montre une différence croissante entre les tarifs mensuels et ceux engagés sur 1 an.

Consultez notre GPU methodology pour savoir comment cela est calculé.

Tendances des prix par modèle de GPU

Le graphique ci-dessous couvre 10 GPU : 5 modernes, 4 dernières versions, et la V100 comme référence ancienne.

GPU modernes (H100, H200, A100, L40S, RTX 4090)

IONOS couvre ce niveau depuis l'UE : T4, A10 et RTX PRO 6000 Blackwell à la demande, plus des serveurs dédiés H100 et H200 à un tarif fixe de 3 990 $/mois avec résidence des données dans l'UE.

H100 est répertoriée par 46 fournisseurs, la couverture la plus large de tous les accélérateurs actuels. La médiane de la cohorte est maintenant d'environ 2,99 $/GPU-heure, en baisse par rapport à plus de 7 $ début 2024. Thunder Compute, Vast.ai et RunPod se situent en bas de l'échelle ; Microsoft Azure et Google Cloud portent la queue supérieure au-delà de 10 $. La ligne de Google Cloud est elle-même un mélange de trois SKU (a3-highgpu, a3-megagpu, a3-edgegpu) regroupés sous un seul label nvidia-h100, ce qui augmente sa médiane de cohorte.

La fourchette de la H200 va de 2,30 $ (FluidStack) à 13,78 $ (Microsoft Azure), avec une médiane de cohorte autour de 4,00 $. Le plancher dépend de si l'on considère les annonces de niveau communautaire ou de partage d'instance comme comparables à la capacité dédiée. Une fois celles-ci mises de côté, la médiane opérationnelle se situe dans la bande de 3 à 4 $.

L'A100 maintient une bande neocloud serrée autour de 1,79 $, avec une ou deux valeurs aberrantes d'inférence serverless (Replicate à 5,04 $) qui tirent la queue haute vers le haut. Traitez les tarifs serverless séparément lorsque vous comparez les fournisseurs IaaS.

La L40S s'est stabilisée autour de 1,56 $ de médiane, avec AWS à 7,58 $ fixant le plafond. La RTX 4090 est la carte de classe entraînement la moins chère de l'indice avec une médiane de 0,52 $, Salad à 0,18 $ et Beam à 1,61 $ encadrant l'écart. Les deux ciblent l'inférence de moins de 100B et le fine-tuning par lots, où elles remplacent souvent l'A100 à une fraction du prix.

Dernières GPU sorties (B200, B300, MI300X, RTX 5090)

Médiane B200 6,11 $, fourchette de 3,44 $ (Vast.ai) à 16,11 $ (Google Cloud). Médiane B300 7,92 $, fourchette de 5,44 $ (Vast.ai) à 18,00 $ (Oracle Cloud). Médiane MI300X 2,72 $, fourchette de 1,99 $ (DigitalOcean) à 7,86 $ (Microsoft Azure). Médiane RTX 5090 0,66 $, fourchette de 0,27 $ (Salad) à 2,00 $ (Vast.ai).

Le schéma se répète par rapport à la courbe antérieure du H100 : les hyperscalers proposent les nouveaux accélérateurs à 3-5x les planchers neocloud durant la première année. Le B300 continue de monter sur le graphique, car les annonces supplémentaires d'hyperscalers augmentent la médiane. La MI300X est une valeur aberrante du côté de l'offre ; elle se situe en dessous du plancher du H100 chez DigitalOcean et TensorWave, mais elle fonctionne sur ROCm et toutes les charges de travail CUDA ne se portent pas proprement.

Référence ancienne (V100)

La V100, la carte ancienne sur le graphique, est incluse comme ligne de référence de la génération 2017. La médiane de la cohorte est passée de 1,84 $ à la mi-2024 à environ 0,99 $ aujourd'hui sur 17 fournisseurs. Les hyperscalers maintiennent les SKU V100 pour les clients conformes exécutant des charges de travail immuables ; les neoclouds les ont pour la plupart abandonnés.

Tendances des prix par fournisseur

Pour le même GPU, les prix affichés par les hyperscalers sont généralement 3x-6x plus élevés que les annonces neocloud les plus basses de l'ensemble de données. La profondeur du catalogue varie selon le fournisseur, le GPU, la région et le type de facturation.

Offre et disponibilité

L'offre varie plus largement que les prix affichés. Le graphique ci-dessous montre la part des annonces de chaque GPU rapportant un stock confirmé aujourd'hui, triées du plus restreint au plus disponible.

La MI300X et la L40S sont les plus restreintes à 44%, avec les B200 et B300 derrière à 52-54%. Les H100, A100 et H200 se regroupent près de 63-70%, où environ deux tiers du catalogue sont du stock confirmé et le reste dépend du provisionnement. Les RTX 4090 et RTX 5090 atteignent 93-97%, reflétant une offre plus profonde de cartes grand public et une demande d'entreprise par carte plus faible.

article.automate_process_description

article.automate_process_button

Choisir un GPU et un fournisseur

Le choix d'un GPU est façonné par trois axes : la charge de travail, la durée et la région. Les prix spot par rapport à la demande s'ajoutent aux trois.

Par charge de travail

Charge de travail	GPU recommandé	Niveau de fournisseur	Pourquoi
Inférence de LLM, modèles 7-13B	L4, L40S	Neocloud	Moins de 2 $/h, optimisé pour l'inférence
Inférence de LLM, 30-70B	A100 80GB, H100	Neocloud	VRAM adéquate, H100 pour des SLA de latence serrés
Inférence de LLM, 70B+ liée à la mémoire	H200, MI300X	Neocloud	141-192 Go HBM permet un cache KV plus grand
Fine-tuning 7-13B	A100, H100	Neocloud	Rentable, largement disponible
Entraînement de grands modèles à partir de zéro	H100, B200 multi-nœud	Hyperscaler ou grand neocloud	HBM multi-GPU et interconnexion rapide
Expérimentation, prototypage	T4, A10G, L4, RTX 4090	Neocloud de niveau communautaire	Tarif horaire bon marché, démarrage rapide
Production réglementée (HIPAA/SOC2/FedRAMP)	Tout ce qui précède	Hyperscaler	Certifications de conformité

Par durée

Moins d'une semaine : Neocloud à la demande au plancher de l'écart.

Plusieurs semaines : Demandez un devis (les Neoclouds accordent généralement une réduction de 15-30% pour des engagements de 4-12 semaines ; les hyperscalers proposent des niveaux réservés sur 1 an).

Plusieurs années : négociez directement avec les fournisseurs, car les tarifs à la demande affichés ne tiennent pas compte des remises pour engagements à long terme.

Économies avec les réservations

La remise pour réservation sur 1 an est généralement de 16-39% sur le tarif à la demande affiché, avec les économies les plus importantes sur B200, AMD MI300X et la L40S de niveau inférence, où les fournisseurs se concurrencent davantage pour la capacité engagée.

Les H100 et H200 bénéficient de remises modestes d'un chiffre à un peu plus de dix pour cent ; leur marché à la demande est suffisamment concurrentiel pour que les fournisseurs ne sacrifient pas leur marge pour des engagements. La B200 se réserve à -39%, la MI300X à -31%, la L40S à -30%. Le graphique montre la médiane inter-fournisseurs pour les deux niveaux de facturation ; les devis individuels des fournisseurs peuvent être plus avantageux pour des durées pluriannuelles non reflétées ici.

Spot vs à la demande

Le graphique de suivi des remises spot montre la remise médiane spot vs à la demande par catégorie. Au cours des six derniers mois, les modernes économisent ~50%, les dernières sorties ~49%, les anciennes ~75% (les anciennes sont plus bruitées qu'il n'y paraît ; peu de fournisseurs publient encore des tarifs spot pour ces cartes).

Si votre charge de travail tolère des interruptions de 5-15 minutes, le spot est le levier de coût le plus important disponible. Basculez la liste déroulante de facturation dans le graphique explorateur en haut pour voir le tarif spot côte à côte avec le tarif à la demande pour tout fournisseur de votre liste restreinte.

GPU methodology

L'indice couvre les prix horaires affichés de location de GPU cloud à la demande, spot et réservés sur 1 an (lorsque les fournisseurs les publient publiquement). Il ne couvre pas les contrats pluriannuels, les tarifs négociés en entreprise, les combinaisons spot avec plan d'économies, ni le coût total de possession.

Nos données sont des instantanés mensuels sur 24 mois (juillet 2024 à juin 2026), filtrés sur 17 modèles de GPU sélectionnés parmi 63 fournisseurs. Chaque instantané rapporte, pour chaque cellule (fournisseur, GPU, type de facturation, mois), le tarif horaire par GPU minimum, maximum, moyen et médian, ainsi que le nombre d'offres derrière ces chiffres.

Les prix des H100, A100, H200, B200, B300 et V100 sont des médianes prises sur plusieurs versions physiques de la carte (PCIe, SXM ou interconnect NVL ; pour A100 et V100, également 40/80 Go ou 16/32 Go de VRAM) que les fournisseurs répertorient sous un même nom.

Comment chaque graphique est calculé

Nous utilisons la médiane des médianes tout au long : les fournisseurs et les GPU entrent chacun dans le chiffre principal avec un poids égal, de sorte qu'un fournisseur avec 38 annonces n'éclipse pas un nouveau venu avec 5 annonces.

Résumé du marché (trois lignes de catégorie) :

1Step 1  For each provider + GPU + billing tier + month, take the median price.
2Step 2  Take the median across providers, leaving one value per GPU + billing tier + month.
3Step 3  Take the median across GPUs in the same category, leaving one value per category + billing tier + month.

Le menu déroulant de facturation réexécute les étapes 2-3 par rapport au niveau sélectionné (à la demande, spot ou réservation). Une quatrième option « Moyenne » trace la moyenne arithmétique des médianes des trois niveaux par catégorie et par mois, limitée aux mois où les trois niveaux ont des données.

Explorateur fournisseur × facturation :

Pour le fournisseur et le niveau de facturation que vous sélectionnez, chaque ligne suit la médiane mensuelle d'un GPU au fil du temps. Aucune agrégation inter-fournisseurs n'est appliquée : le point de chaque mois est le prix médian sur les annonces de ce fournisseur pour ce GPU et ce niveau de facturation. La ligne se termine là où l'offre disparaît du catalogue.

GPU modernes côte à côte :

Mêmes étapes 1-2 que le résumé du marché, limité aux prix à la demande. Chaque ligne est la médiane mensuelle inter-fournisseurs pour un GPU. Pas d'agrégation inter-GPU. Huit séries.

Suivi des remises spot :

1Step 1  Keep the provider + GPU + month cells where both an on-demand and a spot price exist.
2Step 2  Per cell, compute: discount % = (on-demand − spot) / on-demand × 100.
3Step 3  Per GPU per month, take the median discount across providers.
4Step 4  Per category per month, take the median discount across GPUs.

Cela associe chaque prix spot à son équivalent à la demande du même fournisseur, même GPU, même mois, de sorte que la remise reflète l'écart réel qu'un acheteur chez ce fournisseur verrait, et non une différence de bruit inter-marché.

Aperçu de la disponibilité :

1Step 1  Take the current snapshot of listings, one row per provider + SKU + billing tier.
2Step 2  Per GPU, compute: % available = confirmed listings / total listings × 100.
3Step 3  Sort GPUs ascending by % available, so tightest supply appears leftmost.

Instantané uniquement, pas d'agrégation temporelle. Les annonces signalées comme stock inconnu, liste d'attente ou indisponibles sont toujours comptées dans le dénominateur mais ne sont pas tracées séparément sur le graphique, car le signal exploitable pour l'acheteur est la part confirmée-disponible.

Économies de réservation :

1Step 1  Filter the latest weekly snapshot to on-demand and reservation listings.
2Step 2  Per GPU per tier, take the median of cross-provider monthly medians.
3Step 3  Pair the two tiers per GPU and render as grouped bars.

Ne manquez pas nos benchmarks et analyses basées sur les données. Le bouton ouvre Google ; sélectionner AIMultiple confirme que vous souhaitez voir AIMultiple plus souvent dans les résultats de recherche Google.

Ajouter comme source préférée

FAQ

Nous publions chaque mois une vue mensuelle médiane actualisée. Les chiffres reflètent les données du mois précédent.

Le GPU est le même ; le bundle ne l'est pas. Les hyperscalers incluent dans le prix la conformité (HIPAA, SOC 2, FedRAMP), les SLA d'entreprise, l'intégration de l'identité et du réseau, et le support 24/7. Les neoclouds facturent l'accès bare metal ou VM avec une orchestration gérée en option. Si vous n'avez pas besoin du bundle, le prix Neocloud est la bonne comparaison.

Oui, si votre charge de travail peut créer des points de contrôle et tolère des interruptions de 5-15 minutes. La remise spot pour les GPU modernes se situe autour de 50% au cours des six derniers mois, et les économies s'accumulent sur plusieurs jours d'entraînement. Le spot est un mauvais choix pour l'inférence sensible à la latence, les services à réplique unique sans basculement, ou les évaluations nécessitant une comparaison propre du temps d'exécution.

Le menu déroulant de facturation du graphique des tendances des prix par fournisseur bascule entre les niveaux à la demande, spot et réservés sur 1 an lorsque les fournisseurs publient ces tarifs. Les contrats pluriannuels et les remises négociées en entreprise ne sont pas inclus. Demandez un devis directement au fournisseur pour ceux-ci.

Pour en savoir plus

Citer cette recherche

Choisissez le format qui correspond à votre lieu de publication. Coller la version avec lien dans votre CMS préserve le lien retour.

Ekrem Sarı (2026) - "Indice des prix de location de GPU cloud". Publié en ligne sur AIMultiple.com. Consulté le 6 Juillet 2026, à : https://aimultiple.com/gpu-index [Ressource en ligne]

Sarı, E. (2026, 6 Juillet). Indice des prix de location de GPU cloud. AIMultiple. https://aimultiple.com/gpu-index

@misc{sar2026,
  author = {Sarı, Ekrem},
  title  = {{Indice des prix de location de GPU cloud}},
  year   = {2026},
  month  = jul,
  howpublished    = {\url{https://aimultiple.com/gpu-index}},
  note   = {AIMultiple. Consulté le 6 Juillet 2026}
}

Ekrem Sarı

Chercheur en IA

Suivre

Ekrem est chercheur en IA chez AIMultiple, spécialisé dans l'automatisation intelligente, les GPU, les agents IA et les frameworks RAG.

Voir le profil complet

Soyez le premier à commenter

Votre adresse courriel ne sera pas publiée. Tous les champs sont obligatoires. Les commentaires sont laissés dans leur langue d'origine.

Tendances des prix par génération de GPU

Tendances des prix par modèle de GPU

Tendances des prix par fournisseur

Offre et disponibilité

Choisir un GPU et un fournisseur

GPU methodology

FAQ

Pour en savoir plus

Citer cette recherche

Nous suivons des normes éthiques et notre processus pour garantir l'objectivité. Parmi les clients d'AIMultiple dans la catégorie Matériel D'ia figurent Ionos.

Ajouter comme source préférée

Indice des prix de location de GPU cloud

Tendances des prix par génération de GPU

Tendances des prix par modèle de GPU

GPU modernes (H100, H200, A100, L40S, RTX 4090)

Dernières GPU sorties (B200, B300, MI300X, RTX 5090)

Référence ancienne (V100)

Tendances des prix par fournisseur

Offre et disponibilité

Choisir un GPU et un fournisseur

Par charge de travail

Par durée

Économies avec les réservations

Spot vs à la demande

GPU methodology

Comment chaque graphique est calculé

FAQ

Pour en savoir plus

Citer cette recherche

Soyez le premier à commenter

À lire ensuite

Prix des vidéos IA: Comparez Synthesia et Invideo IA

Tarifs et plans d'authentification multifacteur (MFA)

Comparaison des tarifs de gestion des appareils mobiles: 10+ produits

Comparatif des prix des services de surveillance réseau

Comparatif des prix de la gestion des actifs informatiques (ITAM)

Prix des 6 meilleurs logiciels de gestion des services informatiques (ITSM)

Indice des prix de location de GPU cloud

Tendances des prix par génération de GPU

Tendances des prix par modèle de GPU

GPU modernes (H100, H200, A100, L40S, RTX 4090)

Dernières GPU sorties (B200, B300, MI300X, RTX 5090)

Référence ancienne (V100)

Tendances des prix par fournisseur

Offre et disponibilité

Choisir un GPU et un fournisseur

Par charge de travail

Par durée

Économies avec les réservations

Spot vs à la demande

GPU methodology

Comment chaque graphique est calculé

FAQ

À quelle fréquence les prix sont-ils mis à jour ?

Pourquoi les prix des hyperscalers sont-ils 3-10x plus élevés que les tarifs neocloud pour le même GPU ?

Devrais-je utiliser la tarification spot ?

Les prix des contrats réservés et pluriannuels sont-ils inclus ?

Pour en savoir plus

Citer cette recherche

Lien avec attributionHTML, pour les billets de blog, articles LinkedIn et newsletters. Recommandé.

APA 7e éditionPour les articles universitaires et rapports d'analystes selon le style APA 7e.

BibTeXPour les documents LaTeX et les gestionnaires de références académiques.

Soyez le premier à commenter

À lire ensuite

Prix des vidéos IA: Comparez Synthesia et Invideo IA

Tarifs et plans d'authentification multifacteur (MFA)

Comparaison des tarifs de gestion des appareils mobiles: 10+ produits

Comparatif des prix des services de surveillance réseau

Comparatif des prix de la gestion des actifs informatiques (ITAM)

Prix des 6 meilleurs logiciels de gestion des services informatiques (ITSM)