Contactez-nous
Aucun résultat trouvé.

Modèles de GPU

Dernière mise à jour : Feb 2026

Rang
Modèle
Profiter.
VRAM
NW
Coût
NVIDIA
NVIDIA
Libéré: 2024

B200 SXM

1st
Classement
$4.89
Verda Cloud
1st
Classement
$4.89
Verda Cloud

Performances de référence

Rang
Catégorie
Performance
7th
Inférence d'images (efficacité)
79k token/$
1st
Inférence d'images (débit)
110 token/s
7th
Réglage fin de l'image (efficacité)
82k image/$
1st
Réglage fin de l'image (débit)
114 image/s
3rd
Inférence textuelle (efficacité)
23M token/$
1st
Inférence textuelle (débit)
33k token/s
4th
Optimisation du texte (efficacité)
13M image/$
1st
Réglage fin du texte (débit)
18k image/s

Spécifications techniques

Blackwell
Architecture
192 GB
Mémoire
8.20 TB/s
Bande passante
1,000 W
TDP
75 TFLOPS
Performances FP32
2,250 TFLOPS
Performances du BF16

Tarification des fournisseurs par région

Fournisseur
/ Région
Prix/heure
Verda Cloud
/ North Europe
$4.89 (x1 GPU)
Runpod
/ East Europe
$4.99 (x1 GPU)
Lambda
/ Australia & New Zealand
$5.29 (x1 GPU)
Vultr
/ Not Specified
$23.92 (x8 GPUs)
Cirrascale
/ North America
$47.92 (x8 GPUs)
Coreweave
/ Not Specified
$68.80 (x8 GPUs)

FAQ

Cette page vous permet de comparer les caractéristiques techniques et les prix des différents modèles. Pour une vue d'ensemble plus complète du marché, basée sur le rapport performance/prix, vous pouvez consulter notre analyse comparative détaillée des GPU cloud , qui compare différents fournisseurs et modèles de tarification pour diverses charges de travail d'IA.

Une instance GPU Cloud, sujet de cette page, consiste à louer un serveur virtuel doté d'un GPU dédié à l'heure. Vous bénéficiez ainsi d'un accès continu au matériel, ce qui est idéal pour les tâches de longue durée comme l'entraînement de modèles ou les charges de travail prévisibles. Vous trouverez une comparaison plus détaillée des fournisseurs dans notre principal comparatif de GPU Cloud .

Un GPU sans serveur est un modèle différent où vous ne payez qu'à la seconde, pour le temps d'exécution effectif de votre code, sans avoir à gérer de serveurs. Ce modèle est particulièrement rentable pour les tâches à trafic variable, comme les API d'inférence. Si ce modèle correspond à vos besoins, vous pouvez comparer les fournisseurs sur notre plateforme de test dédiée aux GPU sans serveur .

Bien que NVIDIA soit actuellement leader du marché, des entreprises comme AMD et Intel sont de sérieux concurrents, et les fournisseurs de services cloud tels qu'AWS et Google produisent également leurs propres puces personnalisées. Vous trouverez plus d'informations sur les principaux fabricants de puces IA et le paysage industriel dans son ensemble dans notre rapport détaillé.

La décision dépend de facteurs tels que l'expertise de votre équipe, la prévisibilité de la charge de travail et votre budget à long terme. Notre guide comparatif des GPU (achat ou location) analyse les avantages et les inconvénients de chaque option afin de vous aider à faire le choix stratégique le plus adapté à votre entreprise.

Ce score mesure le rapport coût-efficacité d'un GPU. Il indique le nombre de millions (M) de jetons ou d'images que vous obtenez pour chaque dollar américain dépensé, combinant vitesse et prix en une seule valeur de performance par dollar. Pour tous les tests de performance présentés sur cette page, un score plus élevé est toujours préférable, car cela signifie que vous en avez plus pour votre argent.

L'inférence mesure l'efficacité de l'utilisation d'un modèle pré-entraîné pour générer du nouveau contenu (texte ou images). Un score d'inférence élevé est essentiel pour un fonctionnement fluide et économique d'applications telles que les chatbots ou les générateurs d'art IA.

L'entraînement (ou le réglage fin) mesure l'efficacité de la personnalisation d'un modèle existant avec vos propres données. Un score d'entraînement élevé est important si vous devez créer rapidement et à moindre coût des modèles spécialisés.

Performances textuelles (mesurées en jetons/$) : ces scores sont pertinents pour les charges de travail linguistiques. Choisissez un GPU avec des scores textuels élevés pour des tâches telles que l’exécution de grands modèles de langage (LLM), la création de contenu et la génération de code.

Performances d'image (mesurées en images/$) : ces scores sont pertinents pour les charges de travail visuelles. Choisissez un GPU avec des scores d'image élevés pour des tâches telles que la génération d'images IA, la reconnaissance d'objets ou la création de données d'images synthétiques.