Die On-Demand-Preise für Cloud-GPUs der neuesten Generation (B200, B300, MI300X, RTX 5090) haben sich im letzten Jahr etwa verdoppelt, während die Preise für Mainstream-Grafikkarten (H100, H200, A100) relativ stabil blieben. Wir erstellen den GPU-Index monatlich anhand von Daten von 58 Anbietern und 17 GPU-Modellen und berücksichtigen dabei On-Demand-, Spot- und Jahresreservierungstarife.
Preistrends nach GPU-Generation
Die Grafik zeigt den monatlichen Medianpreis der veröffentlichten Preise in drei Veröffentlichungszeiträumen. Wir haben 17 GPU-Modelle nach Veröffentlichungsdatum in drei Kategorien unterteilt:
Der Großteil des Anstiegs resultierte aus der Ausweitung der B200- und B300-Listings von Neocloud-Anbietern auf die Preislisten von Hyperscalern. Diese Hyperscaler-Listings sind typischerweise 2- bis 3-mal höher, wodurch der Median der Kategorie beim Eintreffen im Datensatz ansteigt.
Moderne GPUs verteuerten sich um ca. 25 %, diese Entwicklung ist jedoch größtenteils statistisch bedingt. Cloud nahm seine A3z Mega H100-Variante in die Standard-A3-Liste auf und hob damit den Medianpreis der H100-Modelle von ca. 2 $ auf ca. 3 $. Im Vergleich dazu sanken die Preise für NeoCloud H100-Modelle. Wir gehen im nächsten Abschnitt näher darauf ein.
Die Preise für ältere GPUs fielen im betrachteten Zeitraum von 1,78 $ auf 0,97 $, da die V100-Serie ihre wichtigsten Abnehmer im High-End-Bereich verlor, weil Unternehmen die entsprechenden Produkte ausmusterten. Nur noch ein oder zwei Anbieter pro älterer Grafikkarte sind in unserem Datensatz vertreten: AWS listet die K80 für 0,90 $, Vast.ai die P40 für 0,11 $, und die übrigen Modelle sind ähnliche Einzelangebote.
Der Vertragsmarkt entwickelte sich anders: Die einjährigen H100-Verträge verzeichneten im gleichen Zeitraum einen steigenden Trend, während der Medianwert für unsere On-Demand-H100-Verträge nahezu unverändert blieb. Dies deutet auf eine zunehmende Preisdifferenz zwischen monatlichen und einjährigen Vertragslaufzeiten hin.
Wie dies berechnet wird, erfahren Sie in unserer GPU-Indexierungsmethodik .
Preistrends nach GPU-Modell
Die folgende Tabelle behandelt die acht modernen GPUs.
Moderne GPUs (H100, A100, L4 und vergleichbare Modelle)
H100 wird von 36 Anbietern gelistet. Der Median der Kohorte sank von über 7 USD/GPU-Stunde Anfang 2024 auf unter 3 USD/GPU-Stunde im Jahr 2026. Die Notierungen Azure ND und Google Cloud A3 Mega erhöhen das obere Ende der Verteilung.
H200 ist im unteren Preissegment angesiedelt und liegt deutlich unter dem der übrigen Anbieter. Der von RunPod angegebene Preis für H200 beträgt nur einen Bruchteil des Medianpreises der Vergleichsgruppe, während der Preis des nächstplatzierten Anbieters um ein Vielfaches höher ist. Daher hängen Median und Preisspanne stark davon ab, ob das günstigste Angebot eine bestätigte Verfügbarkeit und eine vergleichbare Konfiguration aufweist.
Die Preise für A100 bewegen sich in einem engen Bereich innerhalb der Neocloud-Branche, wobei einige Serverless-Inferenz-Angebote den oberen Bereich anheben. Vergleichen Sie Serverless-Tarife getrennt von den stündlichen GPU-Tarifen für IaaS.
L40S, RTX 4090, A10G, T4 und L4 decken die Inferenzebene ab. Ihre Workloads überschneiden sich, darunter Inferenz unter 100 Byte, Generierung und Batch-Feinabstimmung, wodurch ein Preisvergleich relevant ist. Die geringe Preisspanne der A10G spiegelt wider, dass sie in unserer Liste praktisch eine AWS-exklusive SKU ist.
Zuletzt veröffentlichte GPUs (B200, B300, MI300X, RTX 5090)
Medianpreis B200: 5,50 $, Spanne: 3,75 $ (Packet AI) bis 14,24 $ (AWS). Medianpreis B300: 7,50 $, Spanne: 6,10 $ (Nebius) bis 17,80 $ (AWS). Medianpreis MI300X: 2,72 $, Spanne: 0,50 $ (RunPod) bis 7,86 $ (Azure). Medianpreis RTX 5090: 0,67 $, Spanne: 0,27 $ (Salad) bis 0,72 $ (Novita).
Die Preisgestaltung ähnelt der früheren H100-Preisstruktur: Angebote von Hyperscalern für neue Beschleuniger sind in der Anfangsphase etwa dreimal so hoch wie günstigere Angebote von Neocloud-Anbietern. Der MI300X ist bei RunPod und TensorWave unterhalb des unteren Preissegments der H100-Serie angesiedelt, jedoch kann für ROCm-basierte Workloads eine Validierung für CUDA-abhängige Anwendungen erforderlich sein.
Ältere GPUs (V100, P100, K80, M60, P40)
Die V100 ist weiterhin bei 16 Anbietern erhältlich (Median ca. 0,97 $), die P100 bei 5 (Median ca. 1,46 $), die K80 nur bei AWS (0,90 $) und die P40 nur bei Vast.ai (ca. 0,11 $). Ältere Modelle werden nur noch von wenigen Anbietern gelistet. Hyperscaler führen diese GPUs möglicherweise weiterhin für Kunden mit Kompatibilitäts-, Compliance- oder Migrationsbeschränkungen, während viele Neocloud-Anbieter sie nicht mehr anbieten. Für Neuinstallationen sind diese Karten weniger relevant, es sei denn, die Arbeitslast ist spezifisch von älterer Hardware, Treibern oder Softwareumgebungen abhängig.
Preistrends nach Anbieter
Bei gleicher GPU liegen die von Hyperscalern angegebenen Preise typischerweise 3- bis 6-mal höher als die niedrigsten Neocloud-Angebote im Datensatz. Die Angebotstiefe variiert je nach Anbieter, GPU, Region und Abrechnungsart.
Angebot und Verfügbarkeit
Das Angebot schwankt stärker als die angegebenen Preise. Die folgende Grafik zeigt den Anteil der heute verfügbaren, bestätigten Lagerbestände der einzelnen GPU-Angebote, sortiert von der geringsten bis zur größten Verfügbarkeit.
Die Verfügbarkeit des B300 liegt bei 6 %; die restlichen 94 % sind zwar gelistet, aber die Anbieter haben den Chip noch nicht zugesagt. MI300X und L40S erreichen 35–36 % und liegen damit unter dem Durchschnitt. H100, H200, A100 und B200 liegen bei etwa 41–51 %, wobei rund die Hälfte der Karten bereits auf Lager ist und die andere Hälfte von der Verfügbarkeit abhängt. RTX 4090 und RTX 5090 erreichen 86 %, was auf ein größeres Angebot an Consumer-Karten und eine geringere Nachfrage pro Karte im Unternehmensbereich hindeutet.
Wenn Ihr Projekt von einem bestimmten Chip der neuesten Generation abhängt, planen Sie die Beschaffungszeit zusätzlich zum Budget ein. Der Anteil der Wartelistenplätze bleibt nahezu null, da die meisten unbestätigten Angebote als „unbekannter Lagerbestand“ und nicht als „Warteliste“ geführt werden: Anbieter melden den Lagerbestand, nicht die Position in der Warteschlange.
Auswahl einer GPU und eines Anbieters
Die Wahl der GPU hängt von drei Faktoren ab: Arbeitslast, Dauer und Region. Die Preisgestaltung (Spot vs. On-Demand) kommt zu diesen drei Faktoren hinzu.
Nach Arbeitsbelastung
Nach Dauer
In weniger als einer Woche: Neocloud on-demand am unteren Ende des Spreads.
Mehrwöchige Laufzeiten: Fordern Sie ein Angebot an (Neoclouds gewähren in der Regel 15-30% Rabatt bei Laufzeiten von 4-12 Wochen; Hyperscaler bieten reservierte Tarife für 1 Jahr an).
Mehrjährige Verträge: Verhandeln Sie direkt mit den Anbietern, da die veröffentlichten On-Demand-Preise keine Rabatte für Vertragslaufzeiten beinhalten.
Reservierungsersparnisse
Der für ein Jahr reservierte Rabatt beträgt in der Regel 9-32 % des angegebenen On-Demand-Preises, wobei die größten Einsparungen bei AMD MI300X und dem Inference-Tier L40S zu erzielen sind, wo die Anbieter stärker um die zugesicherte Kapazität konkurrieren.
Für H100 und H200 gelten moderate Rabatte im einstelligen bis niedrigen zweistelligen Prozentbereich. Der On-Demand-Markt ist bereits so wettbewerbsintensiv, dass Anbieter für Vertragslaufzeiten nur geringe Margeneinbußen hinnehmen müssen. B200-Reservierungen werden mit -20 % Rabatt angeboten, MI300X mit -32 % und L40S mit -29 %. Die Grafik zeigt den anbieterübergreifenden Median für beide Abrechnungsstufen. Angebote einzelner Anbieter können bei mehrjährigen Laufzeiten, die hier nicht berücksichtigt sind, höhere Rabatte bieten.
Spot vs. On-Demand
Die Grafik zur Spot-Rabattübersicht zeigt den Median des Spot-Rabatts im Vergleich zum On-Demand-Rabatt nach Kategorie. In den letzten sechs Monaten ergaben sich Einsparungen von ca. 50 % bei modernen Karten, ca. 48 % bei zuletzt veröffentlichten Karten und ca. 77 % bei älteren Karten (die Preisentwicklung bei älteren Karten ist komplexer als es den Anschein hat; nur wenige Anbieter veröffentlichen noch Spot-Raten für diese Karten).
Wenn Ihre Arbeitslast Unterbrechungen von 5–15 Minuten toleriert, ist die Spot-Preisgestaltung der größte Kostenfaktor. Aktivieren Sie das Dropdown-Menü „Abrechnung“ im Explorer-Diagramm oben, um den Spot-Tarif mit dem On-Demand-Tarif für jeden Anbieter Ihrer Auswahlliste zu vergleichen.
GPU-Indexierungsmethodik
Der Index umfasst die veröffentlichten stündlichen Mietpreise für Cloud-GPUs in den Kategorien On-Demand, Spot und einjährige Reservierung (sofern von den Anbietern öffentlich angegeben). Er berücksichtigt keine mehrjährigen Verträge, individuell ausgehandelte Preise für Unternehmen, Kombinationen aus Spot- und Sparangeboten oder die Gesamtbetriebskosten.
Unsere Daten bestehen aus monatlichen Momentaufnahmen über 23 Monate (Juli 2024 bis Mai 2026), gefiltert nach 17 ausgewählten GPU-Modellen von 58 Anbietern. Jede Momentaufnahme enthält für jede Zelle (Anbieter, GPU, Abrechnungsart, Monat) den minimalen, maximalen, durchschnittlichen und medianen Stundensatz pro GPU sowie die Anzahl der zugehörigen Angebote.
Wie die einzelnen Diagramme berechnet werden
Wir verwenden durchgehend den Median der Mediane : Anbieter und GPUs werden in der Überschriftenzahl gleich gewichtet, sodass ein Anbieter mit 38 Einträgen einen Neueinsteiger mit 5 Einträgen nicht übertönt.
Marktübersicht (drei Kategorien):
Das Dropdown-Menü für die Abrechnung führt die Schritte 2 und 3 für die ausgewählte Tarifstufe (On-Demand, Spot oder Reservierung) erneut aus. Eine vierte Option namens „Durchschnitt“ zeigt den arithmetischen Mittelwert der Medianwerte der drei Tarifstufen pro Kategorie und Monat an, beschränkt auf Monate, in denen für alle drei Tarifstufen Daten vorliegen.
Anbieter × Abrechnungs-Explorer:
Für den von Ihnen gewählten Anbieter und Tarif stellt jede Linie den monatlichen Medianpreis einer GPU im Zeitverlauf dar. Es erfolgt keine anbieterübergreifende Aggregation: Der jeweilige Wert entspricht dem Medianpreis aller Angebote dieses Anbieters für die betreffende GPU und den gewählten Tarif. Die Linie endet, sobald das Angebot nicht mehr im Katalog verfügbar ist.
Moderne GPUs im Vergleich:
Schritte 1–2 entsprechen der Marktübersicht, jedoch beschränkt auf On-Demand-Preise. Jede Zeile stellt den anbieterübergreifenden monatlichen Median für eine GPU dar. Keine GPU-übergreifende Aggregation. Acht Datenreihen.
Spot-Rabatt-Tracker:
Hierbei wird jeder Spotpreis mit seinem On-Demand-Pendant desselben Anbieters, derselben GPU und desselben Monats verglichen, sodass der Rabatt die tatsächliche Spanne widerspiegelt, die ein Käufer bei diesem Anbieter sehen würde, und nicht eine marktübergreifende Rauschdifferenz.
Verfügbarkeits-Snapshot:
Nur Momentaufnahme, keine Zeitaggregation. Einträge, die als unbekannter Bestand, Warteliste oder nicht verfügbar gemeldet werden, werden zwar im Nenner berücksichtigt, aber nicht separat im Diagramm dargestellt, da das für den Käufer relevante Signal die bestätigte Verfügbarkeit der Aktie ist.
Reservierungsersparnisse:
FAQs
Wir veröffentlichen jeden Monat eine aktualisierte Übersicht der monatlichen Medianwerte. Die Zahlen spiegeln die Daten des Vormonats wider.
Die GPU ist dieselbe, das Paket jedoch nicht. Hyperscaler berechnen ihre Preise anhand der Einhaltung von Standards (HIPAA, SOC 2, FedRAMP), SLAs für Unternehmen, Identitäts- und Netzwerkintegration sowie 24/7-Support. Neoclouds hingegen bieten Bare-Metal- oder VM-Zugriff mit optionaler Managed Orchestration. Wenn Sie das Paket nicht benötigen, ist der Preisvergleich mit Neocloud aussagekräftiger.
Ja, wenn Ihre Arbeitslast Checkpoints verwendet und Unterbrechungen von 5–15 Minuten toleriert. Aktuelle GPU-Spot-Rabatte liegen seit sechs Monaten bei fast 50 %, und die Einsparungen summieren sich bei mehrtägigem Training. Spot ist jedoch nicht die richtige Wahl für latenzkritische Inferenz, Single-Replica-Dienste ohne Failover oder Evaluierungsläufe, die einen direkten Vergleich mit der Echtzeit erfordern.
Die Preistrends im Diagramm nach Anbieter können über das Dropdown-Menü zwischen On-Demand-, Spot- und einjährigen Reservierungstarifen umgeschaltet werden, sofern die Anbieter diese Tarife veröffentlichen. Mehrjährige Verträge und Unternehmensrabatte sind nicht enthalten. Fordern Sie hierfür ein Angebot direkt beim Anbieter an.
Weiterführende Literatur
- Multi-GPU-Benchmark: B200 vs. H200 vs. H100 vs. MI300X
- Die 30 besten Cloud-GPU-Anbieter und ihre GPUs
- GPU-Parallelitäts-Benchmark
- Die Top 25+ KI-Chip-Hersteller: NVIDIA & seine Wettbewerber
Diese Forschung zitieren
Wählen Sie das Format, das zu Ihrem Veröffentlichungsort passt. Wenn Sie die Link-Version in Ihr CMS einfügen, bleibt der Backlink erhalten.
@misc{sar2026,
author = {Sarı, Ekrem},
title = {{Preisindex für Cloud-GPU-Miete}},
year = {2026},
month = may,
howpublished = {\url{https://aimultiple.com/gpu-index}},
note = {AIMultiple. Retrieved Mai 20, 2026}
}
Seien Sie der Erste, der kommentiert
Ihre E-Mail-Adresse wird nicht veröffentlicht. Alle Felder sind erforderlich.