Funktionsvergleich

Cloud GPU-Mietpreisindex

aktualisiert am 6. Juli 2026

On-Demand-Preise für Cloud-GPUs der neuesten Generation (B200, B300, MI300X, RTX 5090) haben sich im vergangenen Jahr etwa verdoppelt, während Mainstream-Karten (H100, H200, A100) in einem engen Korridor blieben. Wir stellen den GPU-Index monatlich aus 63 Anbietern und 17 GPU-Modellen zusammen und decken On-Demand-, Spot- und 1-Jahres-Reservierungsstufen ab.

Preistrends nach GPU-Generation

Billing type

Loading Chart

Die Grafik zeigt den monatlichen Median-Preis über drei Zeitfenster der Markteinführung hinweg. Wir unterteilen 17 GPU-Modelle in drei Kategorien nach Einführungsdatum:

Kategorie	GPUs	Rolle
Zuletzt veröffentlicht (2024 und später)	B200, B300, MI300X, RTX 5090	Kohorte der neuesten Generation
Modern (2020 bis 2023)	H100, H200, A100, L40S, RTX 4090, A10G, T4, L4	Mainstream-Workload-Runner
Legacy (vor 2020)	V100, P100, K80, M60, P40	Noch mietbar, hauptsächlich Community-Neoclouds

Der Großteil des Anstiegs stammt von B200- und B300-Listings, die von Neocloud-Anbietern auf Hyperscaler-Preisblätter ausgeweitet wurden. Diese Hyperscaler-Listings sind typischerweise 2x-3x höher und erhöhen den Kategorie-Median, sobald sie in den Datensatz aufgenommen werden.

Moderne GPUs kletterten um ~25%, was jedoch überwiegend statistisch bedingt ist. Google Cloud fügte seine A3z-Mega-H100-Variante dem Standard-A3-Listing hinzu, wodurch der H100-Kohortenmedian von ca. 2 $ auf ca. 3 $ stieg. Unterdessen sanken die Neocloud-H100-Preise. Wir weisen im nächsten Abschnitt darauf hin.

Legacy-GPUs fielen im Betrachtungszeitraum von $1.78 auf $0.99, bedingt durch den Verlust hochpreisiger Hyperscaler-Anker der V100-Kohorte, da Unternehmen die SKU ausmustern. Ein oder zwei Anbieter pro Legacy-Karte verbleiben in unserem Datensatz: AWS listet K80 zu $0.90, P40 liegt bei Vast.ai bei $0.11, und der Rest sind ähnliche Einzelangebots-Randfälle.

Der Vertragsmarkt bewegte sich anders: 1-Jahres-H100-Verpflichtungen stiegen im gleichen Zeitraum, während unser On-Demand-H100-Median etwa gleich blieb. Dies zeigt eine zunehmende Kluft zwischen monatlicher und 1-Jahres-gebundener Preisgestaltung.

Siehe unsere GPU-Index-Methodik zur Berechnung.

Preistrends nach GPU-Modell

Die folgende Grafik deckt 10 GPUs ab: 5 moderne, 4 zuletzt veröffentlichte und die V100 als Legacy-Referenz.

Moderne GPUs (H100, H200, A100, L40S, RTX 4090)

IONOS deckt diese Ebene aus der EU ab: On-Demand T4, A10 und RTX PRO 6000 Blackwell sowie dedizierte H100- und H200-Server zu einem einheitlichen $3.990/Monat mit EU-Datenresidenz.

H100 wird von 46 Anbietern gelistet, die breiteste Verfügbarkeit aller aktuellen Beschleuniger. Der Kohortenmedian liegt jetzt bei etwa $2.99/GPU-Stunde, gegenüber über 7 $ Anfang 2024. Thunder Compute, Vast.ai und RunPod bilden das untere Ende der Spanne; Microsoft Azure und Google Cloud reichen bis über $10 hinaus. Die Google Cloud-Zeile selbst ist eine Mischung aus drei SKUs (a3-highgpu, a3-megagpu, a3-edgegpu), die unter einem nvidia-h100-Label zusammengeführt sind, was den Kohortenmedian erhöht.

Die H200-Spanne reicht von $2.30 (FluidStack) bis $13.78 (Microsoft Azure), mit einem Kohortenmedian um $4.00. Die Untergrenze hängt davon ab, ob man Community-Einstiegs- oder Instanzfreigabe-Angebote als mit dedizierter Kapazität vergleichbar betrachtet. Werden diese ausgeklammert, liegt der Arbeitsmedian im Bereich 3-4 $.

Die A100 bewegt sich in einem engen Neocloud-Band um $1.79, mit ein oder zwei Serverless-Inferenz-Ausreißern (Replicate zu $5.04), die das obere Ende anheben. Serverless-Raten sollten beim Vergleich von IaaS-Anbietern separat betrachtet werden.

Die L40S hat sich um einen Median von $1.56 eingependelt, mit AWS bei $7.58 als Obergrenze. Die RTX 4090 ist die günstigste Trainingsklasse im Index mit einem Median von $0.52, wobei Salad mit $0.18 und Beam mit $1.61 die Spanne umrahmen. Beide zielen auf Inferenz unter 100B und Batch-Fine-Tuning ab, wo sie oft die A100 zu einem Bruchteil des Preises ersetzen.

Zuletzt veröffentlichte GPUs (B200, B300, MI300X, RTX 5090)

B200 Median $6.11, Spanne $3.44 (Vast.ai) bis $16.11 (Google Cloud). B300 Median $7.92, Spanne $5.44 (Vast.ai) bis $18.00 (Oracle Cloud). MI300X Median $2.72, Spanne $1.99 (DigitalOcean) bis $7.86 (Microsoft Azure). RTX 5090 Median $0.66, Spanne $0.27 (Salad) bis $2.00 (Vast.ai).

Das Muster wiederholt die frühere Kurve der H100: Hyperscaler führen neue Beschleuniger im ersten Jahr mit dem 3-5x-fachen der Neocloud-Baseline ein. B300 steigt im Diagramm noch an, da weitere Hyperscaler-Listings den Median weiter erhöhen. Die MI300X ist der Versorgungsausreißer; sie liegt bei DigitalOcean und TensorWave unter der H100-Untergrenze, läuft jedoch unter ROCm, und nicht jede CUDA-Workload lässt sich sauber portieren.

Legacy-Referenz (V100)

Die V100, als Legacy-Karte im Diagramm, dient als Referenzlinie der 2017er-Generation. Der Kohortenmedian fiel von $1.84 Mitte 2024 auf heute rund $0.99 bei 17 Anbietern. Hyperscaler behalten V100-SKUs für Compliance-Kunden mit unveränderlichen Workloads; Neoclouds haben sie größtenteils fallengelassen.

Preistrends nach Anbieter

Für dieselbe GPU liegen die veröffentlichten Hyperscaler-Preise typischerweise 3x-6x höher als die niedrigsten Neocloud-Angebote im Datensatz. Die Katalogtiefe variiert je nach Anbieter, GPU, Region und Abrechnungsart.

Angebot und Verfügbarkeit

Das Angebot variiert stärker als die Listenpreise. Die folgende Grafik zeigt den Anteil der Listings jeder GPU, die heute bestätigten Bestand melden, sortiert von der knappsten zur verfügbarsten.

MI300X und L40S sind mit 44% am knappsten, gefolgt von B200 und B300 mit 52-54%. H100, A100 und H200 liegen bei 63-70%, wobei etwa zwei Drittel des Katalogs bestätigter Bestand sind und der Rest provisioningabhängig. RTX 4090 und RTX 5090 erreichen 93-97%, was das tiefere Angebot an Consumer-Karten und die geringere unternehmensseitige Nachfrage widerspiegelt.

article.automate_process_description

article.automate_process_button

Auswahl einer GPU und eines Anbieters

Die GPU-Wahl wird von drei Achsen bestimmt: Workload, Dauer und Region. Spot- versus On-Demand-Preisgestaltung legt sich über alle drei.

Nach Workload

Workload	Empfohlene GPU	Anbieterebene	Warum
LLM-Inferenz, 7-13B-Modelle	L4, L40S	Neocloud	Unter 2 $/Std., inferenzoptimiert
LLM-Inferenz, 30-70B	A100 80GB, H100	Neocloud	VRAM passt, H100 für strenge Latenz-SLA
LLM-Inferenz, 70B+ speichergebunden	H200, MI300X	Neocloud	141-192 GB HBM ermöglicht größeren KV-Cache
Fine-Tuning 7-13B	A100, H100	Neocloud	Kosteneffizient, breit verfügbar
Training großer Modelle von Grund auf	H100, B200 Multi-Node	Hyperscaler oder große Neoclouds	Multi-GPU-HBM und schnelles Interconnect
Experimentieren, Prototyping	T4, A10G, L4, RTX 4090	Community-Neocloud	Günstig pro Stunde, schnell bereitstellbar
Regulierte Produktion (HIPAA/SOC2/FedRAMP)	Jede der obigen	Hyperscaler	Compliance-Zertifizierungen

Nach Dauer

Unter einer Woche: Neocloud On-Demand am unteren Ende der Spanne.

Mehrere Wochen: Fordern Sie ein Angebot an (Neoclouds gewähren typischerweise 15-30% Rabatt für 4-12-Wochen-Verpflichtungen; Hyperscaler bieten 1-Jahres-Reservierung).

Mehrjährig: verhandeln Sie direkt mit den Anbietern, da veröffentlichte On-Demand-Preise keine Rabatte für langfristige Bindungen abbilden.

Reservierungseinsparungen

Der 1-Jahres-Reservierungsrabatt beträgt typischerweise 16-39% auf den veröffentlichten On-Demand-Preis, mit den höchsten Einsparungen bei B200, AMD MI300X und der Inferenzstufe L40S, wo Anbieter stärker um gebundene Kapazität konkurrieren.

H100 und H200 erhalten bescheidene einstellige bis niedrige zweistellige Rabatte; ihr On-Demand-Markt ist ausreichend wettbewerbsfähig, sodass Anbieter keine Margen für Verpflichtungen opfern. B200 sichert sich -39%, MI300X -31%, L40S -30%. Das Diagramm zeigt den anbieterübergreifenden Median für beide Abrechnungsebenen; individuelle Anbieterangebote können für mehrjährige Laufzeiten tiefer liegen, was hier nicht berücksichtigt ist.

Spot vs. On-Demand

Das Diagramm des Spot-Rabatt-Trackers zeigt den mittleren Spot- vs. On-Demand-Rabatt nach Kategorie. In den letzten sechs Monaten spart Modern ~50%, Last released ~49%, Legacy ~75% (Legacy ist verrauschter, als es scheint; nur noch wenige Anbieter veröffentlichen Spot-Raten für diese Karten).

Wenn Ihr Workload 5-15 Minuten Unterbrechung verträgt, ist Spot der größte verfügbare Kostenhebel. Schalten Sie die Abrechnungs-Dropdown-Liste im Explorer-Diagramm oben um, um den Spot-Preis neben dem On-Demand-Preis für jeden Anbieter auf Ihrer Shortlist zu sehen.

GPU-Index-Methodik

Der Index deckt stündliche Cloud-GPU-Mietpreise der Stufen On-Demand, Spot und 1-Jahres-Reservierung ab (sofern Anbieter diese öffentlich listen). Mehrjährige Verträge, unternehmensspezifisch ausgehandelte Raten, Spot-plus-Savings-Plan-Kombinationen oder Total Cost of Ownership sind nicht enthalten.

Unsere Daten sind monatliche Momentaufnahmen über 24 Monate (Juli 2024 bis Juni 2026), gefiltert auf 17 kuratierte GPU-Modelle bei 63 Anbietern. Jede Momentaufnahme liefert für jede (Anbieter, GPU, Abrechnungsart, Monat)-Zelle den Min-, Max-, Mittelwert und Median pro GPU und Stunde sowie die dahinterstehenden Angebotszahlen.

H100-, A100-, H200-, B200-, B300- und V100-Preise sind Mediane über mehrere physische Versionen der Karte (PCIe, SXM- oder NVL-Interconnect; bei A100 und V100 auch 40/80 GB bzw. 16/32 GB VRAM), die Anbieter unter einem Namen listen.

Berechnung der einzelnen Diagramme

Wir verwenden durchgehend Median-der-Mediane: Anbieter und GPUs gehen jeweils mit gleichem Gewicht in die Schlagzeile ein, sodass ein Anbieter mit 38 Listings einen Neuling mit 5 Listings nicht übertönt.

Marktübersicht (drei Kategorielinien):

1Step 1  For each provider + GPU + billing tier + month, take the median price.
2Step 2  Take the median across providers, leaving one value per GPU + billing tier + month.
3Step 3  Take the median across GPUs in the same category, leaving one value per category + billing tier + month.

Die Abrechnungs-Dropdown-Liste wiederholt die Schritte 2-3 für die gewählte Stufe (On-Demand, Spot oder Reservierung). Eine vierte Option „Durchschnitt“ zeigt das arithmetische Mittel der drei Stufenmediane pro Kategorie und Monat, beschränkt auf Monate, in denen alle drei Stufen Daten aufweisen.

Anbieter × Abrechnung Explorer:

Für den ausgewählten Anbieter und die Abrechnungsstufe zeichnet jede Linie den monatlichen Median einer GPU im Zeitverlauf nach. Es erfolgt keine anbieterübergreifende Aggregation: Jeder Monatspunkt ist der Medianpreis über die Listings dieses Anbieters für diese GPU und Abrechnungsstufe. Die Linie endet, wo das Angebot aus dem Katalog verschwindet.

Moderne GPUs nebeneinander:

Gleiche Schritte 1-2 wie bei der Marktübersicht, bezogen auf On-Demand-Preise. Jede Linie ist der anbieterübergreifende monatliche Median für eine GPU. Keine GPU-übergreifende Aggregation. Acht Serien.

Spot-Rabatt-Tracker:

1Step 1  Keep the provider + GPU + month cells where both an on-demand and a spot price exist.
2Step 2  Per cell, compute: discount % = (on-demand − spot) / on-demand × 100.
3Step 3  Per GPU per month, take the median discount across providers.
4Step 4  Per category per month, take the median discount across GPUs.

Dieser stellt jedem Spot-Preis seinen On-Demand-Gegenpart vom selben Anbieter, für dieselbe GPU und denselben Monat gegenüber, sodass der Rabatt die tatsächliche Spanne widerspiegelt, die ein Käufer bei diesem Anbieter sähe, und keinen marktübergreifenden Rauschunterschied.

Verfügbarkeits-Snapshot:

1Step 1  Take the current snapshot of listings, one row per provider + SKU + billing tier.
2Step 2  Per GPU, compute: % available = confirmed listings / total listings × 100.
3Step 3  Sort GPUs ascending by % available, so tightest supply appears leftmost.

Nur Momentaufnahme, keine zeitliche Aggregation. Listings mit unbekanntem Bestand, Warteliste oder nicht verfügbar werden zwar im Nenner gezählt, aber nicht separat im Diagramm dargestellt, da die handlungsrelevante Kennzahl der Anteil bestätigter Verfügbarkeit ist.

Reservierungseinsparungen:

1Step 1  Filter the latest weekly snapshot to on-demand and reservation listings.
2Step 2  Per GPU per tier, take the median of cross-provider monthly medians.
3Step 3  Pair the two tiers per GPU and render as grouped bars.

Verpassen Sie nicht unsere Benchmarks und datengestützten Erkenntnisse. Die Schaltfläche öffnet Google; die Auswahl von AIMultiple bestätigt, dass Sie AIMultiple häufiger in den Google-Suchergebnissen sehen möchten.

Als bevorzugte Quelle hinzufügen

FAQs

Wir veröffentlichen jeden Monat eine aktualisierte monatliche Median-Ansicht. Die Zahlen spiegeln die Daten bis zum Vormonat wider.

Die GPU ist dieselbe; das Bundle nicht. Hyperscaler preisen Compliance (HIPAA, SOC 2, FedRAMP), Unternehmens-SLAs, Identitäts- und Netzwerkintegration sowie 24/7-Support ein. Neoclouds bepreisen Bare Metal oder VM-Zugang mit optionaler Managed-Orchestrierung. Wenn Sie das Bundle nicht benötigen, ist der Neocloud-Preis der passende Vergleich.

Ja, wenn Ihr Workload Checkpoints setzt und 5-15 Minuten Unterbrechung verträgt. Der Spot-Rabatt für moderne GPUs lag in den letzten sechs Monaten bei rund 50%, und die Einsparungen summieren sich bei mehrtägigem Training. Falsch ist Spot für latenzempfindliche Inferenz, Einzelreplika-Dienste ohne Failover oder Evaluierungsläufe, die einen sauberen Wall-Clock-Vergleich benötigen.

Die Dropdown-Liste im Preistrend-nach-Anbieter-Diagramm wechselt zwischen On-Demand, Spot und 1-Jahres-Reservierung, sofern Anbieter diese Raten veröffentlichen. Mehrjährige Verträge und unternehmensspezifisch ausgehandelte Rabatte sind nicht enthalten. Fordern Sie dafür direkt ein Angebot beim Anbieter an.

Weiterführende Informationen

Diese Forschung zitieren

Wählen Sie das Format, das zu Ihrem Veröffentlichungsort passt. Wenn Sie die Link-Version in Ihr CMS einfügen, bleibt der Backlink erhalten.

Ekrem Sarı (2026) - "Cloud GPU-Mietpreisindex". Online veröffentlicht auf AIMultiple.com. Abgerufen am 6. Juli 2026, von: https://aimultiple.com/gpu-index [Online-Ressource]

Sarı, E. (2026, 6. Juli). Cloud GPU-Mietpreisindex. AIMultiple. https://aimultiple.com/gpu-index

@misc{sar2026,
  author = {Sarı, Ekrem},
  title  = {{Cloud GPU-Mietpreisindex}},
  year   = {2026},
  month  = jul,
  howpublished    = {\url{https://aimultiple.com/gpu-index}},
  note   = {AIMultiple. Abgerufen am 6. Juli 2026}
}

Ekrem Sarı

KI-Forscher

Folgen auf

Ekrem ist KI-Forscher bei AIMultiple und konzentriert sich auf intelligente Automatisierung, GPUs, KI-Agenten und RAG-Frameworks.

Vollständiges Profil anzeigen