Dienstleistungen
Kontaktieren

Cloud GPU Mietpreisindex

Ekrem Sarı
Ekrem Sarı
aktualisiert am 17. Juni 2026

On-Demand-Sätze für Cloud GPUs der neuesten Generation (B200, B300, MI300X, RTX 5090) haben sich im vergangenen Jahr ungefähr verdoppelt, während Mainstream-Karten (H100, H200, A100) in einem engen Bereich blieben. Wir erstellen den GPU-Index monatlich aus 58 Anbietern und 17 GPU-Modellen und decken On-Demand-, Spot- und 1-Jahres-Reservierungsebenen ab.

Preisentwicklungen nach GPU-Generation

Loading Chart

Die Abbildung zeigt den monatlichen Median der veröffentlichten Preise über drei Veröffentlichungsdatums-Gruppen. Wir unterteilen 17 GPU-Modelle nach Erscheinungsdatum in drei Kategorien:

Der Großteil der Erhöhung resultierte aus B200- und B300-Angeboten, die sich von Neocloud-Anbietern auf Hyperscaler-Preislisten ausweiteten. Diese Hyperscaler-Angebote sind typischerweise 2-3-mal höher und erhöhen den Kategorie-Median, wenn sie in den Datensatz aufgenommen werden.

Moderne GPUs stiegen um ca. 25 %, aber diese Bewegung ist weitgehend statistisch. Google Cloud hat seine A3z Mega H100-Variante zur Standard-A3-Liste hinzugefügt, wodurch der Median der H100-Kohorte von ca. 2 $ auf ca. 3 $ stieg. Darunter tendierten Neocloud H100 nach unten. Wir weisen im nächsten Abschnitt darauf hin.

Legacy GPUs sanken im betrachteten Zeitraum von 1,78 $ auf 0,97 $, getrieben durch die V100-Kohorte, die ihre High-End-Hyperscaler-Anker verlor, da Unternehmen das SKU außer Betrieb nehmen. Nur ein oder zwei Anbieter pro Legacy-Karte verbleiben in unserem Datensatz: AWS listet K80 bei 0,90 $, P40 liegt bei Vast.ai bei 0,11 $, und der Rest sind ähnliche Einzelfall-Edge-Cases.

Der Vertragsmarkt bewegte sich anders: 1-Jahres H100-Verpflichtungen stiegen im selben Zeitraum, während unser On-Demand H100-Median etwa flach blieb. Dies zeigt eine sich vergrößernde Differenz zwischen monatlicher und 1-Jahres-Verpflichtungspreisgestaltung.

Siehe unsere GPU-Index-Methodik, wie dies berechnet wird.

Preisentwicklungen nach GPU-Modell

Die folgende Abbildung umfasst 10 GPUs: 5 Modern, 4 Zuletzt veröffentlicht und die V100 als Legacy-Referenz.

Moderne GPUs (H100, H200, A100, L40S, RTX 4090)

H100 wird von 37 Anbietern angeboten, die breiteste Palette aller aktuellen Beschleuniger. Der Kohorten-Median liegt nun bei ca. 2,95 $/GPU-Stunde, gegenüber über 7 $ Anfang 2024. Thunder Compute, Vast.ai und RunPod liegen am unteren Ende der Spanne; Microsoft Azure und Google Cloud tragen den oberen Teil über 10 $. Die Google Cloud-Zeile ist selbst eine Mischung aus drei SKUs (a3-highgpu, a3-megagpu, a3-edgegpu), die unter einem Nvidia-H100-Label zusammengefasst sind, was ihren Kohorten-Median anhebt.

Die Spanne von H200 reicht von 2,29 $ (Theta EdgeCloud) bis 13,78 $ (Microsoft Azure), mit einem Kohorten-Median von ca. 3,39 $. Der Boden hängt davon ab, ob Sie Community-Tier- oder Instance-Sharing-Angebote als vergleichbar mit dedizierter Kapazität betrachten. Sobald diese beiseitegelegt sind, liegt der Arbeitsmedian im Bereich von 3-4 $.

A100 hält einen engen Neocloud-Bereich um 1,62 $, wobei ein oder zwei Serverless-Inference-Ausreißer (Replicate bei 5,04 $) den oberen Teil nach oben ziehen. Behandeln Sie Serverless-Sätze separat beim Vergleich von IaaS-Anbietern.

L40S hat sich um einen Median von 1,55 $ eingependelt, wobei AWS mit 7,58 $ die Obergrenze setzt. RTX 4090 ist die günstigste Trainingsklasse-Karte im Index mit einem Median von 0,44 $, wobei Salad mit 0,18 $ und Beam mit 1,61 $ die Spanne begrenzen. Beide zielen auf Inferenz unter 100B und Batch-Fine-Tuning ab, wo sie oft A100 zu einem Bruchteil des Preises ersetzen.

Zuletzt veröffentlichte GPUs (B200, B300, MI300X, RTX 5090)

B200-Median 5,24 $, Spanne 3,75 $ (Packet AI) bis 14,24 $ (AWS). B300-Median 6,99 $, Spanne 6,10 $ (Nebius) bis 18,00 $ (Oracle). MI300X-Median 1,99 $, Spanne 1,99 $ (RunPod) bis 7,86 $ (Azure). RTX 5090-Median 0,69 $, Spanne 0,27 $ (Salad) bis 1,34 $ (Vast.ai).

Das Muster wiederholt sich von der früheren Kurve des H100: Hyperscaler tragen neue Beschleuniger im ersten Jahr mit 3-5-fachen Neocloud-Böden. B300 ist die einzige Linie auf dem Diagramm, die noch steigt, da zusätzliche Hyperscaler-Angebote den Median weiter erhöhen. MI300X ist der Angebotsausreißer; RunPod und TensorWave preisen es unter dem H100-Boden, aber es läuft auf ROCm und nicht jede CUDA-Workload lässt sich sauber portieren.

Legacy-Referenz (V100)

V100 ist die einzige Legacy-Karte auf dem Diagramm, enthalten als Referenzlinie der Generation 2017. Der Kohorten-Median sank von 1,84 $ Mitte 2024 auf ca. 0,97 $ heute über 18 Anbieter. Hyperscaler halten V100-SKUs für Compliance-Kunden aufrecht, die unveränderliche Workloads ausführen; Neoclouds haben sie größtenteils fallen gelassen.

Preisentwicklungen nach Anbieter

Für dieselbe GPU sind von Hyperscalern veröffentlichte Preise typischerweise 3-6-mal höher als die niedrigsten Neocloud-Angebote im Datensatz. Die Katalogtiefe variiert je nach Anbieter, GPU, Region und Abrechnungsart.

Versorgung und Verfügbarkeit

Die Versorgung variiert stärker als die Kopfpreisgestaltung. Die folgende Abbildung zeigt den Anteil der GPU-Angebote, die heute bestätigten Bestand melden, sortiert von am knappsten bis am meisten verfügbar.

B300 liegt bei 6 % bestätigt; die verbleibenden 94 % sind aufgelistet, aber Anbieter versprechen den Chip noch nicht. MI300X und L40S liegen bei 35-36 %, enger als die Mainstream-Ebene. H100, H200, A100 und B200 gruppieren sich nahe 41-51 %, wobei etwa die Hälfte des Katalogs bestätigter Bestand und die Hälfte von der Bereitstellung abhängig ist. RTX 4090 und RTX 5090 erreichen 86 %, was auf ein tieferes Angebot an Consumer-Karten und eine geringere Nachfrage pro Karte im Unternehmensbereich hinweist.

Wenn Ihr Projekt von einem spezifischen Chip der neuesten Generation abhängt, planen Sie die Beschaffungszeit zusätzlich zum Budget ein. Der Wartelistenanteil bleibt nahe Null, da die meisten nicht bestätigten Angebote als „unbekannter Bestand" und nicht als „Warteliste" verfolgt werden: Anbieter melden den Bestandsstatus, nicht die Warteschlangenposition.

Auswahl einer GPU und eines Anbieters

Die GPU-Auswahl wird durch drei Achsen geprägt: Workload, Dauer und Region. Spot- vs. On-Demand-Preisgestaltung liegt über allen drei.

Nach Workload

Nach Dauer

Unter einer Woche: Neocloud On-Demand am unteren Ende der Spanne.

Mehrere Wochen: Fordern Sie ein Angebot an (Neoclouds gewähren typischerweise 15-30 % Rabatt für 4-12-wöchige Verpflichtungen; Hyperscaler bieten 1-Jahres-Reservierungsebenen an).

Mehrere Jahre: Verhandeln Sie direkt mit Anbietern, da veröffentlichte On-Demand-Sätze keine Rabatte für festgelegte Laufzeiten abbilden.

Einsparungen bei Reservierungen

Der 1-Jahres-Reservierungsrabatt liegt typischerweise bei 9-32 % unter dem veröffentlichten On-Demand-Satz, wobei die stärkeren Einsparungen bei AMD MI300X und der Inferenz-Ebene L40S liegen, wo Anbieter härter um festgelegte Kapazitäten konkurrieren.

H100 und H200 verzeichnen moderate Rabatte im einstelligen bis niedrigen zweistelligen Bereich; ihr On-Demand-Markt ist bereits wettbewerbsfähig genug, dass Anbieter nicht viel Marge für Verpflichtungen opfern. B200-Reserven bei -20 %, MI300X bei -32 %, L40S bei -29 %. Das Diagramm zeigt den anbieterübergreifenden Median für beide Abrechnungsebenen; individuelle Anbieterangebote können für mehrjährige Laufzeiten, die hier nicht widergespiegelt werden, tiefer gehen.

Spot vs. On-Demand

Der Spot-Rabatt-Tracker zeigt den Median-Spot- vs. On-Demand-Rabatt nach Kategorie. In den letzten sechs Monaten spart Modern ca. 50 %, Zuletzt veröffentlicht ca. 48 %, Legacy ca. 77 % (Legacy ist lauter als es aussieht; wenige Anbieter veröffentlichen noch Spot-Sätze für diese Karten).

Wenn Ihre Workload 5-15-minütige Unterbrechungen toleriert, ist Spot der größte verfügbare Kostthebel. Schalten Sie im Explorer-Diagramm oben das Abrechnungs-Dropdown um, um den Spot-Satz nebeneinander mit On-Demand für jeden Anbieter auf Ihrer Shortlist zu sehen.

Verpassen Sie nicht unsere Benchmarks und datengestützten Erkenntnisse. Die Schaltfläche öffnet Google; die Auswahl von AIMultiple bestätigt, dass Sie AIMultiple häufiger in den Google-Suchergebnissen sehen möchten.
GoogleAls bevorzugte Quelle hinzufügen

GPU-Index-Methodik

Der Index umfasst veröffentlichte stündliche Cloud GPU-Mietpreise über On-Demand-, Spot- und 1-Jahres-Reservierungsebenen (wo Anbieter sie öffentlich auflisten). Er deckt keine mehrjährigen Verträge, unternehmensverhandelte Sätze, Spot-plus-Sparplan-Kombinationen oder Gesamtkosten des Besitzes ab.

Unsere Daten sind monatliche Momentaufnahmen über 23 Monate (Juli 2024 bis Mai 2026), gefiltert auf 17 kuratierte GPU-Modelle über 58 Anbieter. Jede Momentaufnahme meldet für jede (Anbieter, GPU, Abrechnungsart, Monat)-Zelle den Min-, Max-, Mittel- und Medianwert pro GPU-Stundensatz sowie die Angebotsanzahl hinter diesen Zahlen.

H100, A100, H200, B200, B300 und V100-Preise sind Mediane, die über mehrere physische Versionen der Karte (PCIe, SXM oder NVL-Interconnect; für A100 und V100 auch 40/80 GB oder 16/32 GB VRAM) genommen werden, die Anbieter unter einem Namen auflisten.

Wie jedes Diagramm berechnet wird

Wir verwenden durchgehend den Median der Mediane: Anbieter und GPUs gehen jeweils mit gleichem Gewicht in die Hauptzahl ein, sodass ein Anbieter mit 38 Auflistungen einen Neuling mit 5 Auflistungen nicht überlagert.

Marktzusammenfassung (drei Kategorie-Linien):

Das Abrechnungs-Dropdown führt die Schritte 2-3 erneut gegen die ausgewählte Ebene (On-Demand, Spot oder Reservierung) durch. Eine vierte „Durchschnitt"-Option zeichnet das arithmetische Mittel der Drei-Ebenen-Mediane pro Kategorie pro Monat auf, beschränkt auf Monate, in denen alle drei Ebenen Daten haben.

Anbieter × Abrechnungsexplorer:

Für den von Ihnen ausgewählten Anbieter und die Abrechnungsebene verfolgt jede Linie den monatlichen Median einer GPU über die Zeit. Keine anbieterübergreifende Aggregation wird angewendet: Jeder Punkt des Monats ist einfach der Medianpreis über die Angebote dieses Anbieters für diese GPU und diese Abrechnungsebene. Die Linie endet dort, wo das Angebot aus dem Katalog verschwindet.

Moderne GPUs nebeneinander:

Die gleichen Schritte 1-2 wie die Marktzusammenfassung, beschränkt auf On-Demand-Preisgestaltung. Jede Linie ist der anbieterübergreifende monatliche Median für eine GPU. Keine GPU-übergreifende Aggregation. Acht Serien.

Spot-Rabatt-Tracker:

Dies paart jeden Spot-Preis mit seinem gleichem Anbieter, gleichem GPU, gleichem Monat On-Demand-Gegenstück, sodass der Rabatt die tatsächliche Spanne widerspiegelt, die ein Käufer bei diesem Anbieter sehen würde, und nicht einen anbieterübergreifenden Rauschunterschied.

Verfügbarkeits-Momentaufnahme:

Nur Momentaufnahme, keine Zeitaggregation. Angebote, die als unbekannter Bestand, Warteliste oder nicht verfügbar gemeldet werden, werden im Nenner gezählt, aber nicht separat auf dem Diagramm gezeichnet, da das für den Käufer handlungsrelevante Signal der bestätigte verfügbare Anteil ist.

Einsparungen bei Reservierungen:

FAQs

Wir veröffentlichen jeden Monat eine aktualisierte monatliche Medianansicht. Die Zahlen spiegeln Daten bis zum vorherigen Monat wider.

Die GPU ist dieselbe; das Bundle ist es nicht. Hyperscaler preisen Compliance (HIPAA, SOC 2, FedRAMP), Unternehmens-SLAs, Identitäts- und Netzwerkintegration sowie 24/7-Support ein. Neoclouds preisen Bare-Metal- oder VM-Zugang mit optionaler verwalteter Orchestrierung ein. Wenn Sie das Bundle nicht benötigen, ist der Neocloud-Preis der richtige Vergleich.

Ja, wenn Ihre Workload Checkpoints erstellt und 5-15-minütige Unterbrechungen toleriert. Der moderne GPU-Spot-Rabatt liegt in den letzten sechs Monaten bei ca. 50 %, und die Einsparungen summieren sich über mehrwöchiges Training. Spot ist die falsche Wahl für latenzsensitive Inferenz, Single-Replica-Dienste ohne Failover oder Evaluierungsläufe, die einen sauberen Wanduhrvergleich benötigen.

Das Abrechnungs-Dropdown des Diagramms „Preisentwicklungen nach Anbieter" wechselt zwischen On-Demand-, Spot- und 1-Jahres-Reservierungsebenen, wo immer Anbieter diese Sätze veröffentlichen. Mehrjährige Verträge und unternehmensverhandelte Rabatte sind nicht enthalten. Fordern Sie ein Angebot direkt vom Anbieter für diese an.

Weiterführende Literatur

Diese Forschung zitieren

Wählen Sie das Format, das zu Ihrem Veröffentlichungsort passt. Wenn Sie die Link-Version in Ihr CMS einfügen, bleibt der Backlink erhalten.

Ekrem Sarı (2026) - "Cloud GPU Mietpreisindex". Online veröffentlicht auf AIMultiple.com. Abgerufen am Juni 17, 2026, von: https://aimultiple.com/gpu-index [Online-Ressource]

Sarı, E. (2026, Juni 17). Cloud GPU Mietpreisindex. AIMultiple. https://aimultiple.com/gpu-index

@misc{sar2026,
  author = {Sarı, Ekrem},
  title  = {{Cloud GPU Mietpreisindex}},
  year   = {2026},
  month  = jun,
  howpublished    = {\url{https://aimultiple.com/gpu-index}},
  note   = {AIMultiple. Retrieved Juni 17, 2026}
}
Ekrem Sarı
Ekrem Sarı
KI-Forscher
Ekrem ist KI-Forscher bei AIMultiple und konzentriert sich auf intelligente Automatisierung, GPUs, KI-Agenten und RAG-Frameworks.
Vollständiges Profil anzeigen

Seien Sie der Erste, der kommentiert

Ihre E-Mail-Adresse wird nicht veröffentlicht. Alle Felder sind erforderlich. Kommentare werden in ihrer Originalsprache belassen.

0/450