What is the difference between a hyperscaler and a neocloud?

Hyperscalers run broad cloud platforms with GPU rental as one product line among many. Specialist neoclouds focus on GPU and AI infrastructure as their core product. Hyperscalers price 3-6x above neoclouds for the same GPU; the gap reflects bundled enterprise services rather than raw silicon. For sustained price-trend comparison across tiers, see the Cloud GPU Rental Price Index.

When should I use a serverless GPU provider?

Use serverless when average GPU utilization is under 30-40%, when workloads are bursty, or when ops overhead is a higher cost than per-hour rate. Provisioned GPU on a neocloud is cheaper at sustained high utilization.

Are European-headquartered providers worth picking for GDPR workloads?

For workloads with EU data-residency requirements or buyers serving EU customers on latency-sensitive paths, yes. IONOS, OVHcloud, Scaleway, Nebius, Datacrunch, and Seeweb are EU-headquartered options. Prices typically match or slightly exceed US-based neoclouds; the premium is for residency, jurisdiction, and sustainability claims rather than for raw compute.

KI KI-Hardware

Die 30 besten Cloud-GPU-Anbieter und ihre GPUs im Jahr 2026

Sedat Dogan

mit

Ekrem Sarı

aktualisiert am Mai 13, 2026

Siehe unsere ethischen Normen

Wir haben die 10 gängigsten GPUs in typischen Szenarien (z. B. Feinabstimmung eines LLM wie Llama 3.2) getestet . Basierend auf diesen Erkenntnissen gilt Folgendes:

Informieren Sie sich, welches GPU-Modell (z. B. H100) Sie benötigen, und prüfen Sie, welche Modelle die einzelnen GPU-Cloud-Anbieter anbieten.
Sie wissen nicht, welches Modell Sie verwenden sollen? Sehen Sie sich die kostengünstigsten GPUs an.
Ich möchte die wichtigsten Cloud-GPU-Anbieter sehen:

Wolke	Marken*	Modelle**	Kombinationen***
RunPod	AMD Chips wie MI300X	27	53
AWS	AWS-Chips wie Trainium	7	19
Azure	Ich arbeite an eigenen Chips.	6	14
GCP	Google Cloud-Tensorverarbeitungseinheiten (TPUs)	8	30
OCI		6	17
Alibaba Cloud	Alibaba-Chips wie Hanguang 800	5	6
Nvidia DGX		23	23
Vast.ai		25	50
CoreWeave		13	13
AceCloud		9	17

Ranking : Sponsoren werden verlinkt und hervorgehoben. Anschließend werden die Hyperscaler nach ihrem US-Marktanteil aufgelistet. Danach werden die Anbieter nach der Anzahl ihrer angebotenen Modelle sortiert.

* Alle Anbieter bieten Nvidia-GPUs an. Darüber hinaus bieten einige Cloud-Anbieter Hardware anderer KI-Chiphersteller an, wie in dieser Spalte angegeben.

** Es werden verschiedene Nvidia-GPU-Modelle angeboten. Beispielsweise gelten „A100 40 GB“ und „A100 80 GB“ als separate Modelle. Beachten Sie, dass unterschiedliche Verbindungstypen (SXM, PCIe) für dasselbe GPU-Modell zusammengefasst werden.

*** Es werden unterschiedliche Multi-GPU-Kombinationen angeboten. Beispielsweise werden „1 x A100 40 GB“ und „2 x A100 40 GB“ als separate Multi-GPU-Kombinationen gezählt. Obwohl Cloud-Anbieter unterschiedliche GPU-Anzahlen anbieten, konzentriert sich unsere Analyse auf Zweierpotenz-Konfigurationen (2, 4, 8, 16, 32 GPUs) für einen standardisierten Effizienzvergleich.

GPUs können serverlos, als virtuelle GPUs oder als Bare-Metal-GPUs bereitgestellt werden. Serverlose Lösungen bieten die einfachste Möglichkeit zur Workload-Verwaltung, während Bare-Metal-GPUs die höchste Kontrolle über die Hardware ermöglichen. Falls Sie speziell nach diesen Optionen suchen, lesen Sie die entsprechenden Abschnitte:

Serverlose GPUs
Virtuelle GPUs (oder vGPUs)

Bei der Auflistung der Vor- und Nachteile der einzelnen Anbieter stützten wir uns auf unsere GPU-Benchmarks und Online-Bewertungen.

Was sind die wichtigsten Anbieter virtueller GPUs?

Virtuelle GPUs (vGPUs) sind virtuelle Maschinen, die es mehreren Benutzern ermöglichen, GPUs über die Cloud gemeinsam zu nutzen. Sie sind die am häufigsten angebotene Form von Cloud-GPUs. Zu den führenden Anbietern gehören:

Hyperscaler (AWS, Azure, GCP)

Hyperscaler haben einige Gemeinsamkeiten:

Vorteile

Vorinstallierte Treiber und Anwendungen : Die Konfiguration einer Instanz mit den richtigen Treibern ist aufgrund der Abhängigkeiten zwischen GPU-Chip, Treibern, Betriebssystem und Anwendungen zeitaufwändig. Wenn beispielsweise Ubuntu 25.0 den Tesla K80-Treiber NVIDIA nicht unterstützt, müssen Sie eine ältere Ubuntu-Version verwenden.

Alle drei führenden Hyperscaler ermöglichen es Nutzern, Maschinenabbilder zu verwalten, was diesen Prozess vereinfacht. Nutzer müssen jedoch weiterhin das passende Maschinenabbild für die gewählte Hardware auswählen. Die Namen dieser Dienste lauten:

Amazon Machine Images (AMI)
Azure Erweiterungen
GCP-Benutzerbilder

Nachteile

Für fast alle GPUs ist eine Kontingentgenehmigung erforderlich. Erwarten Sie nicht, nach der Einrichtung eines Cloud-Kontos sofort GPUs nutzen zu können.
Neueste Grafikkarten wie die H100 sind häufig nicht auf Anfrage erhältlich.
Die GPU-Kapazität lässt sich nur schwer ermitteln . Während unseres Benchmarks konnten wir zwar die pro Region startbaren GPU-Karten überprüfen (beispielsweise bietet der AWS-Preisrechner diese Funktion), jedoch fanden wir keine Kapazitätsdaten für die einzelnen Regionen. Daher mussten wir Instanzen in verschiedenen Kombinationen von Regionen und Instanztypen starten, um eine Konfiguration zu finden, die GPUs nutzte.

Amazon Web Services (AWS)

AWS ist der größte Anbieter von Cloud-Plattformen und ein führender Anbieter von Cloud-GPUs. ¹ Amazon EC2 (Elastic Compute Cloud) bietet GPU-gestützte virtuelle Maschineninstanzen, die beschleunigte Berechnungen für Deep-Learning-Aufgaben ermöglichen.

Aktuelle Updates

AWS EC2 G7e ist mit NVIDIA Blackwell GPUs (RTX PRO 6000) verfügbar und eignet sich am besten für leistungsstarke KI-Inferenz- und räumliche sowie wissenschaftliche Rechenlasten. Die anfängliche Verfügbarkeit liegt in den Regionen USA Ost (Nord-Virginia) und USA Ost (Ohio).

Vorteile

Bietet nahtlose Integration mit anderen gängigen AWS-Lösungen wie:

Unkomplizierter Quotenprozess : Wir haben jede GPU-Instanz separat beantragt und die Quote für alle GPU-Typen auf AWS innerhalb von etwa einem Tag nach unserer Antragstellung ohne weitere Diskussionen erhalten.
SageMaker dient zum Erstellen, Trainieren, Bereitstellen und Skalieren von ML-Modellen. SageMaker Studio Lab beinhaltet 15 GB kostenlosen permanenten Speicherplatz und Rechenguthaben.
Redshift , OpenSearch , Amazon S3 (Simple Storage Service) , Amazon RDS (Relational Database Service) oder andere AWS-Dienste können als Speicherlösungen für Trainingsdaten dienen.

Nachteile

Das Abschalten der GPUs dauerte während unseres Benchmarks Stunden . Andere Anbieter erledigen dies innerhalb von Minuten.
Weniger GPU-Optionen als einige auf GPUs spezialisierte Anbieter wie Coreweave.
Steile Lernkurve: Als erste und größte Cloud bietet sie umfassende Funktionen, die die Benutzeroberfläche unübersichtlich wirken lassen können.

Preisgestaltung

Spot-Instanzen bieten oft erhebliche Preisnachlässe, manchmal bis zu 90 % unter den On-Demand-Preisen.

Microsoft Azure

Der zweitgrößte Cloud-Anbieter bietet mit seinen N-Series Virtual Machines einen Cloud-basierten GPU-Dienst an, der – wie auch andere Anbieter – GPUs nutzt, um Hochleistungsrechenkapazitäten bereitzustellen. Dieser Dienst eignet sich besonders für anspruchsvolle Anwendungen wie Deep Learning, Simulationen, Rendering und das Training von KI-Modellen.

Es wird auch gemunkelt, dass Microsoft mit der Produktion eigener Chips begonnen hat. ²

Vorteile

Unkomplizierter Kontingentierungsprozess : Der Prozess ähnelte dem von AWS, allerdings war das Antragsformular zeitaufwändiger.
Eine weniger steile Lernkurve für die Benutzeroberfläche als bei Anbietern wie AWS.

Nachteile

Manche Benutzer stellen fest, dass bestimmte erweiterte Funktionen von Azure ein hohes Maß an technischem Fachwissen erfordern, um effektiv konfiguriert und verwaltet zu werden. ³

Preisgestaltung

Alle Preise für GPUs mit der Kennung Azure anzeigen und mit anderen Anbietern vergleichen.

Google Cloud-Plattform (GCP)

Google Die Google Cloud Platform (GCP) ist die drittgrößte Cloud-Plattform.

Aktuelle Updates

Neue Rechenumgebungen : GCP hat A3 Ultra-Instanzen mit NVIDIA H200-GPUs eingeführt, wodurch die KI-Leistung verbessert wird. ⁴

Vorteile

Bietet die größte Flexibilität (unter den drei führenden Hyperscalern) bei der Kombination von CPU, GPU und Speicher: Wir können eine CPU- und Speichergröße auswählen und der Instanz anschließend eine oder mehrere GPUs zuweisen . Dies bietet mehr Flexibilität als die Auswahl bestimmter Instanztypen, wie sie bei anderen Hyperscalern üblich ist.
Benutzerfreundlichere Oberfläche im Vergleich zu AWS
Bietet einige kostenlose GPU-Optionen für Kaggle- und Colab-Nutzer an.
Kunden können über 20 Produkte kostenlos nutzen, bis zu einem monatlichen Nutzungslimit.

Nachteile

Die Konfiguration der richtigen Kombination aus CPU, GPU und Speicher ist komplexer, da nahezu jede Kombination möglich ist. Benutzer müssen zudem die Preise der verschiedenen Komponenten (z. B. GPU, Speicher) addieren, um den Gesamtpreis der Instanz zu berechnen.
Das Quotenverfahren erforderte das Ausfüllen komplexer Formulare und dauerte mehrere Tage.

Preisgestaltung

Alle GCP-GPU-Preise in allen Regionen anzeigen

NVIDIA DGX Cloud

NVIDIA ist führend im Bereich GPU-Hardware. NVIDIA hat sein GPU-Cloud-Angebot DGX Cloud durch die Anmietung von Kapazitäten in den Rechenzentren führender Cloud-Anbieter (z. B. OCI, Azure und GCP) auf den Markt gebracht.

DGX Cloud bietet die Plattformen Base™, AI Enterprise und Networking. DGX Cloud-Instanzen werden mit 8 H100- oder A100-GPUs mit 80 GB Tensor Core-Speicher gestartet.

Als einer der ersten Kunden behauptet das Forschungsteam von Amgen, dass das Training von Protein-LLMs mit BioNeMo dreimal schneller und die Analyse nach dem Training mit NVIDIA RAPIDS bis zu 100-mal schneller sei. ⁵

Das Angebot richtet sich an Unternehmen; der Listenpreis für DGX Cloud-Instanzen beginnt zum Marktstart bei 36.999 US-Dollar pro Instanz und Monat.

Vorteile

Unterstützung von den Ingenieuren der Nummer NVIDIA
Multi-Node-Skalierung, die das Training auf bis zu 256 GPUs unterstützt und so ein schnelleres Training großer Modelle ermöglicht.
Vorkonfiguriert mit der KI-Software NVIDIA für eine schnelle Bereitstellung und Reduzierung der Einrichtungszeit.

Nachteile

Dieses Angebot eignet sich nicht für Unternehmen mit geringem GPU-Bedarf.
Der Dienst wird auf der physischen Infrastruktur der Cloud-Anbieter bereitgestellt. Daher muss der Käufer die Margen sowohl des Cloud-Anbieters als auch von NVIDIA bezahlen.

IBM Wolke

Die von IBM Cloud angebotene GPU unterstützt einen flexiblen Serverauswahlprozess und integriert sich nahtlos in die Architektur, Anwendungen und APIs von IBM Cloud. Dies wird durch ein global verteiltes Netzwerk miteinander verbundener Rechenzentren erreicht.

Vorteile

Leistungsstarke Integration mit der Cloud-Architektur und den Anwendungen (IBM).
Weltweit verteilte Rechenzentren erhöhen den Datenschutz

Nachteile

Geringere Akzeptanz im Vergleich zu den drei führenden Anbietern.

Oracle Cloud-Infrastruktur (OCI)

Oracle hat sein GPU-Angebot nach der Formalisierung seiner Partnerschaft mit NVIDIA deutlich ausgebaut.

Oracle bietet GPU-Instanzen sowohl als Bare-Metal- als auch als virtuelle Maschinen für schnelles, kostengünstiges und hocheffizientes Computing. Die Bare-Metal-Instanzen von Oracle ermöglichen es Kunden, Aufgaben in nicht-virtualisierten Umgebungen auszuführen. Diese Instanzen sind in Regionen wie den USA, Deutschland und Großbritannien verfügbar und können sowohl bedarfsorientiert als auch unterbrechungsfrei genutzt werden.

Kunden

Oracle betreut einige der führenden LLM-Anbieter wie Cohere, ein Unternehmen, in das Oracle ebenfalls investiert hat.

Vorteile

Breites Angebot an Cloud-Produkten und -Dienstleistungen. Unter den Cloud-Diensten der Tech-Giganten bietet nur OCI Bare-Metal-GPUs an. ⁶ Für GPU-Cluster-Nutzer bietet unter den Cloud-Diensten der Tech-Giganten nur OCI RoCE v2 für seine Cluster-Technologie an.
Kostengünstig im Vergleich zu anderen großen Cloud-Anbietern
Bietet eine kostenlose Testphase und einige dauerhaft kostenlose Produkte an.

Nachteile

Die Benutzeroberfläche wird von den Nutzern als umständlich und langsam empfunden. ⁷

Manche Benutzer finden die Dokumentation schwer verständlich. ⁸

Der Prozess der Einführung von Cloud-Computing-Diensten wurde von einigen Nutzern als bürokratisch, kompliziert und zeitaufwändig angesehen.

RunPod

RunPod ist eine Cloud-Computing-Plattform, die sich auf GPU-beschleunigte Dienste für Anwendungen im Bereich Künstliche Intelligenz (KI) und Maschinelles Lernen (ML) spezialisiert hat. RunPod wurde entwickelt, um die Entwicklung, das Training und die Bereitstellung von KI-Modellen zu optimieren und bietet eine Reihe von Funktionen zur Steigerung der Recheneffizienz und Flexibilität.

Aktuelle Updates

Rollback : Runpod führte den GitHub Release Rollback für Serverless-Endpunkte ein, wodurch Benutzer Deployments direkt über die Konsole sofort auf einen vorherigen Build zurücksetzen können, ohne ein neues GitHub-Release zu erstellen oder einen Rebuild auszulösen.
Load-Balancing-Endpunkte : Runpod hat Load-Balancing-Endpunkte (LB) in der Beta-Phase eingeführt. Dadurch kann der Datenverkehr über direkten HTTP-Zugriff auf mehrere Worker verteilt werden, anstatt über eine warteschlangenbasierte Infrastruktur. Entwickler können dies aktivieren, indem sie "endpointType": "LB" in hub.json setzen. Dies unterstützt benutzerdefinierte REST-APIs und Workloads mit höherem Durchsatz.
Erweiterte öffentliche Endpunkte und Vercel AI SDK-Integration : Runpod hat seinen Katalog öffentlicher Endpunkte um zusätzliche Modelle in den Kategorien Text , Bild , Video und Audio erweitert. Zudem wurde die Integration mit dem Vercel AI SDK über das Paket @runpod/ai-sdk-provider eingeführt, wodurch optimierte Streaming- und Generierungs-Workflows in TypeScript- und JavaScript-Anwendungen ermöglicht werden.

Vorteile

RunPod-Nutzer loben die kurzen Einrichtungszeiten, die es ihnen ermöglichen, GPU-Instanzen innerhalb von Sekunden zu starten.
Die Plattform bietet eine vielfältige Auswahl an GPU-Konfigurationen, darunter Hochleistungsoptionen wie NVIDIA H100 PCIe und A100 PCIe.
RunPod-Nutzer empfanden die Benutzeroberfläche und die Befehlszeilenschnittstelle als intuitiv und einfach zu bedienen für die Bereitstellung und Verwaltung von KI-Workloads.
Nutzer erwähnen über 50 vorkonfigurierte Vorlagen, darunter beliebte Frameworks wie PyTorch und TensorFlow.

Nachteile

Die Plattform ist zwar benutzerfreundlich, doch für einige fortgeschrittene Funktionen kann eine gewisse Einarbeitungszeit erforderlich sein, um deren volles Potenzial auszuschöpfen.

Preisgestaltung

GPU-Instanzen werden minutengenau abgerechnet, ohne zusätzliche Gebühren für eingehenden oder ausgehenden Datenverkehr. Der GPU-Preis beginnt bei:

2,39 $ pro Stunde für NVIDIA H100 PCIe GPUs
1,64 US-Dollar pro Stunde für A100 PCIe-GPUs.
Netzwerkspeicher ist für 0,05 US-Dollar pro GB und Monat erhältlich.

CoreWeave

CoreWeave ist ein spezialisierter GPU-Cloud-Anbieter. NVIDIA ist einer der Investoren von CoreWeave. CoreWeave gibt an, über 45.000 GPUs zu verfügen und von NVIDIA als erster Cloud-Service-Anbieter der Elite-Klasse ausgewählt worden zu sein. ⁹

Aktuelle Updates

CoreWeave hat ARENA (AI-Ready Native Applications) auf den Markt gebracht, ein KI-Labor im Produktionsmaßstab, mit dem Unternehmen reale Arbeitslasten auf einer speziell dafür entwickelten Infrastruktur ausführen können, die Live-Umgebungen nachbildet. Dadurch können sie Leistung, Zuverlässigkeit und Kosten überprüfen, bevor sie die Software in der vollen Produktion einsetzen.

ARENA ersetzt herkömmliche Sandbox- oder synthetische Tests durch standardisierte, realitätsnahe Benchmarks und geführte Evaluierungen und liefert den Teams klare Signale darüber, wie sich ihre Modelle und Pipelines unter produktionsähnlicher Last verhalten und welche Kostentreiber dabei eine Rolle spielen.

Jarvis Labs

Jarvis Labs, gegründet 2019 und ansässig in Indien, hat sich auf das schnelle und unkomplizierte Training von Deep-Learning-Modellen auf GPU-Recheninstanzen spezialisiert. Dank seiner in Indien ansässigen Rechenzentren ist Jarvis Labs für seine benutzerfreundliche Einrichtung bekannt, die einen sofortigen Betriebsstart ermöglicht.

Jarvis Labs gibt an, mehr als 10.000 KI-Experten zu betreuen. ¹⁰

Vorteile

Für die Registrierung ist keine Kreditkarte erforderlich.
Eine einfache Benutzeroberfläche für Anfänger

Nachteile

Obwohl Jarvis Labs an Bedeutung gewinnt, muss seine Eignung für die Aufgaben Ihres Unternehmens noch geprüft werden. Es scheint eher auf kleinere Arbeitslasten ausgerichtet zu sein, da es keine Multi-GPU-Instanzen anbietet.

Lambda Labore

Ursprünglich war Lambda Labs ein Hardwareunternehmen, das Desktop-PCs und Serverhardware-Lösungen mit GPUs anbot. Seit 2018 bietet Lambda Labs mit Lambda Cloud eine GPU-Plattform an. Die virtuellen Maschinen sind mit gängigen Deep-Learning-Frameworks, CUDA-Treibern und einem dedizierten Jupyter-Notebook ausgestattet. Nutzer können sich über das Webterminal im Cloud-Dashboard oder direkt mit den bereitgestellten SSH-Schlüsseln mit diesen Instanzen verbinden.

Lambda Labs gibt an, von über 10.000 Forschungsteams genutzt zu werden und ein ausschließlich auf GPUs fokussiertes Angebot zu haben.

Paperspace CORE von DigitalOcean

Paperspace ist eine Cloud-Computing-Plattform, die GPU-beschleunigte virtuelle Maschinen zur Entwicklung, zum Training und zum Einsatz von Modellen des maschinellen Lernens anbietet.

Paperspace gibt an, 650.000 Nutzer bedient zu haben. ¹¹

Vorteile

Bietet im Vergleich zu anderen Anbietern eine breite Palette an GPUs.
Die Nutzer empfinden die Preise für die bereitgestellte Rechenleistung als angemessen.
Die Nutzer empfinden den Kundenservice als freundlich und hilfsbereit.

Nachteile

Einige Nutzer beschweren sich über die Verfügbarkeit von Maschinen, sowohl hinsichtlich der kostenlosen virtuellen Maschinen als auch hinsichtlich bestimmter Maschinentypen, die nicht in allen Regionen verfügbar sind. ¹²

Die integrierte Jupyter-Oberfläche wird kritisiert und es fehlen einige Tastenkombinationen, obwohl eine native Jupyter-Notebook-Oberfläche angeboten wird.

Längere Lade- oder Erstellungszeiten für Maschinen
Die monatliche Abonnementgebühr zusätzlich zu den Maschinenkosten kann ein Nachteil sein, und das Training mit mehreren GPUs kann teuer sein.

Was ist eine serverlose GPU?

Serverloses GPU-Computing ermöglicht Nutzern den Zugriff auf leistungsstarke GPU-Ressourcen, ohne dass sie Server verwalten müssen. Die Bereitstellung, Skalierung und Wartung werden von den Anbietern übernommen. Dieser Ansatz unterstützt nutzungsbasierte Abrechnung und bietet oft eine Scale-to-Zero-Funktion, die Leerlaufkosten eliminiert und sich daher ideal für sporadische oder unvorhersehbare Arbeitslasten eignet.

Serverlose GPUs werden häufig für KI-Aufgaben eingesetzt, darunter das Trainieren von Deep-Learning-Modellen, das Ausführen generativer KI-Anwendungen und das Durchführen von Batch-Inferenz, und bieten gegenüber herkömmlichen Cloud-Setups erhebliche Vorteile in Bezug auf Einfachheit und Kosteneinsparungen.

Erkunden Sie die Serverless-GPU-Anbieter auf Serverless GPUs .

Was sind Bare-Metal-GPU-Anbieter?

Bare-Metal-GPU-Anbieter liefern dedizierte physische GPU-Server ohne Virtualisierung und bieten so direkten Hardwarezugriff für maximale Leistung und minimale Latenz.

Diese Lösungen eignen sich ideal für rechenintensive Workloads wie künstliche Intelligenz (KI), maschinelles Lernen (ML), Deep Learning, Grafikrendering, wissenschaftliche Simulationen und High-Performance Computing (HPC).

Durch den Wegfall der Virtualisierungsschicht gewährleisten Bare-Metal-GPUs eine gleichbleibende Leistung, reduzierte Latenz und die volle Auslastung der GPU-Ressourcen. Dadurch sind sie die bevorzugte Wahl für Unternehmen und Startups mit anspruchsvollen Rechenanforderungen.

Welche Cloud-GPU-Anbieter haben ihren Sitz in Europa?

Europäische Unternehmen ziehen es möglicherweise vor, ihre Daten in Europa zu speichern.

DSGVO-Konformität und Datensicherheit
Wir bieten europäischen Nutzern schnellere KI-Inferenzdienste an.

Dies ist bei einigen globalen Cloud-Anbietern möglich, es gibt aber auch in Europa ansässige Cloud-GPU-Anbieter.

Seeweb

Seeweb ist ein in Italien ansässiger Public-Cloud-Anbieter, der zu 100 % mit erneuerbarer Energie betrieben wird. Seeweb unterstützt Infrastructure as Code (IaC) über Terraform und bietet fünf verschiedene GPU-Modelle an.

Datacrunch.io

Datacrunch bietet die Nvidia-Modelle A100, H100 RTX6000 und V100 in Gruppen von 1, 2, 4 oder 8 Stück an. Das Unternehmen hat seinen Sitz in Helsinki, Finnland, und setzt zu 100 % auf erneuerbare Energien.

OVHcloud

OVHcloud ist ein in Frankreich ansässiger Anbieter von Public-Cloud-Diensten. Das Unternehmen bietet seit 2023 Nvidia-GPUs an und plant, sein Angebot zu erweitern. ¹³

Scaleway

Scaleway bietet H100-Instanzen an, ist in drei europäischen Regionen (Paris, Amsterdam, Warschau) vertreten und nutzt ausschließlich erneuerbare Energien. Für Großanwender steht der Supercomputer Nabu 2023 mit seinen 1.016 Nvidia H100 Tensor Core GPUs zur Verfügung.

To get up to date on enterprise AI and software, follow us:

Cem Dilmegani

Principal Analyst

Folgen auf

Welche GPU-Cloud-Anbieter werden in Zukunft auf den Markt kommen?

Diese Anbieter haben eine begrenzte Reichweite oder einen begrenzten Umfang oder haben ihre Angebote erst kürzlich eingeführt. Daher wurden sie nicht in die Top 10 aufgenommen:

Alibaba Cloud

Das Angebot von Alibaba könnte für Unternehmen mit Sitz in China attraktiv sein. Es ist außerdem in 20 Regionen verfügbar, darunter Australien, Dubai, Deutschland, Indien, Japan, Singapur, die USA und Großbritannien.

Eine US-amerikanische oder EU-Organisation, die Zugang zu streng geheimen Daten in Bereichen wie Staat, Verteidigung oder Telekommunikation hat, wird es jedoch möglicherweise nicht vorziehen, mit einem Cloud-Service-Anbieter mit Hauptsitz in China zusammenzuarbeiten.

Cirrascale

Cirrascale ist auf die Bereitstellung einer breiten Palette von KI-Hardware für Forschungsteams spezialisiert. Obwohl sie mit etwa 20 Mitarbeitern zu den kleinsten Teams in diesem Bereich gehören, bieten sie KI-Hardware von vier verschiedenen Herstellern an. ¹⁴

Voltage Park

Voltage Park ist eine gemeinnützige Organisation, die Gelder, darunter rund 500 Millionen Dollar bei NVIDIA, für die Einrichtung von 24.000 Cloud-H100-GPUs aufgewendet hat. ¹⁵ Es bietet preisgünstige GPU-Miete für KI-orientierte Unternehmen wie Character AI an.

Ermitteln Sie die kostengünstigsten Cloud-GPUs

Bewegen Sie den Mauszeiger über die einzelnen Punkte, um die kostengünstigsten Cloud-GPUs anzuzeigen:

Wir haben alle Cloud-GPUs auf AWS mit gängigen Text- und Bildverarbeitungsaufgaben getestet. Dabei wurde angenommen, dass die Leistung derselben GPU in allen Clouds identisch ist.

Wie Sie die richtige Instanz für Ihre Cloud-GPU-Anforderungen starten

Die richtigen Entscheidungen bei der Einrichtung einer Cloud-GPU-Instanz sind entscheidend für eine reibungslose Initialisierung. Ohne sorgfältige Prüfung der Kompatibilität zwischen Modell, Betriebssystem und GPU kann dieser Prozess Stunden dauern und die Kosten erheblich in die Höhe treiben, da GPU-Anbieter stundenweise abrechnen. Mit den folgenden Schritten vermeiden Sie unnötige Verzögerungen und gewährleisten Kosteneffizienz für Ihr Projekt:

Modell auswählen: Wählen Sie das Modell aus, das Sie verwenden möchten (z. B. YOLOv9).
Identifizieren Sie die Abhängigkeiten: Die Modellwahl beeinflusst direkt das Framework und die Bibliotheken (z. B. PyTorch, TensorFlow), die Sie zum Erstellen und Bereitstellen Ihrer Lösung benötigen.
Ermitteln Sie die passende CUDA-Version: CUDA ist erforderlich, um GPUs effizient zu betreiben. Beispielsweise erfordert die benötigte PyTorch-Version eine bestimmte CUDA-Version.
Nutzen Sie unseren Benchmark, um die kostengünstigste GPU auszuwählen: Nutzen Sie Benchmark-Daten, um die GPU auszuwählen, die das beste Preis-Leistungs-Verhältnis für Ihre spezifische Arbeitslast bietet.
Prüfen Sie, ob die GPU in Ihrer bevorzugten Region verfügbar ist: Cloud-Anbieter verfügen oft über unterschiedliche Hardwarebestände in den verschiedenen Regionen, und manche GPUs sind möglicherweise nicht in allen Regionen verfügbar . Die Prüfung der Verfügbarkeit der GPU hilft, Verzögerungen bei der Bereitstellung zu vermeiden. Selbst wenn eine GPU angeboten wird, ist sie möglicherweise nicht verfügbar, wenn Sie sie anfordern, da sie überbucht sein kann. Die pro Region verfügbaren GPUs können Sie unter folgender Adresse einsehen:
1. AWS: Preisrechner ¹⁶
2. Azure: Preisrechner ¹⁷
3. GCP: Dokumentation zur GPU-Verfügbarkeit ¹⁸
Wählen Sie das richtige Betriebssystem: Bei der Auswahl Ihrer Konfiguration beim Cloud-Anbieter müssen Sie das Betriebssystem (OS) und dessen Version auswählen. Das Betriebssystem muss die erforderliche CUDA-Version und die GPU-Treiber unterstützen.
Entweder Sie installieren die Treiber und Abhängigkeiten manuell oder Sie wählen ein System, auf dem diese bereits vorinstalliert sind: Sie können die notwendigen Treiber und Abhängigkeiten entweder manuell installieren oder vorkonfigurierte Umgebungen von Cloud-Anbietern wie den Erweiterungen von Azure oder den AMIs von AWS nutzen, um den Einrichtungsprozess zu vereinfachen.

FAQs

Eine Cloud-GPU-Plattform ist ein Service von Cloud-GPU-Anbietern, der Nutzern den Fernzugriff auf und die Nutzung von GPU-Technologie ermöglicht. Anstatt physische GPUs auf lokalen Rechnern zu installieren, können Nutzer die Leistung von Cloud-GPUs nutzen, die auf effizienten Cloud-GPU-Plattformen gehostet werden. Diese Plattformen, wie beispielsweise Cloud-GPUs und GPU-Instanzen, nutzen die hohe Leistungsfähigkeit von GPUs, einschließlich der Tesla-Serie, und stellen sie Nutzern über die Cloud zur Verfügung.

Cloud-GPU-Dienste sind unerlässlich für Privatpersonen und Unternehmen, die immense Rechenleistung benötigen, ohne die hohen Investitionskosten für den Kauf und die Wartung physischer GPUs tragen zu müssen. Angesichts der steigenden Nachfrage nach Hochleistungsrechnen in Bereichen wie Künstlicher Intelligenz, Deep Learning und Grafikrendering bietet eine effiziente Cloud-GPU-Plattform skalierbare und kostengünstige Lösungen.

Mit dem Aufkommen der besten Cloud-GPU-Plattformen können Nutzer nun GPU-Leistung bedarfsgerecht mieten, was sie ideal für kurzfristige, rechenintensive Aufgaben oder Projekte macht. So können sie die fortschrittlichen Funktionen von Diensten wie Cloud-GPUs oder GPU-Instanzen nutzen, ohne in nennenswerte Hardware investieren zu müssen.

Sicherheit hat für jeden Cloud-GPU-Anbieter höchste Priorität. Die besten Cloud-GPU-Plattformen implementieren strenge Sicherheitsmaßnahmen, um den Schutz von Nutzerdaten und -anwendungen zu gewährleisten. Dazu gehören Datenverschlüsselung während der Übertragung und im Ruhezustand, sichere Zugriffskontrollen, regelmäßige Sicherheitsaudits und vieles mehr. Anbieter von Diensten wie GPU-Instanzen und Cloud-GPUs investieren erheblich in die Wahrung der Integrität und Vertraulichkeit von Nutzerdaten.

Wie bei jedem Cloud-Dienst gilt auch hier: Obwohl der Anbieter Maßnahmen zur Sicherung der Infrastruktur ergreift, sollten die Benutzer auch die Best Practices im Datenmanagement und der Zugriffskontrolle befolgen, um eine optimale Sicherheit zu gewährleisten.

Cloud-Anbieter vergeben spezifische Kontingente für GPU-Instanzen, die je nach Typ und Region variieren können. Um eine Kontingenterhöhung zu beantragen, müssen Entwickler den Instanztyp (z. B. P3XL) und die Region (z. B. Oregon) angeben. Anbieter prüfen häufig die geplante Nutzung und das aktuelle Verbrauchsverhalten des Entwicklers, bevor sie eine Kontingentanpassung genehmigen, um eine effiziente Ressourcenzuweisung zu gewährleisten. Das Verfahren und die Bearbeitungszeit für Kontingenterhöhungen sind anbieterabhängig.

GPU-Verknappung entsteht, wenn die Nachfrage nach Grafikprozessoren das Angebot deutlich übersteigt. Ursächlich hierfür sind das Wachstum in den Bereichen Gaming, Kryptowährungs-Mining und KI-Anwendungen. Produktionsengpässe, Unterbrechungen der Lieferkette und Wucherpreise haben die Verfügbarkeit zusätzlich eingeschränkt und zu höheren Preisen und Lieferverzögerungen geführt.

Cloud-GPU-Anbieter nutzen physische GPUs, um virtuelle GPU-Dienste anzubieten. Der Mangel an physischen GPUs begrenzt deren Kapazität, was zu Verfügbarkeitsproblemen und höheren Kosten für die Nutzer führt. Cloud-GPUs bieten jedoch eine Alternative zum Besitz eigener Hardware und ermöglichen Nutzern trotz des Mangels den Zugriff auf GPU-Leistung.

Um Engpässe zu beheben, setzen Nutzer auf Multi-Cloud-Strategien und Automatisierungstools, um den GPU-Zugriff über verschiedene Anbieter hinweg zu optimieren. Gleichzeitig arbeiten Hersteller und Cloud-Plattformen an Innovationen, um die GPU-Effizienz zu verbessern und das Angebot zu erweitern, mit dem Ziel, den Engpass langfristig zu verringern.

Confidential Computing ist eine hardwarebasierte Sicherheitstechnologie, die KI-Modelle und -Daten während ihrer aktiven Verarbeitung auf Hopper- und Blackwell-GPUs schützt. Sie schafft eine vertrauenswürdige Ausführungsumgebung, die die verwendeten Daten verschlüsselt und so unbefugten Zugriff verhindert, selbst durch Cloud-Betreiber oder Administratoren.

Für Cloud-GPU-Anbieter bedeutet dies, dass sie ihren Kunden hohe Garantien für Datenschutz und Modellvertraulichkeit auf gemeinsam genutzter Infrastruktur bieten, regulatorische Vorgaben erfüllen und sicherheitsbewusste Nutzer gewinnen können, ohne Leistungseinbußen hinnehmen zu müssen. Diese Technologie ermöglicht sichere KI-Workloads in großem Umfang über öffentliche, hybride und Edge-Clouds hinweg und ist damit ein entscheidendes Unterscheidungsmerkmal für Cloud-Anbieter, die auf GPUs setzen.

Referenzlinks

Instance Types

Amazon EC2 P5 Instances – AWS

What’s New at AWS – Cloud Innovation & News

Pricing - Linux Virtual Machines | Microsoft Azure

Virtual machine sizes overview - Azure Virtual Machines | Microsoft Learn

Microsoft Source

GPU pricing | Google Cloud

GPU, Virtual Machines and Bare Metal | Oracle

Cloud GPU – Cloud instances for AI | OVHcloud Worldwide

10.

GPU-powered infrastructure | Scaleway

11.

Entreprise dedicated server rental: from €4.99 | Scaleway | Scaleway

12.

GPU Droplets | DigitalOcean

13.

Vultr Cloud GPU | Globally Available Cloud GPU Computing on Demand - Vultr.com

Vultr

14.

Cloud’s AI Infrastructure | GPU | Blackwell | Quadro RTX | Akamai

15.

Elastic GPU Service

16.

AI Cloud Pricing | GPU Compute & AI Infrastructure | Lambda

17.

CoreWeave Cloud Pricing | CoreWeave

18.

Pricing | Runpod

Runpod

Sedat Dogan

CTO

Folgen auf

Sedat ist ein führender Experte für Technologie und Informationssicherheit mit Erfahrung in Softwareentwicklung, Web-Datenerfassung und Cybersicherheit. Sedat: – Verfügt über 20 Jahre Erfahrung als White-Hat-Hacker und Entwicklungsexperte mit umfassenden Kenntnissen in Programmiersprachen und Serverarchitekturen. – Berät Führungskräfte und Vorstandsmitglieder von Unternehmen mit hohem Datenverkehr und geschäftskritischen Technologieanwendungen wie Zahlungsinfrastruktur. – Besitzt neben seiner technischen Expertise auch ausgeprägtes betriebswirtschaftliches Verständnis.

Vollständiges Profil anzeigen

Technisch geprüft von

Ekrem Sarı

KI-Forscher

Folgen auf

Ekrem ist KI-Forscher bei AIMultiple und konzentriert sich auf intelligente Automatisierung, GPUs, KI-Agenten und RAG-Frameworks.

Vollständiges Profil anzeigen

Kommentare 4

Teilen Sie Ihre Gedanken

Ihre E-Mail-Adresse wird nicht veröffentlicht. Alle Felder sind erforderlich.

Alisdair

Oct 22, 2024 at 05:36

Nice article, Cem! Could you add Koyeb and a few other serverless GPU providers?

Cem Dilmegani

Nov 10, 2024 at 07:13

Sure, thank you for the suggestion, we will consider it in the next edit.

Jesper

Oct 06, 2024 at 03:58

Hi Cem, please also check out Dataoorts at https://dataoorts.com. We'd greatly appreciate being listed here.

Cem Dilmegani

Oct 22, 2024 at 03:18

Sure, we'll review to see if we can include Dataoorts in the next edit.

Jerry

Jul 24, 2024 at 09:56

Hi Cem, we just launched Atlascloud.ai with the lowest H100 pricing on internet 2.48 on demand. Would love to get on your list.

Cem Dilmegani

Jul 28, 2024 at 10:24

Sure, we'll be reaching out to understand what Atlascloud.ai is offering.

Evgenii Pavlov

Jun 14, 2024 at 15:23

Where is Nebius.ai ???

Cem Dilmegani

Jul 14, 2024 at 08:45

Thank you! It is added now.

Als nächstes lesen

KI-HardwareMai 20

Nazlı Şipi

KI-HardwareApr 24

Vergleich der 6 besten kostenlosen Cloud-GPU-Dienste

Cem Dilmegani

Die 30 besten Cloud-GPU-Anbieter und ihre GPUs im Jahr 2026

Was sind die wichtigsten Anbieter virtueller GPUs?

Hyperscaler (AWS, Azure, GCP)

Vorteile

Nachteile

Amazon Web Services (AWS)

Preisgestaltung

Microsoft Azure

Preisgestaltung

Google Cloud-Plattform (GCP)

Preisgestaltung

NVIDIA DGX Cloud

IBM Wolke

Oracle Cloud-Infrastruktur (OCI)

RunPod

Vorteile

Nachteile

Preisgestaltung

CoreWeave

Jarvis Labs

Lambda Labore

Paperspace CORE von DigitalOcean

Was ist eine serverlose GPU?

Was sind Bare-Metal-GPU-Anbieter?

Welche Cloud-GPU-Anbieter haben ihren Sitz in Europa?

Seeweb

Datacrunch.io

OVHcloud

Scaleway

Welche GPU-Cloud-Anbieter werden in Zukunft auf den Markt kommen?

Alibaba Cloud

Cirrascale

Voltage Park

Ermitteln Sie die kostengünstigsten Cloud-GPUs

Wie Sie die richtige Instanz für Ihre Cloud-GPU-Anforderungen starten

FAQs

Was ist eine Cloud-GPU-Plattform?

Warum benötigen Sie Cloud-GPU-Dienste?

Wie sicher sind Cloud-GPU-Dienste?

Was ist ein GPU-Kontingent?

Was ist das Problem der GPU-Lieferknappheit?

Wie wirkt sich der GPU-Mangel auf Cloud-GPU-Anbieter aus?

Was ist NVIDIA Confidential Computing und warum ist es für Cloud-GPU-Anbieter wichtig?

Referenzlinks

Kommentare 4

Teilen Sie Ihre Gedanken

Als nächstes lesen

Preisindex für Cloud-GPU-Miete

Vergleich der IPv6-Proxy-Anbieter hinsichtlich Preis und Leistung

Vergleich der Top 4 Google Play Scraping-Anbieter

6 beste Anbieter für Web-Scraping im Vergleich (991259_843 Bewertungen)

Vergleich der 9 führenden KI-Anbieter

Vergleich der 6 besten kostenlosen Cloud-GPU-Dienste