En yeni nesil bulut GPU'lar (B200, B300, MI300X, RTX 5090) için talep üzerine fiyatlar geçen yıl yaklaşık iki katına çıktı, buna karşılık yaygın kartlar (H100, H200, A100) dar bir aralıkta kaldı. 58 sağlayıcıdan ve 17 GPU modelinden oluşan veriyle talep üzerine, spot ve 1 yıllık rezerve edilmiş katmanları kapsayan GPU endeksini aylık olarak derliyoruz.
GPU nesline göre fiyat eğilimleri
Grafik, üç farklı çıkış tarihi grubu için aylık medyan fiyat ortalamasını göstermektedir. 17 GPU modelini lansman tarihine göre üç kategoriye ayırdık:
Artışın çoğu, B200 ve B300 listelerinin neobulut sağlayıcılarından hiperskaler fiyat listelerine geçmesiyle geldi. Bu hiperskaler listeleri genellikle 2-3 kat daha yüksek olup, veri setine girdikçe kategori medyanını yükseltiyor.
Modern GPU'lar yaklaşık %25 arttı, ancak bu hareket çoğunlukla istatistiksel. Google Cloud, A3z Mega H100 varyantını standart A3 listesine ekleyerek H100 grubunun medyanını yaklaşık 2$'dan 3$'a çıkardı. Bunun altında, neobulut H100 düşüş eğilimindeydi. Bunu bir sonraki bölümde işaretliyoruz.
Eski nesil GPU'lar, işletmelerin SKU'yu devre dışı bırakmasıyla V100 grubunun yüksek uçlu hiperskaler desteklerini kaybetmesi nedeniyle 1,78$'dan 0,97$'a düştü. Eski nesil kart başına veri setimizde yalnızca bir veya iki sağlayıcı kaldı: AWS, K80'ı 0,90$, Vast.ai'de P40 0,11$'da ve geri kalanları benzer tek listeleme kenar durumları.
Sözleşme piyasası farklı hareket etti: Aynı dönemde 1 yıllık H100 taahhütleri yükseldi, buna karşılık talep üzerine H100 medyanımız yaklaşık olarak sabit kaldı. Bu, aylık ve 1 yıllık taahhütlü fiyatlandırma arasında genişleyen bir farkı gösterir.
Bunun nasıl hesaplandığını görmek için GPU endeksi metodolojimiz bölümüne bakın.
GPU modeline göre fiyat eğilimleri
Aşağıdaki grafik 10 GPU'yu kapsar: 5 Modern, 4 Son Çıkan ve Eski nesil referansı olarak V100.
Modern GPU'lar (H100, H200, A100, L40S, RTX 4090)
H100, 37 sağlayıcı tarafından listelenmiş olup, mevcut hızlandırıcılar arasında en yaygın olanıdır. Grup medyanı şu anda 2,95$/GPU-saat civarında olup, 2024'ün başlarında 7$'ın üzerindeyken düştü. Thunder Compute, Vast.ai ve RunPod aralığın altındadır; Microsoft Azure ve Google Cloud 10$'ın üzerindeki üst kuyruğu taşıyor. Google Cloud satırı, tek bir nvidia-h100 etiketi altında birleştirilmiş üç SKU'nun (a3-highgpu, a3-megagpu, a3-edgegpu) karışımıdır ve bu da grubun medyanını yükseltir.
H200 aralığı 2,29$ (Theta EdgeCloud) ile 13,78$ (Microsoft Azure) arasında değişir, medyan yaklaşık 3,39$. Taban, topluluk katmanı veya örnek paylaşım listelerinin adanmış kapasiteyle karşılaştırılabilir kabul edilip edilmemesine bağlıdır. Bunlar bir kenara bırakıldığında, işlevsel medyan 3-4$ bandında kalır.
A100, bir veya iki sunucusuz çıkarım aykırı değerinin (yüksek uçta Replicate 5,04$) etkisiyle yaklaşık 1,62$ civarında dar bir neobulut bandında kalır. IaaS sağlayıcılarını karşılaştırırken sunucusuz oranları ayrı değerlendirmeyi düşünün.
L40S, tavanı AWS'in 7,58$'ı belirlediği yaklaşık 1,55$ medyan etrafında yerleşti. RTX 4090, 0,44$ medyanla endeksteki en ucuz eğitim sınıfı karttır ve Salad 0,18$ ile Beam 1,61$ ile aralığı sınırlar. Her ikisi de genellikle A100'ın bir kesir fiyatıyla 100B altı çıkarım ve toplu fine-tuning için kullanılır.
Son çıkan GPU'lar (B200, B300, MI300X, RTX 5090)
B200 medyan 5,24$, aralık 3,75$ (Packet AI) ile 14,24$ (AWS). B300 medyan 6,99$, aralık 6,10$ (Nebius) ile 18,00$ (Oracle). MI300X medyan 1,99$, aralık 1,99$ (RunPod) ile 7,86$ (Azure). RTX 5090 medyan 0,69$, aralık 0,27$ (Salad) ile 1,34$ (Vast.ai).
Desen H100'ın önceki eğrisinden tekrarlanıyor: Yeni hızlandırıcılar ilk yıl boyunca hiperskalerlerde 3-5 kat neobulut taban fiyatlarında kalıyor. B300, ek hiperskaler listeleri medyanı yükseltmeye devam ettiği için grafikteki tek yükselen çizgidir. MI300X arz aykırısıdır; RunPod ve TensorWave, H100 tabanının altına fiyatlandırıyor ancak ROCm üzerinde çalışıyor ve her CUDA iş yükü temiz geçmiyor.
Eski nesil referans (V100)
V100, grafikteki tek Eski nesil karttır ve 2017 nesli bir referans çizgisi olarak dahil edilmiştir. Grup medyanı 2024 ortasında 1,84$'dan bugün 18 sağlayıcı üzerinden yaklaşık 0,97$'a düştü. Hiperskalerler, değiştirilemeyen iş yüklerini çalıştıran uyumlu müşteriler için V100 SKU'larını korur; Neobulutlar çoğunlukla bırakmıştır.
Sağlayıcıya göre fiyat eğilimleri
Aynı GPU için hiperskalerlerin ilan edilen fiyatları, veri setindeki en düşük neobulut listelerinden tipik olarak 3-6 kat daha yüksektir. Katalog derinliği sağlayıcıya, GPU'ya, bölgeye ve faturalandırma türüne göre değişir.
Arz ve kullanılabilirlik
Arz, başlık fiyatlarından daha geniş değişir. Aşağıdaki grafik, her GPU'nın listelerinin bugün onaylı stok bildiren payını, en dar olandan en çok kullanılabilir olandan sıralanmış şekilde gösterir.
B300 %6 onaylı; kalan %94 listelenmiş ancak sağlayıcılar henüz çipi garanti etmiyor. MI300X ve L40S %35-36 aralığında, yaygın katmandan daha dar. H100, H200, A100 ve B200 yaklaşık %41-51 civarında kümelenir, burada katalogun yaklaşık yarısı onaylı stok, yarısı sağlama bağımlıdır. RTX 4090 ve RTX 5090 %86'ya ulaşır, bu da daha derin tüketici kartı arzını ve kart başına daha düşük kurumsal talebi yansıtır.
Projeniz belirli bir en yeni nesil çipe bağlıysa, bütçenizin üzerine tedarik öncülüğünü planlayın. Bekleme listesi payı sıfıra yakındır çünkü onaylanmamış listelerin çoğu "bilinmeyen stok" olarak izlenir, "bekleme listesi" değil: sağlayıcılar kuyruk pozisyonu değil, stok durumunu bildirir.
Bir GPU ve sağlayıcı seçme
GPU seçimi üç eksen etrafında şekillenir: iş yükü, süre ve bölge. Spot ve talep üzerine fiyatlandırma, bu üçünün üzerine eklenir.
İş yüküne göre
Süreye göre
Bir haftadan az: Aralığın altındaki neobulut talep üzerine.
Çok haftalı: Bir teklif isteyin (Neobulutlar genellikle 4-12 haftalık taahhütler için %15-30 indirim yapar; hiperskalerler 1 yıllık rezerve edilmiş katmanlar sunar).
Çok yıllık: sağlayıcılarla doğrudan müzakere edin, çünkü ilan edilen talep üzerine oranları taahhütlü dönem indirimlerini yansıtmaz.
Rezervasyon tasarrufları
1 yıllık rezerve edilmiş indirim genellikle ilan edilen talep üzerine orandan %9-32 arasında olur, daha büyük tasarruflar AMD MI300X ve çıkarım katmanı L40S'te olur, burada sağlayıcılar taahhütlü kapasite için daha fazla rekabet eder.
H100 ve H200, hafif tek haneli ila düşük onluk indirimler görür; talep üzerine piyasası zaten yeterince rekabetçi olduğu için sağlayıcılar taahhütler için çok fazla marjdan vazgeçmez. B200 -%20, MI300X -%32, L40S -%29 oranında rezerve edilir. Grafik, her iki faturalandırma katmanı için sağlayıcılar arası medyanı gösterir; bireysel sağlayıcı teklifleri burada yansıtılmayan çok yıllık dönemler için daha derin olabilir.
Spot ve talep üzerine
Spot indirim izleyici grafiği, kategoriye göre medyan spot ve talep üzerine indirimini gösterir. Son altı ayda, modern %50, son çıkan %48, eski nesil %77 tasarruf sağlar (Eski nesil göründüğü kadar gürültülüdür; bu kartlar için hâlâ spot oranlarını yayınlayan birkaç sağlayıcı vardır).
İş yükünüz 5-15 dakikalık kesintilere tahammül ediyorsa, spot mevcut olan tek en büyük maliyet kolu olur. Kısa listenizdeki her sağlayıcı için spot oranını talep üzerine ile yan yana görmek üzere keşfetme grafiğinin üstündeki faturalandırma açılır menüsünü değiştirin.
GPU endeksi metodolojisi
Endeks, sağlayıcıların kamuya açık olarak listelediği ölçüde talep üzerine, spot ve 1 yıllık rezerve edilmiş katmanlar boyunca ilan edilen saatlik bulut GPU kiralama fiyatlarını kapsar. Çok yıllık sözleşmeleri, kurumsal müzakere edilmiş oranları, spot artı tasarruf planı kombinasyonlarını veya toplam sahip olma maliyetini kapsamaz.
Verimiz 23 aylık anlık görüntülerden (Temmuz 2024 - Mayıs 2026) oluşur ve 58 sağlayıcıdaki 17 seçilmiş GPU modeline filtrelenir. Her anlık görüntü, her (sağlayıcı, GPU, faturalandırma türü, ay) hücresi için min, maks, ortalama ve medyan saatlik GPU başına oranı ve bu sayıların arkasındaki teklif sayısını raporlar.
H100, A100, H200, B200, B300 ve V100 fiyatları, sağlayıcıların tek bir isim altında listelediği birkaç fiziksel versiyon (PCIe, SXM veya NVL bağlantısı; A100 ve V100 için 40/80 GB veya 16/32 GB VRAM) üzerinden alınan medyanlardır.
Her grafik nasıl hesaplanır
Her yerde medyanların medyanını kullanıyoruz: Sağlayıcılar ve GPU'lar, başlık sayısına eşit ağırlıkla girer, böylece 38 listeli bir sağlayıcı 5 listeli bir yeniyi bastırmaz.
Piyasa özeti (üç kategori çizgisi):
Faturalandırma açılır menüsü, seçilen katmana (talep üzerine, spot veya rezervasyon) karşı Adım 2-3'ü yeniden çalıştırır. Dördüncü bir "Ortalama" seçeneği, her kategori için her ayın üç katmanlı medyanlarının aritmetik ortalamasını çizer ve bu üç katmanın verisi olan aylara sınırlıdır.
Sağlayıcı × faturalandırma keşfetme:
Seçtiğiniz sağlayıcı ve faturalandırma katmanı için, her çizgi bir GPU'nın aylık medyanını zaman içinde izler. Sağlayıcılar arası toplama uygulanmaz: Her ayın noktası, o sağlayıcının o GPU ve o faturalandırma katmanı için listelerinin medyan fiyatıdır. Teklif katalogdan kaybolduğunda çizgi sona erer.
Modern GPU'lar yan yana:
Piyasa özetiyle aynı Adım 1-2, yalnızca talep üzerine fiyatlamaya odaklanır. Her çizgi, bir GPU için sağlayıcılar arası aylık medyandır. GPU'lar arası toplama yok. Sekiz seri.
Spot indirim izleyici:
Bu, her spot fiyatını aynı sağlayıcı, aynı GPU, aynı ay talep üzerine karşıtıyla eşleştirir, böylece indirim, alıcının o sağlayıcıda göreceği gerçek aralığı yansıtır, piyasalar arası gürültülü fark değil.
Kullanılabilirlik anlık görüntüsü:
Yalnızca anlık görüntü, zaman toplaması yok. Bilinmeyen stok, bekleme listesi veya kullanılamaz olarak bildirilen listeler hâlâ paydada sayılır ancak grafikte ayrı çizilmez, çünkü alıcı eylem sinyali onaylı mevcut paydır.
Rezervasyon tasarrufları:
SSS'ler
Her ay yenilenmiş bir medyan görünümü yayınlıyoruz. Sayılar bir önceki aya kadar olan verileri yansıtır.
GPU aynıdır; paket değil. Hiperskalerler, uyum (HIPAA, SOC 2, FedRAMP), kurumsal SLA'lar, kimlik ve ağ entegrasyonu ve 24/7 destek dahil fiyatlandırır. Neobulutlar, isteğe bağlı yönetilen orkestrasyonla sadece metal veya VM erişimi fiyatlandırır. Pakete ihtiyacınız yoksa, Neobulut fiyatı doğru karşılaştırma olur.
İş yükünüz checkpoint alıyorsa ve 5-15 dakikalık kesintilere tahammül ediyorsa evet. Son altı ayda modern GPU spot indirimi yaklaşık %50 civarında ve tasarruflar çok günlük eğitimde birikir. Spot, gecikmeye duyarlı çıkarım, failover olmadan tek çoğaltma hizmetleri veya temiz duvar saati karşılaştırması gerektiren değerlendirme çalıştırmaları için yanlış bir seçimdir.
Sağlayıcıya göre fiyat eğilimleri grafiğinin faturalandırma açılır menüsü, sağlayıcılar bu oranları yayınladıkları yerlerde talep üzerine, spot ve 1 yıllık rezerve edilmiş katmanlar arasında geçiş yapar. Çok yıllık sözleşmeler ve kurumsal müzakere edilmiş indirimler dahil değildir. Bunlar için sağlayıcıyla doğrudan bir teklif isteyin.
Daha fazla okuma
- Çoklu-GPU Karşılaştırması: B200 vs H200 vs H100 vs MI300X
- En İyi 30 Bulut GPU Sağlayıcısı ve GPU'ları
- GPU Eşzamanlılık Karşılaştırması
- En İyi 25+ Yapay Zeka Çip Üreticisi: NVIDIA ve Rakipleri
Bu araştırmayı kaynak gösterin
Yayınlayacağınız yere uygun formatı seçin. Bağlantılı sürümü CMS'inize yapıştırmak, geri bağlantıyı korur.
@misc{sar2026,
author = {Sarı, Ekrem},
title = {{Bulut GPU Kira Fiyat Endeksi}},
year = {2026},
month = jun,
howpublished = {\url{https://aimultiple.com/gpu-index}},
note = {AIMultiple. Retrieved Haziran 17, 2026}
}
Yorum yapan ilk kişi olun
E-posta adresiniz yayınlanmayacak. Tüm alanlar gereklidir. Yorumlar orijinal dilinde bırakılır.