Yeni nesil bulut GPU'larının (B200, B300, MI300X, RTX 5090) talep üzerine kullanım oranları geçen yıl yaklaşık iki katına çıkarken, ana akım kartlar (H100, H200, A100) dar bir aralıkta kaldı. Talep üzerine, spot ve 1 yıllık rezerve edilmiş kademeleri kapsayan GPU endeksini aylık olarak 58 sağlayıcı ve 17 GPU modelinden derliyoruz.
GPU nesillerine göre fiyat trendleri
Grafik, üç farklı çıkış tarihi aralığına göre aylık ortalama ilan edilen fiyatı göstermektedir. 17 GPU modelini çıkış tarihine göre üç kategoriye ayırdık:
Artışın büyük kısmı, B200 ve B300 listelemelerinin neocloud sağlayıcılarından hiper ölçekli sağlayıcıların fiyat listelerine doğru genişlemesinden kaynaklandı. Bu hiper ölçekli sağlayıcıların listelemeleri genellikle 2-3 kat daha yüksek olup, veri kümesine girdikçe kategori medyanını yükseltmektedir.
Modern GPU'lar yaklaşık %25 oranında yükseldi, ancak bu hareket büyük ölçüde istatistiksel. Google Cloud, A3z Mega H100 varyantını standart A3 listesine ekleyerek H100 grubunun ortalama fiyatını ~2$'dan ~3$'a yükseltti. Bunun altında, neocloud H100 düşüş eğilimindeydi. Bunu bir sonraki bölümde ele alacağız.
Eski nesil GPU'ların fiyatı, V100 serisinin üst düzey hiper ölçekli sağlayıcılarından ayrılması ve işletmelerin bu ürünü kullanımdan kaldırmasıyla birlikte, 1,78 dolardan 0,97 dolara geriledi. Veri setimizde eski nesil kartlar için yalnızca bir veya iki sağlayıcı kaldı: AWS, K80'i 0,90 dolardan listeliyor, P40 ise Vast.ai'de 0,11 dolardan satılıyor ve geri kalanlar da benzer tek listeleme örnekleri.
Sözleşmeli piyasa farklı bir şekilde hareket etti: 1 yıllık H100 taahhütleri aynı dönemde yükseliş trendi gösterirken, talep üzerine H100'ün medyan değeri yaklaşık olarak sabit kaldı. Bu, aylık ve 1 yıllık taahhütlü fiyatlandırma arasındaki farkın giderek genişlediğini gösteriyor.
Bu hesaplamanın nasıl yapıldığına dair bilgi için GPU indeks metodolojimize bakın.
GPU modeline göre fiyat trendleri
Aşağıdaki tabloda sekiz modern GPU yer almaktadır.
Modern GPU'lar (H100, A100, L4 ve benzerleri)
H100, 36 sağlayıcı tarafından listelenmektedir. Kohortun medyan değeri, 2024 başlarında 7 USD/GPU-saat'in üzerindeyken, 2026'da 3 USD/GPU-saat'in altına düştü. Azure ND ve Google Cloud A3 Mega listelemeleri, dağılımın üst ucunu yükseltiyor.
H200'ün düşük fiyatlı bir listelemesi, sağlayıcı dağılımının geri kalanının önemli ölçüde altında kalmaktadır. RunPod'un listelediği H200 fiyatı, kohort medyanının çok küçük bir kısmını oluştururken, bir sonraki mevcut sağlayıcının fiyatı birkaç kat daha yüksektir. Bu durum, medyan ve aralığın, en düşük fiyatlı listelemenin onaylanmış kullanılabilirliğine ve karşılaştırılabilir bir konfigürasyona sahip olup olmadığına duyarlı olmasını sağlar.
A100 fiyatları, birkaç sunucusuz çıkarım listelemesinin üst sınırı yükselttiği dar bir neocloud aralığında kümeleniyor. Sunucusuz fiyatları, IaaS saatlik GPU fiyatlarından ayrı olarak karşılaştırın.
L40S, RTX 4090, A10G, T4 ve L4, çıkarım katmanını kapsar. 100B'nin altındaki çıkarım, üretim ve toplu ince ayar dahil olmak üzere iş yükleri örtüşmektedir, bu da fiyat karşılaştırmasını anlamlı kılmaktadır. A10G'nin dar fiyat aralığı, listedeki esasen yalnızca AWS'ye özel bir ürün olmasından kaynaklanmaktadır.
Son çıkan GPU'lar (B200, B300, MI300X, RTX 5090)
B200 medyan 5,50$, aralık 3,75$ (Packet AI) ile 14,24$ (AWS). B300 medyan 7,50$, aralık 6,10$ (Nebius) ile 17,80$ (AWS). MI300X medyan 2,72$, aralık 0,50$ (RunPod) ile 7,86$ (Azure). RTX 5090 medyan 0,67$, aralık 0,27$ (Salad) ile 0,72$ (Novita).
Dağıtım, önceki H100 fiyatlandırmasına benzer: Yeni hızlandırıcılar için hiper ölçekli listelemeler, erken kullanılabilirlik döneminde daha düşük fiyatlı neocloud listelemelerinden yaklaşık 3 kat daha yüksektir. MI300X, RunPod ve TensorWave'de H100'ün en düşük fiyatının altında fiyatlandırılmıştır, ancak ROCm tabanlı iş yükleri, CUDA'ya bağımlı uygulamalar için doğrulama gerektirebilir.
Eski nesil GPU'lar (V100, P100, K80, M60, P40)
V100 hala 16 sağlayıcıda (ortalama ~0,97$), P100 5 sağlayıcıda (ortalama ~1,46$), K80 yalnızca AWS'de (0,90$) ve P40 yalnızca Vast.ai'de (~0,11$) bulunuyor. Eski SKU'lar sınırlı sayıda sağlayıcı tarafından listelenmeye devam ediyor. Hiper ölçekli sağlayıcıların listeleri, uyumluluk, uyumluluk veya geçiş kısıtlamaları olan müşteriler için devam edebilirken, birçok yeni bulut sağlayıcısı artık bu GPU'ları listelemiyor. Yeni dağıtımlar için, iş yükünün eski donanım, sürücüler veya yazılım ortamlarına özel bir bağımlılığı olmadığı sürece bu kartlar daha az önem taşıyor gibi görünüyor.
Sağlayıcıya göre fiyat trendleri
Aynı GPU için, büyük ölçekli bulut sağlayıcılarının ilan ettiği fiyatlar, veri setindeki en düşük Neocloud fiyatlarından genellikle 3 ila 6 kat daha yüksektir. Katalog derinliği sağlayıcıya, GPU'ya, bölgeye ve faturalama türüne göre değişir.
Arz ve bulunabilirlik
Arz, manşet fiyatlardan daha geniş bir yelpazede değişkenlik gösterir. Aşağıdaki grafik, her bir GPU'nun bugün teyit edilmiş stok bildiren listelemelerinin payını, en azdan en çok bulunabilirliğe doğru sıralanmış şekilde göstermektedir.
B300'ün %6'sı onaylanmış durumda; kalan %94'ü listelenmiş ancak sağlayıcılar henüz çipin tedarikini garanti etmiyor. MI300X ve L40S %35-36'lık bir paya sahip olup, ana akım segmentine göre daha dar bir aralıkta yer alıyor. H100, H200, A100 ve B200 yaklaşık %41-51'lik bir küme oluşturuyor; burada kataloğun yaklaşık yarısı onaylanmış stok, yarısı ise tedarike bağlı. RTX 4090 ve RTX 5090 %86'ya ulaşarak, tüketici kart arzının daha yüksek ve kurumsal talebin daha düşük olduğunu yansıtıyor.
Projeniz belirli bir yeni nesil çipe bağlıysa, bütçeye ek olarak tedarik süresini de planlayın. Bekleme listesindeki pay sıfıra yakın kalıyor çünkü onaylanmamış listelerin çoğu "bekleme listesi" değil, "bilinmeyen stok" olarak izleniyor: sağlayıcılar bekleme pozisyonunu değil, stok durumunu bildiriyor.
GPU ve sağlayıcı seçimi
GPU seçimi üç eksen tarafından şekillendirilir: iş yükü, süre ve bölge. Anlık ve isteğe bağlı fiyatlandırma ise bu üçünün üzerine eklenir.
İş yüküne göre
Süreye göre
Bir haftadan kısa süre içinde: Neocloud, spreadin tabanında talep üzerine kullanıma sunulacak.
Çok haftalık: Fiyat teklifi isteyin (Neoclouds genellikle 4-12 haftalık taahhütler için %15-30 indirim uygular ; büyük ölçekli bulut sağlayıcıları 1 yıllık rezerve edilmiş kademeler sunar).
Çok yıllık: Talep üzerine sunulan fiyatlar, taahhüt süresine bağlı indirimleri içermediğinden, doğrudan sağlayıcılarla görüşün.
Rezervasyon tasarrufları
1 yıllık rezervasyon indirimi, genellikle ilan edilen talep üzerine fiyatlandırmada %9-32 oranında indirim sağlar; daha yüksek tasarruflar ise sağlayıcıların taahhütlü kapasite için daha yoğun rekabet ettiği AMD MI300X ve çıkarım katmanı L40S'de görülür.
H100 ve H200'de mütevazı, tek haneli ila düşük onlu rakamlarda indirimler görülüyor; talep üzerine hizmet pazarları zaten yeterince rekabetçi olduğundan, sağlayıcılar taahhütler için fazla kar marjından ödün vermiyor. B200 rezervasyonlarında %20 indirim, MI300X'te %32 indirim, L40S'te ise %29 indirim uygulanıyor. Grafik, her iki faturalama kademesi için sağlayıcılar arası medyanı göstermektedir; bireysel sağlayıcı teklifleri, burada yansıtılmayan çok yıllık vadeler için daha derin olabilir.
Anlık yayın mı yoksa talep üzerine yayın mı?
Anlık indirim takip grafiği, kategoriye göre ortalama anlık indirim ile talep üzerine indirim arasındaki farkı göstermektedir. Son altı ayda, modern kartlar yaklaşık %50, son çıkan kartlar yaklaşık %48, eski kartlar ise yaklaşık %77 tasarruf sağlamıştır (Eski kartlar göründüğünden daha değişkendir; az sayıda sağlayıcı bu kartlar için anlık fiyatları yayınlamaktadır).
İş yükünüz 5-15 dakikalık kesintilere izin veriyorsa, spot fiyatlandırma mevcut en büyük maliyet avantajıdır. Listenizdeki herhangi bir sağlayıcı için spot fiyatlandırmayı isteğe bağlı fiyatlandırmayla yan yana görmek için üstteki keşif grafiğindeki faturalandırma açılır menüsünü açın.
GPU indeks metodolojisi
Bu endeks, talep üzerine, spot ve 1 yıllık rezerve edilmiş kademelerdeki (sağlayıcıların kamuya açık olarak listelediği) saatlik bulut GPU kiralama fiyatlarını kapsamaktadır. Çok yıllık sözleşmeleri, kurumsal olarak müzakere edilen fiyatları, spot artı tasarruf planı kombinasyonlarını veya toplam sahip olma maliyetini kapsamamaktadır.
Verilerimiz, 58 sağlayıcıdan seçilmiş 17 GPU modeline göre filtrelenmiş, 23 aylık (Temmuz 2024 - Mayıs 2026) aylık anlık görüntülerden oluşmaktadır. Her anlık görüntü, her (sağlayıcı, GPU, faturalama türü, ay) hücresi için, GPU başına saatlik ücretin minimum, maksimum, ortalama ve medyan değerlerini ve bu rakamların arkasındaki teklif sayısını raporlamaktadır.
Her bir grafiğin nasıl hesaplandığı
Hesaplamalarımızda medyanların medyanını kullanıyoruz: sağlayıcılar ve GPU'lar ana sayıya eşit ağırlıkta giriyor, bu nedenle 38 listelemesi olan bir sağlayıcı, 5 listelemesi olan yeni bir sağlayıcıyı gölgede bırakmıyor.
Pazar özeti (üç kategori satırı):
Fatura açılır menüsü, seçilen kademeye (talep üzerine, anlık veya rezervasyon) göre 2-3. adımları yeniden çalıştırır. Dördüncü bir "Ortalama" seçeneği, her üç kademenin medyanlarının aritmetik ortalamasını, her kategori için aylık olarak, yalnızca üç kademenin de verilerinin bulunduğu aylarla sınırlı olmak üzere gösterir.
Sağlayıcı × faturalama gezgini:
Seçtiğiniz sağlayıcı ve faturalama kademesi için, her çizgi bir GPU'nun aylık ortalama fiyatını zaman içinde gösterir. Sağlayıcılar arası toplama uygulanmaz: her ayın noktası, o GPU ve o faturalama kademesi için o sağlayıcının listelerindeki ortalama fiyattır. Çizgi, teklifin katalogdan kaybolduğu yerde sona erer.
Modern GPU'lar yan yana:
Piyasa özetindeki 1-2. adımlar aynıdır, ancak yalnızca isteğe bağlı fiyatlandırmaya odaklanılmıştır. Her satır, bir GPU için sağlayıcılar arası aylık ortalamayı göstermektedir. GPU'lar arası toplama yapılmamıştır. Sekiz seri.
Anlık indirim takipçisi:
Bu yöntem, her spot fiyatı aynı sağlayıcı, aynı GPU ve aynı ay için isteğe bağlı karşılığıyla eşleştirir; böylece indirim, piyasalar arası gürültü farkını değil, o sağlayıcıdaki bir alıcının göreceği gerçek farkı yansıtır.
Kullanılabilirlik özeti:
Yalnızca anlık görüntü, zamansal toplama yok. Bilinmeyen stok, bekleme listesi veya mevcut değil olarak bildirilen listelemeler paydada sayılır ancak grafikte ayrı olarak çizilmez, çünkü alıcı için harekete geçilebilir sinyal, teyit edilmiş mevcut hisse senedidir.
Rezervasyon indirimleri:
SSS'ler
Her ay güncellenmiş aylık ortalama değerleri yayınlıyoruz. Rakamlar bir önceki aya ait verileri yansıtmaktadır.
GPU aynı; paket içeriği farklı. Büyük ölçekli bulut sağlayıcıları, uyumluluk (HIPAA, SOC 2, FedRAMP), kurumsal SLA'lar, kimlik ve ağ entegrasyonu ve 7/24 destek gibi özelliklere göre fiyatlandırma yapar. Neocloud'lar ise isteğe bağlı yönetilen orkestrasyon ile çıplak metal veya sanal makine erişimi için fiyatlandırma yapar. Paket içeriğine ihtiyacınız yoksa, Neocloud fiyatı doğru bir karşılaştırma noktasıdır.
Evet, eğer iş yükünüz kontrol noktalarına sahipse ve 5-15 dakikalık kesintilere tolerans gösteriyorsa. Modern GPU spot indirimleri son altı ayda %50 civarında seyrediyor ve tasarruflar çok günlük eğitimlerde katlanarak artıyor. Spot, gecikmeye duyarlı çıkarım işlemleri, arıza durumunda yedekleme özelliği olmayan tek kopyalı hizmetler veya temiz bir gerçek zaman karşılaştırması gerektiren değerlendirme çalışmaları için yanlış bir seçimdir.
Sağlayıcıya göre fiyat trendleri grafiğinin faturalandırma açılır menüsü, sağlayıcıların bu fiyatları yayınladığı her yerde isteğe bağlı, anlık ve 1 yıllık rezerve edilmiş kademeler arasında geçiş yapar. Çok yıllık sözleşmeler ve kurumsal olarak müzakere edilen indirimler dahil değildir. Bunlar için doğrudan sağlayıcıdan fiyat teklifi isteyin.
Daha fazla okuma
- Çoklu GPU Performans Testi: B200 vs H200 vs H100 vs MI300X
- En İyi 30 Bulut GPU Sağlayıcısı ve GPU'ları
- GPU Eşzamanlılık Performans Testi
- En İyi 25+ Yapay Zeka Çip Üreticisi: NVIDIA ve Rakipleri
Bu araştırmayı kaynak gösterin
Yayınlayacağınız yere uygun formatı seçin. Bağlantılı sürümü CMS'inize yapıştırmak, geri bağlantıyı korur.
@misc{sar2026,
author = {Sarı, Ekrem},
title = {{Bulut GPU Kiralama Fiyat Endeksi}},
year = {2026},
month = may,
howpublished = {\url{https://aimultiple.com/gpu-index}},
note = {AIMultiple. Retrieved Mayıs 20, 2026}
}
Yorum yapan ilk kişi olun
E-posta adresiniz yayınlanmayacak. Tüm alanlar gereklidir.