GPU modeli konusunda esnek iseniz, görüntü ve metin oluşturma ve ince ayar senaryolarında 10 GPU modelinin karşılaştırmalı test sonuçlarına dayanarak en uygun maliyetli bulut GPU'yu belirleyin.
- Eğer belirli bir modeli (örneğin A100) tercih ediyorsanız, bu modeli sunan en düşük maliyetli GPU bulut sağlayıcısını belirleyin.
- Şirket içi sunucular ve bulut arasında kararsızsanız, bulutta GPU satın almayı mı yoksa kiralamayı mı tercih edeceğinizi araştırın.
- Veya en uygun maliyetli GPU'yu belirlemek için bulut GPU kıyaslama metodolojimizi öğrenin.
Bulut GPU'nun işlem hacmi başına fiyatı
GPU'lar için iki yaygın fiyatlandırma modeli "isteğe bağlı" ve "nokta" örneklerdir. En büyük 3 hiper ölçekli sağlayıcının isteğe bağlı fiyatlarına göre iş yükünüz için en uygun maliyetli GPU'yu görün:
Cloud GPU Throughput & Prices
Updated on May 6, 2026
Verda Cloud
Verda Cloud
Verda Cloud
Verda Cloud
Amazon Web Services
Microsoft Azure
Verda Cloud
Verda Cloud
Google Cloud Platform
Amazon Web Services
Microsoft Azure
Latitude
Bulut GPU kıyaslama metodolojisi hakkında ayrıntılı bilgi için ilgili bölüme bakın.
Talep üzerine hizmet, en basit fiyatlandırma modelidir; burada uzun vadeli taahhütler veya peşin ödemeler olmadan, kullanımınıza bağlı olarak işlem gücü için saatlik veya saniyelik olarak ödeme yaparsınız.
Bu örnekler, ön ödeme veya uzun vadeli taahhüt gerektirmeyen bulut GPU platformunun esnekliğini tercih eden kullanıcılar için önerilir. Talep üzerine sunulan örnekler genellikle spot örneklerden daha pahalıdır, ancak kesintisiz kapasite garantisi sağlarlar.
Diğer bulut sağlayıcılarından isteğe bağlı GPU'lar
* Bellek ve GPU modeli tek parametreler değildir. İşlemciler ve RAM de önemli olabilir, ancak bulut GPU performansını şekillendiren birincil kriterler değillerdir. Bu nedenle, basitleştirmek amacıyla bu tablolara işlemci veya RAM sayısını dahil etmedik.
** Eğitim verimliliği, GPU'nun göreceli etkinliğini ölçmek için iyi bir ölçüttür. Bir dil modeli (örneğin bert_base_squad) için GPU tarafından saniyede işlenen belirteç sayısını ölçer.** 1 Lütfen bu verim değerlerinin genel bir kılavuz niteliğinde olduğunu unutmayın. Aynı donanım üzerinde çalışan LLM'ler arasında bile önemli verim farklılıkları olduğundan, aynı donanımın iş yükünüz için önemli ölçüde farklı bir verim sağlayacağını belirtmek isteriz. 2
*** Depolama maliyeti, ağ performansı, giriş/çıkış trafiği vb. hariçtir. Bu sadece GPU maliyetidir. 3
Spot GPU'lar
Tüm bu dolar başına verimlilik tablolarında:
- Tüm olası yapılandırmalar listelenmemiştir; daha yaygın kullanılan, derin öğrenmeye odaklı yapılandırmalar dahil edilmiştir.
- Mümkün olan yerlerde ABD'nin batı veya orta bölgeleri kullanılmıştır.
- Bunlar her kategori için liste fiyatlarıdır, yüksek hacimli alım yapanlar muhtemelen daha iyi fiyatlar elde edebilirler.
Son olarak, "spot" kelimesinin ne anlama geldiğini açıklığa kavuşturmakta fayda var. Spot kaynaklar şunlardır:
- Kesintiye uğrayabilir, bu nedenle kullanıcıların ilerlemelerini sürekli olarak kaydetmeleri gerekir. Örneğin, V100 32 GB sağlayan Amazon EC2 P3, en sık kesintiye uğrayan Amazon spot hizmetlerinden biridir. 4
- Dinamik, piyasa odaklı bir temelde sunulmaktadır . Bu GPU kaynaklarının fiyatı arz ve talebe bağlı olarak dalgalanabilir ve kullanıcılar genellikle mevcut spot kapasite için teklif verirler. Bir kullanıcının teklifi mevcut spot fiyattan yüksekse, talep ettiği örnekler çalıştırılacaktır.
2026 yılının başlarında, talepteki ani artışlar nedeniyle GPU spot kiralama fiyatları yükseldi ve eski nesil GPU'lar için bile bulunabilirlik azaldı. Nvidia CEO'su Jensen Huang, Ocak 2026'da spot piyasa GPU kiralama fiyatlarının sadece en yeni modellerde değil, tüm nesillerde hızla arttığını belirtti. 5
Bulut GPU maliyetleri ve kullanılabilirliği
En düşük fiyata göre sıralanmıştır . Diğer düşük maliyetli seçenekler için bulut GPU pazaryerlerine göz atabilirsiniz.
Ocak 2026'da AWS, en üst düzey GPU örneklerinin, özellikle 8 adet NVIDIA H200 GPU ile donatılmış EC2 P5e 48xlarge örneklerinin fiyatlarını yaklaşık %15 oranında artırdı. 6
GPU kullanılabilirliği
Arama kutusuna istediğiniz modeli girerek, bu modeli sunan tüm bulut sağlayıcılarını listeleyebilirsiniz:
*** Talep üzerine fiyat *($) tek bir GPU için. Depolama, ağ performansı, giriş/çıkış vb. maliyetleri içermez. Bu sadece GPU maliyetidir.
**** Hesaplanan değerler. Tek GPU örnekleri mevcut olmadığında buna ihtiyaç duyuldu. 7 8
Bulut GPU ile ilgili diğer hususlar
Kullanılabilirlik : Bulut sağlayıcılarının kapasite kısıtlamaları ve üretken yapay zekaya olan artan talep nedeniyle yukarıda listelenen tüm GPU'lar mevcut olmayabilir.
Veri güvenliği : Örneğin, Vast.ai gibi bulut GPU pazaryerleri önemli ölçüde daha düşük fiyatlar sunar, ancak talep edilen kaynağa bağlı olarak, iş yükünün veri güvenliği etkilenebilir ve sunuculara iş yüklerine erişim olanağı sağlayabilir. Kurumsal GPU ihtiyaçlarına öncelik verdiğimiz için Vast.ai bu karşılaştırmaya dahil edilmemiştir.
Kullanım kolaylığı : Dokümantasyon kalitesi öznel bir ölçüttür ancak geliştiriciler bazı bulut sağlayıcılarının dokümantasyonunu diğerlerine tercih eder. Bu tartışmada, GCP'nin dokümantasyonunun diğer teknoloji devlerine göre daha düşük kalitede olduğu belirtildi. 9
Aşinalık : Bulut sağlayıcıları hizmetlerini kullanımı kolay hale getirmek için önemli çaba sarf etseler de, bir öğrenme eğrisi vardır. Bu nedenle büyük bulut sağlayıcıları sertifikasyon sistemlerine sahiptir. Dolayısıyla, küçük iş yükleri için, düşük maliyetli bir sağlayıcı kullanmanın maliyet tasarrufu, bir geliştiricinin bulut GPU teklifini nasıl kullanacağını öğrenmesi için gereken zamanın fırsat maliyetinden daha az olabilir.
Maliyet optimizasyonu: GPU havuzlama teknolojileri, işlem kaynaklarını birden fazla model arasında paylaşarak bulut GPU kullanımını ve maliyetlerini önemli ölçüde azaltabilir.
Alibaba'nın Aegaeon sistemi, GPU'ların tam yanıtların tamamlanmasını beklemek yerine üretim sırasında modeller arasında geçiş yapmasına olanak tanıyan belirteç düzeyinde otomatik ölçeklendirme sayesinde LLM'lere hizmet verirken NVIDIA GPU kullanımında %82'lik bir azalma sağladığını iddia ediyor.
Alibaba Cloud'un pazar yerinde üç aylık bir beta sürecinde Aegaeon, H20 GPU gereksinimlerini 1.192'den 213'e düşürürken, 72 milyar parametreye kadar düzinelerce modeli destekleyebildi ve tek bir GPU ile 7 modele kadar işlem yapabildi; ayrıca geçiş gecikmesi %97 oranında azaldı. 10
Çoklu bulut orkestrasyonu: Shopify, bulutlar arasında taşınabilir arayüzler kullanır, maliyet sahipliğini ve kotaları YAML yapılandırma dosyaları aracılığıyla maliyet kotalarıyla uygular ve hem eğitim hem de etkileşimli GPU geliştirme ortamları için SkyPilot gibi orkestrasyon araçlarından yararlanır. 11
GPU satın alın veya bulut tabanlı GPU kiralayın
Satın almak mantıklı.
- Şirketinizin sunucu barındırma veya ortak sunucu yönetimi konusunda bilgi birikimi ve tercihi varsa;
- Kesintisiz iş yükleri için: Bir yıl veya daha uzun süre boyunca yüksek kullanım oranını (örneğin %80'in üzerinde) sağlayabileceğiniz GPU sayısı için. 12
- Kesintiye uğrayabilen iş yükleri için: Yukarıda belirtilen yüksek kullanım süresinin birkaç kat daha uzun olması gerekir, çünkü talep üzerine (kesintiye uğramayan) işlem fiyatları, anlık (kesintiye uğrayabilen) işlem fiyatlarından birkaç kat daha pahalı olma eğilimindedir.
Yoğun GPU iş yüküne sahip işletmeler için önerimiz, garantili talebin kendi GPU'larında, değişken talebin ise bulutta çalıştırıldığı, hem kendi GPU'larınızın hem de kiralık GPU'ların bir karışımıdır. Bu nedenle Facebook gibi teknoloji devleri, yüzlerce GPU içeren kendi GPU kümelerini kuruyorlar. 13
Alıcılar, daha iyi fiyat/performans oranı sunan tüketici sınıfı GPU'ları değerlendirmeye yönelebilirler; ancak bu yazılımların son kullanıcı lisans sözleşmesi (EULA), veri merkezlerinde kullanımlarını yasaklamaktadır. 14 Bu nedenle, veri bilimcilerinin bilgisayarlarında küçük çaplı test iş yükleri dışında, makine öğrenimi için uygun değillerdir.
Bulut sağlayıcı performans karşılaştırması
Aynı donanıma sahip cihazlarda bulut sağlayıcısı seçiminin performansı etkileyip etkilemediğini anlamak için, AMD MI300X 192 GB GPU üzerinde özel bir kıyaslama testi gerçekleştirdik ve aynı metin ve görüntü oluşturma iş yüklerini hem Digital Ocean hem de Runpod'da çalıştırdık.
Bulgularımız, performansın genel olarak benzer olmasına rağmen, aşağıdaki grafikte gösterildiği gibi küçük ama ölçülebilir farklılıklar olduğunu ortaya koymaktadır:
Başlıca Gözlemler:
- Metin oluşturma konusunda Digital Ocean, saniyede yaklaşık %0,4 daha fazla token işleyerek biraz daha yüksek bir verimlilik sergiledi.
- Öte yandan, görüntü oluşturma konusunda Runpod, saniyede yaklaşık %0,4 daha fazla görüntü işleyerek küçük bir avantaj gösterdi.
Bu küçük farklılıklar büyük olasılıkla sunucu mimarisi, ağ altyapısı veya sağlayıcının özel sanallaştırma ve sürücü yapılandırmalarındaki farklılıklardan kaynaklanmaktadır.
Bu fark düzeyi tüm kullanım durumları için kritik olmasa da, maksimum optimizasyon gerektiren iş yüklerinde, aynı GPU modelini kullanırken bile bulut sağlayıcısı seçiminin performans ayarlamasında önemli bir faktör olabileceğini vurgulamaktadır.
Bulut GPU kıyaslama metodolojisi
Fiyatlar: Bulut GPU fiyatları aylık olarak güncellenmektedir.
Bu bölümde, bulut GPU kıyaslama testlerimizin performansını ve maliyet etkinliğini ölçmek için kullanılan metodoloji ayrıntılı olarak açıklanmaktadır. Aksi belirtilmedikçe, tüm testlerde 4 bitlik FP niceleme kullanılmıştır.
Metin ince ayarı (Verimlilik)
Bu metrik, bir dil modelinin eğitilmesi için ham işlem hızını saniyede token cinsinden ölçer. Şu soruyu yanıtlar: "Bu GPU, ince ayar sırasında saniyede kaç token işleyebilir?"
- Model: Llama 3.2
- Veri kümesi: FineTome veri kümesinden alınan ilk 5.000 görüşme.
- Süreç: Model, toplam 1 milyon token kullanılarak 5 epoch boyunca ince ayarlandı.
- Hesaplama: İşlem hacmi (Toplam Token Sayısı * Epoch Sayısı) / Toplam İnce Ayar Süresi olarak hesaplanır. Nihai ölçüt saniye başına token sayısıdır (token/s) .
- Çerçeve: Tembellikten Uzak
Metin İnce Ayarı (Verimlilik)
Bu metrik, ince ayarın maliyet etkinliğini dolar başına token cinsinden ölçer. Şu soruyu yanıtlar: "Bu GPU'ya harcanan her dolar için kaç token işlenebilir?"
- Hesaplama: Bu değer, işlem hacmi testinden elde edilir. İşlenen toplam token sayısının, GPU örneğinin saatlik maliyetine bölünmesiyle hesaplanır. Nihai ölçüt, dolar başına token sayısıdır (token/$) .
Metin Çıkarımı (Verimlilik)
Bu metrik, eğitilmiş bir modelle metin oluşturmanın ham hızını saniyede token cinsinden ölçer. Gerçek zamanlı uygulamalar için kritik öneme sahiptir.
- Süreç: Giriş ve çıkış token'ları dahil olmak üzere toplam 1 milyon token üretildi.
- Hesaplama: İşlem hacmi, Toplam Token Sayısı / Toplam Süre formülüyle hesaplanır. Nihai ölçüt , saniye başına token sayısıdır (token/s) .
- Çerçeve: llama-cpp-python
Metin Çıkarımı (Verimlilik)
Bu ölçüt, dolar başına token cinsinden hesaplanarak metin oluşturmanın maliyet etkinliğini ölçer.
- Hesaplama: Bu değer çıkarım testinden elde edilir. Üretilen toplam token sayısının GPU örneğinin saatlik maliyetine bölünmesiyle hesaplanır. Nihai ölçüt , dolar başına token sayısıdır (token/$) .
Görüntü İnce Ayarı (Verimlilik)
Bu metrik, bir görüntü tanıma modelinin eğitilmesi için gereken ham işlem hızını saniyede kaç görüntü olduğu cinsinden ölçer.
- Model: YOLOv9
- Veri kümesi: SkyFusion veri kümesinden 100 görüntü.
- Süreç: Model bu veri seti üzerinde 4 epoch boyunca eğitildi.
- Hesaplama: Performans, eğitim sırasında işlenen saniyedeki görüntü sayısı (görüntü/s) cinsinden ölçülür.
- Çerçeve: Tembellikten Uzak
Görüntü İnce Ayarı (Verimlilik)
Bu ölçüt, bir görüntü modelinin eğitilmesinin maliyet etkinliğini, dolar başına elde edilen görüntü sayısı cinsinden hesaplayarak ölçer.
- Hesaplama: Bu değer, görüntü ince ayar testinden elde edilir. İşlenen toplam görüntü sayısının GPU örneğinin saatlik maliyetine bölünmesiyle hesaplanır. Nihai ölçüt, dolar başına görüntü sayısıdır (görüntü/$) .
Görüntü Çıkarımı (Verimlilik)
Bu metrik, eğitilmiş bir modelle görüntülerin analiz edilme hızını saniyede görüntü sayısı cinsinden ölçer.
- Model: Yukarıda açıklanan süreçle ince ayar yapılmış YOLOv9 modeli.
- Veri kümesi: Yaklaşık 500 adet, 640x640 çözünürlüğünde görüntü.
- Hesaplama: Performans, modelin saniyede işleyebileceği görüntü sayısı (görüntü/s) ile ölçülür.
Görüntü Çıkarımı (Verimlilik)
Bu ölçüt, dolar başına düşen görüntü sayısı üzerinden hesaplanarak, görüntü analizinin maliyet etkinliğini ölçer.
- Hesaplama: Bu değer, görüntü çıkarım testinden elde edilir. İşlenen toplam görüntü sayısının GPU örneğinin saatlik maliyetine bölünmesiyle hesaplanır. Nihai ölçüt , dolar başına görüntü sayısıdır (görüntü/$) .
Sonraki adımlar:
- Veri toplama sıklığı artırılacaktır.
- GPU kapsamını artıracağız, daha fazla ölçüm ekleyeceğiz ve zaman içinde performans ölçümlerimizi güncelleyeceğiz.
En iyi bulut GPU donanımları hangileridir?
AMD, büyük ölçekli yapay zeka eğitimi ve çıkarım iş yüklerinde NVIDIA ile rekabet etmek için CDNA 4 mimarisine sahip Instinct MI450 serisi GPU'larını ve Helios raf platformunu kullanıma sunuyor. Şubat 2026'da Meta, 6 gigawatt'a kadar AMD Instinct GPU'su dağıtımı için çok yıllık bir ortaklık duyurdu; bu, tarihsel olarak büyük bir dağıtım anlamına geliyor. 15
NVIDIA'nın yakında piyasaya süreceği Rubin mimarisi (örneğin NVL-144 Rubin GPU), bulut tabanlı eğitim iş yükleri için NVLink 6 ve HBM4 belleğe sahip. İhracat kısıtlamaları nedeniyle, Çinli yapay zeka firmalarının donanıma erişmek için yurtdışı bulut sağlayıcıları aracılığıyla Rubin GPU örneklerini kiraladıkları bildiriliyor. 16
Nvidia dışı GPU'lar sunan bulut GPU sağlayıcılarını görmek için lütfen bulut GPU sağlayıcıları listesine göz atın.
Tüm yapay zeka çipleri/donanımları hakkında bilgi edinin.
Bulut tabanlı GPU pazarları nelerdir?
Salad, Vast.ai ve Clore.ai gibi dağıtık bulut pazaryerleri, pazar yeri modeli aracılığıyla merkezi olmayan GPU işlem gücüne erişim sağlar. Kullanılmayan donanıma sahip kullanıcılar GPU'larını kiralama için listeleyebilirken, GPU gücüne ihtiyaç duyanlar farklı fiyat noktalarındaki mevcut kaynaklar arasından seçim yapabilir. Bu platformlar, merkezi bulut sağlayıcılarına bağımlı kalmadan arz ve talep arasındaki bağlantıyı kolaylaştırır. GPU yoğun görevler için uygun maliyetli ve esnek çözümler sunarlar.
- Salad : Yapay zeka eğitimi veya kripto para madenciliği gibi görevler için tasarlanmış, kullanıcı ödüllerine ve kullanım kolaylığına odaklanan merkeziyetsiz bir ağ.
- Vast.ai : Uygun fiyatlı ve ölçeklenebilir işlem kaynaklarına ihtiyaç duyan kullanıcıları GPU sağlayıcılarıyla buluşturuyor. Yapay zeka ve makine öğrenimi iş yüklerine odaklanıyor.
- Clore.ai : Yapay zeka ve yüksek performanslı bilgi işlem (HPC) iş yüklerine odaklanan, bulut tabanlı GPU'lar için dağıtılmış bir pazar yeri.
- Kryptex : Kullanıcıların GPU'larını kiralayarak kripto para kazanmalarını sağlayan bir platform. Ana odak noktası, kripto para madenciliği veya karmaşık hesaplamalar gibi görevleri gerçekleştirmektir.
En iyi bulut tabanlı GPU platformları hangileri?
En iyi bulut GPU sağlayıcıları şunlardır:
- AWS
- Microsoft Azure
- CoreWeave
- Google Bulut Platformu (GCP)
- IBM Cloud
- Jarvis Laboratuvarları
- Lambda Laboratuvarları
- Oracle Bulut Altyapısı (OCI)
- DigitalOcean tarafından sunulan Paperspace CORE
- Runpod.io
- Crusoe Bulutu
Bulut tabanlı GPU'lar konusunda emin değilseniz, sunucusuz GPU gibi diğer seçenekleri inceleyebilirsiniz.
Notlar
Bulut hizmet sağlayıcıları sürekli olarak sundukları hizmetleri güncelliyor, bu nedenle bu araştırma da sürekli olarak güncellenecektir.
SSS'ler
Sıralı seri işlemeye optimize edilmiş nispeten az sayıda çekirdeğe sahip olabilen bir CPU'nun aksine, bir GPU, çoklu iş parçacığı ve paralel işleme yüklerini yönetmek için tasarlanmış yüzlerce hatta binlerce daha küçük çekirdeğe sahip olabilir.
Bulut GPU, bulut üzerinden GPU işlem kaynaklarına uzaktan erişim sağlayarak yerel donanıma olan ihtiyacı ortadan kaldırır. Geleneksel bulut hizmetlerine çok benzeyen bulut GPU, donanıma önceden sermaye yatırımı yapmaya gerek kalmadan, yüksek performanslı işlem kaynaklarına anında veya talep üzerine erişmenizi sağlar.
Makine Öğrenimi ve Yapay Zeka
GPU'lar, makine öğrenimi (ML) ve yapay zeka (AI) modelleri için gereken karmaşık hesaplamaları gerçekleştirmede özellikle etkilidir. Birden fazla hesaplamayı paralel olarak işleyebildikleri için büyük sinir ağlarını ve algoritmaları eğitmek için uygundurlar.
– Derin öğrenme: Derin öğrenme, makine öğrenmesinin bir alt alanıdır. Derin öğrenme iş yükleri, özellikle büyük model eğitimi ve çıkarımı, bulut GPU talebinin başlıca itici gücüdür.
Veri işleme
– Veri analizi : GPU'lar, Büyük Veri analizi ve gerçek zamanlı analiz gibi hesaplama ve veri işleme görevlerini hızlandırmak için kullanılır. Yüksek işlem hacmi gerektiren paralel işlem görevlerini CPU'lardan daha verimli bir şekilde gerçekleştirebilirler.
– Bilimsel hesaplama: Bilimsel araştırmalarda, bulut tabanlı GPU'lar simülasyonlar, biyoinformatik, kuantum kimyası, hava durumu modellemesi ve daha fazlası için hesaplamaları gerçekleştirebilir.
Oyun ve eğlence
Bulut GPU'lar, Google'ın Stadia'sı veya NVIDIA'nın GeForce Now'u gibi bulut oyun hizmetleri sağlamak için kullanılır; burada oyun buluttaki bir sunucuda çalışır ve işlenmiş kareler oyuncunun cihazına aktarılır. Bu, güçlü bir yerel makineye ihtiyaç duymadan yüksek kaliteli oyun deneyimi sağlar.
– Grafik işleme: GPU'lar başlangıçta bilgisayar grafiklerini işlemek üzere tasarlanmıştır ve bu alanda hala mükemmel performans sergilemektedirler. Bulut GPU'ları 3D modelleme ve işleme, 3D görselleştirmeler, sanal gerçeklik (VR), bilgisayar destekli tasarım (CAD) ve bilgisayar tarafından oluşturulan görüntüler (CGI) için kullanılmaktadır.
– Video işleme: Video kodlama ve kod çözme, video düzenleme, renk düzeltme, efekt oluşturma ve diğer video işleme görevlerinde kullanılırlar.
Kripto para madenciliği
GPU'lar kripto para madenciliği gibi görevlerde de kullanılmaktadır. Bununla birlikte, uygulamaya özel entegre devreler (ASIC'ler), daha yaygın olarak madenciliği yapılan kripto paralar için daha iyi ekonomik avantajlar sunmaktadır.
Yorumlar 2
Düşüncelerinizi Paylaşın
E-posta adresiniz yayınlanmayacak. Tüm alanlar gereklidir.
Cem - great article, I'd love to pick your brain on private networking or direct connects to these GPU instances.
Hi Ashley, thank you! Sure, happy to chat.
Hi there, fantastic article and very well-researched. Would you mind checking out Dataoorts at https://dataoorts.com
Sure, we'll review to see if we can include Dataoorts in the next edit.