AIMultiple'ın bulut GPU kıyaslama testini 4 farklı senaryoda 10 farklı GPU modeliyle çalıştırarak elde ettiğimiz deneyime dayanarak, veri merkezi iş yükleri için en iyi yapay zeka donanım şirketlerini belirledik. Her bir seçimin ardındaki gerekçelerimizi görmek için bağlantıları takip edin:
Kategoriye göre 25'ten fazla yapay zeka çip üreticisi
*Seçilen modeller en son duyurulara dayanmaktadır.
**ACCEL, Çinli bilim insanları tarafından Alibaba ve Çin'in Uluslararası Yarı İletken Üretim Şirketi (SMIC) ile işbirliği içinde geliştirilmiştir.** 1
Sıralama kategoriye göre yapılır. Satıcılar, satış rakamları veya bulut kullanımının tahmin edilebildiği ilk 3 kategori (örneğin, lider üretici, genel bulut, genel yapay zeka bulutu) içindeki tahmini pazar payına göre sıralanır. Son üç kategorideki (örneğin, yapay zeka girişimleri, gelecek vadeden üretici, diğer üreticiler) satıcılar alfabetik olarak sıralanır.
5 mobil yapay zeka çipi tedarikçisi
*En popüler ve en yeni çipler seçilmiştir.
5 kenar yapay zeka çipi
Düşük gecikmeli işlemeye olan talep, uç yapay zeka çiplerinde inovasyonu tetikledi. Bu çiplerin işlemcileri, bulut tabanlı çözümlere güvenmek yerine, yapay zeka hesaplamalarını yerel olarak cihazlarda gerçekleştirmek üzere tasarlanmıştır:
*Bunlar, satıcılar tarafından belirtilen maksimum değerlerdir. TOPS, saniyede tera işlem anlamına gelir.
Yapay Zeka Çip Mimarilerini Anlamak: GPU'lar ve ASIC'ler
Tüm yapay zeka çipleri aynı değildir. Yukarıdaki satıcılar aynı pazarda rekabet etseler de, temelde farklı çip mimarileri kullanıyorlar:
- GPU'lar (Grafik İşlem Birimleri) , çok çeşitli yapay zeka iş yüklerinde hem eğitim hem de çıkarım işlemlerini gerçekleştirebilen genel amaçlı işlemcilerdir. NVIDIA ve AMD bu kategoride öne çıkmaktadır.
- ASIC'ler (Uygulamaya Özgü Entegre Devreler), belirli görevler için özel olarak tasarlanmıştır. Bazıları hem eğitim hem de çıkarımı destekler (Google TPU, AWS Trainium), diğerleri ise yalnızca çıkarım yapar (Groq LPU, AWS Inferentia).
Önemli tespit:
Tüm ASIC'ler yalnızca çıkarım yapmaya yönelik değildir. TPU, AWS Trainium, ve Groq LPU ile AWS Inferentia hem eğitim hem de çıkarımı desteklerken, Groq LPU ve AWS Inferentia yalnızca çıkarıma odaklanır.
Bu ayrım alıcılar için önemlidir: GPU'lar farklı yapay zeka iş yüklerinde esneklik sunarken, ASIC'ler watt başına daha iyi performans sağlar ancak model mimarileri değiştikçe yeniden programlanmaları daha zordur.
TrendForce'a göre 2 Yapay zeka sunucu sevkiyat büyüme oranlarına dayanarak, bulut sağlayıcılarından gelen özel ASIC sevkiyatlarının 2026'da %44,6 oranında büyümesi, GPU sevkiyatlarının ise %16,1 oranında büyümesi bekleniyor. Bu, yapay zeka donanım ortamında bir değişime işaret ediyor; büyük ölçekli bulut sağlayıcıları kendi silikonlarına giderek daha fazla yatırım yapıyor.
Önde gelen yapay zeka çip üreticileri hangileridir?
1. NVIDIA
NVIDIA, 1990'lardan beri oyun sektörü için grafik işlem birimleri (GPU'lar) tasarlamaktadır. NVIDIA, çip üretiminin büyük çoğunluğunu TSMC'ye dış kaynak olarak veren, kendi üretim tesisine sahip olmayan bir çip üreticisidir. Başlıca faaliyet alanları şunlardır:
Masaüstü yapay zeka çözümleri
DGX Spark (eski adıyla Project Digits), yapay zeka mühendisleri ve veri bilimcileri için tasarlanmış bir masaüstü yapay zeka süper bilgisayarıdır ve şu özelliklere sahiptir:
- Tahmini maliyeti 3.000 dolar civarında olacak.
- Mac mini ile yaklaşık aynı boyutta ve 128 GB belleğe sahip NVIDIA GB10 Grace Blackwell Superchip işlemcisiyle çalışıyor.
- NVLink-C2C teknolojisini kullanarak yüksek hızlı CPU+GPU iletişimi sayesinde, 200 milyara kadar parametreye sahip modeller için LLM çıkarımı ve ince ayar işlemlerini gerçekleştirebilir.
Veri merkezi çözümleri
Şirket, Ampere, Hopper ve en son olarak Blackwell mimarilerini takip eden yapay zeka çipleri üretiyor. Üretken yapay zeka patlaması sayesinde, NVIDIA son yıllarda mükemmel sonuçlar elde etti, bir trilyon dolarlık bir değere ulaştı ve GPU ve yapay zeka donanım pazarlarının lideri konumunu sağlamlaştırdı. Aşağıdaki grafik, NVIDIA'ün bu segmentteki gelirinin yıllar içinde nasıl büyüdüğünü ve şirketin birincil gelir kaynağı haline nasıl geldiğini göstermektedir.
NVIDIA'ün yonga setleri, çeşitli sektörlerdeki iş sorunlarını çözmek için tasarlanmıştır. DGX™ A100 ve H100, veri merkezlerinde yapay zeka eğitimi ve çıkarımı için tasarlanmış, Nvidia'nın başarılı amiral gemisi yapay zeka çipleridir. 3 NVIDIA bunları takip etti.
- H200, B300 ve GB300 çipleri
- HGX H200 ve HGX B300 gibi HGX sunucuları, bu çiplerden 8 tanesini bir araya getiriyor.
- NVL serisi ve GB200 SuperPod, daha da fazla çipi büyük kümeler halinde bir araya getiriyor. 4
Bulut GPU'ları
Veri merkezi teklifinin gücü sayesinde, NVIDIA bulut yapay zeka pazarında neredeyse tekel konumundadır; çoğu bulut sağlayıcısı bulut GPU'su olarak yalnızca NVIDIA GPU'ları sunmaktadır.
NVIDIA ayrıca, bulut sağlayıcılarını atlayarak doğrudan işletmelere bulut GPU altyapısı sağlayan DGX Cloud hizmetini de piyasaya sürdü.
grafik işlemciler (GPU'lar)
Xbox, NVIDIA ve Microsoft tarafından ortaklaşa geliştirilen bir yonga seti kullanıyor. NVIDIA'ün perakende kullanıcıları için ürettiği GPU'lar arasında GeForce serisi de bulunuyor.
Son gelişmeler
DGX Cloud Lepton
19 Mayıs 2025'te Computex'te duyurulan NVIDIA'ün DGX Cloud Lepton'u, yapay zeka geliştiricilerini CoreWeave, Lambda ve Crusoe dahil olmak üzere NVIDIA'ün GPU bulut sağlayıcılarına bağlayan bir pazar yeridir. Geleneksel bulut sağlayıcı bağımlılıklarını atlayarak, yapay zeka model eğitimi ve çıkarımı için GPU kaynaklarına esnek erişim sağlar. Bu, NVIDIA'ün kurumsal odaklı bulut stratejisini güçlendirir. 5
NVIDIA Dinamo
GTC 2025'te duyurulan Dynamo, dağıtılmış ortamlarda üretken yapay zeka modellerinin yüksek verimlilik ve düşük gecikmeyle dağıtımı için tasarlanmış yeni bir açık kaynaklı çıkarım çerçevesidir ve aşağıdaki şekilde gösterildiği gibi Blackwell'de istek sunma hızını 30 kata kadar artırır. PyTorch ve TensorRT-LLM gibi popüler araçlarla uyumlu olan bu çerçeve, performansı optimize etmek ve maliyetleri düşürmek için ayrıştırılmış çıkarım aşamaları ve dinamik GPU zamanlaması gibi yeniliklerden yararlanır. Geliştiriciler için GitHub'da bulunan ve kurumsal çözümler için NIM mikro hizmetlerine dahil edilen Dynamo, tek GPU'lu sistemlerden çoklu GPU'lu sistemlere kadar ölçeklenebilir ve uygun maliyetli üretken yapay zeka sunmayı kolaylaştırır. 6
NVIDIA RTX PRO Sunucuları ve Kurumsal Yapay Zeka Fabrikası
Mayıs 2025'te Computex'te duyurulan NVIDIA, kurumsal yapay zeka fabrikaları için tasarlanmış, RTX PRO 6000 Blackwell Server Edition GPU'larla güçlendirilmiş RTX PRO Sunucularını tanıttı. Bu sunucular, yapay zeka, tasarım, mühendislik ve iş uygulamaları için evrensel hızlandırma sağlayarak, NVIDIA Omniverse platformunda çok modlu yapay zeka çıkarımı, fiziksel yapay zeka ve dijital ikizler gibi iş yüklerini destekliyor.
RTX PRO Sunucuları, Spectrum-X Ethernet, BlueField DPU'ları ve AI Enterprise yazılımını içeren, onaylanmış NVIDIA Kurumsal Yapay Zeka Fabrikası tasarımı, Cadence, Foxconn ve Lilly gibi ortakların şirket içi yapay zeka altyapısı kurmalarını sağlıyor. Bu girişim, trilyon dolarlık BT sektörünün GPU hızlandırmalı yapay zeka fabrikalarına geçişini hızlandırıyor. 8
DeepSeek
DeepSeek'ın R1 sürümünün yayınlanması, son teknoloji modellerin nispeten az sayıda GPU ile eğitilebileceğini gösterdi. Bu, NVIDIA'ün hisse senedi fiyatında bir düşüşe yol açtı. Bu bir yatırım tavsiyesi olmasa da, NVIDIA için olumlu olabilir çünkü bilgi işlem gücü ne kadar fazla fayda sağlarsa, o kadar yaygın olarak kullanılmalıdır (yani, Jevons paradoksu). 9 ).
Ancak, çip tasarımı ve ara bağlantı teknolojisindeki gelişmeler sayesinde GPU sistemlerinin performansının yılda birkaç kat arttığı göz önüne alındığında, alıcıların yıllık ihtiyaçlarının ötesinde satın alma yapmamaları akıllıca olacaktır; zira bu durum eski sistemlere sahip olmalarına yol açabilir.
Tarifeler ve ihracat kısıtlamaları
NVIDIA artık Çin pazarına gelişmiş yapay zeka işlemcileri ihraç etme iznine sahip; bu, daha önce yalnızca düşük özellikli sürümlerin satılmasına yönelik şartlardan bir değişimi işaret ediyor. Ancak bu ihracatlar yeni lojistik ve finansal engellerle karşı karşıya: Tayvan'da üretilen çipler artık üçüncü taraf testleri için Amerika Birleşik Devletleri üzerinden geçmek zorunda kalıyor ve bu da yeni uygulanan %25'lik ulusal güvenlik tarifesini tetikliyor.
Üst düzey donanıma erişimin yeniden sağlanmasına rağmen, artan maliyetler ve tedarik zinciri karmaşıklıkları, Çin hükümetini ve çip endüstrisini rekabetçi yerel alternatifler geliştirmeye teşvik etmeye devam ediyor. Çin çipleri şu anda NVIDIA'ün en son teknolojisinin gerisinde kalsa da, bu ticaret engelleri, yerli gelişmenin stratejik bir öncelik olarak kalmasını sağlayarak gelecekte NVIDIA'ün pazar hakimiyetine potansiyel olarak meydan okuyabilir. 10
Çıkarım Piyasası Rekabeti
NVIDIA yapay zeka "eğitim" pazarında hakim konumdayken, yapay zeka modellerinin gerçek dünya görevleri için uygulanması anlamına gelen "çıkarım" alanında rekabet kızışıyor. AMD gibi şirketler ve Untether AI ve Groq dahil olmak üzere çok sayıda startup, özellikle daha düşük güç tüketimine odaklanarak daha uygun maliyetli çıkarım çözümleri sağlamayı amaçlayan çipler geliştiriyor.
Yeni “akıl yürütme” yapay zeka teknikleri daha fazla işlem gücü gerektiriyor. NVIDIA, akıl yürütmenin uzun vadede kendi mimarisini destekleyeceğine inanıyor ve pazar payı daha küçük olsa bile, çıkarım pazarının sonunda eğitim pazarını boyut olarak geride bırakacağını öngörüyor. 11
2. AMD
AMD, CPU, GPU ve yapay zeka hızlandırıcı ürünleri üreten, üretim tesisi bulunmayan bir çip üreticisidir.
AMD, Haziran 2023'te yapay zeka eğitim iş yükleri için MI300'ü piyasaya sürdü ve pazar payı için NVIDIA ile rekabet ediyor. Nvidia yapay zeka donanımının, ChatGPT'nin piyasaya sürülmesiyle tetiklenen üretken yapay zekanın yükselişiyle birlikte hızla artan talep nedeniyle temin edilmesinin zorlaşması sonucu, 2023 yılında birçok startup, araştırma enstitüsü, işletme ve teknoloji devi AMD donanımını benimsedi. 12 13 14
2025 yılında, AMD, uç nokta sağlayıcıları ve kurumsal veri merkezleri için enerji verimli yapay zeka çıkarım çipleri geliştiren Untether AI'dan yetenekli bir yapay zeka donanım ve yazılım mühendisleri ekibini satın aldığını duyurdu. Bu hamle, AMD'ün yapay zeka derleyicisi, çekirdek geliştirme ve çip tasarım yeteneklerini geliştirerek çıkarım pazarındaki konumunu daha da güçlendiriyor. Ek olarak, AMD, kurumsal uygulamalar için Instinct veri merkezi GPU'larında yapay zeka performansını optimize etmek amacıyla derleyici girişimi Brium'u satın aldı. 15
AMD, MI300'ün yerini alacak ve NVIDIA'ün H200'üyle rekabet edecek MI350 serisini piyasaya sürecek. AMD, yakın zamanda piyasaya sürülen bir diğer çip olan MI325X'in piyasadaki en iyi çıkarım performansına sahip olduğunu iddia ediyor. 16
AMD, veri bilimcilerinin donanımlarını daha verimli kullanmalarını sağlamak için Hugging Face gibi makine öğrenimi şirketleriyle de çalışmaktadır. 17
Yazılım ekosistemi kritik öneme sahiptir çünkü donanım performansı büyük ölçüde yazılım optimizasyonuna bağlıdır. Örneğin, AMD ve NVIDIA, H100 ve MI300'ün performans testleri konusunda kamuoyuna açık bir anlaşmazlık yaşamıştı. Anlaşmazlığın odak noktası, performans testinde kullanılacak paket ve kayan nokta sayısıydı. En son performans testlerine göre, MI300'ün 70B LLM üzerinde çıkarım yapma konusunda H100'den daha iyi veya ona denk olduğu görülüyor. 18
Yazılım
Donanım AMD ile aynı seviyeye gelirken, yazılımı kullanılabilirlik açısından geride kalıyor. CUDA çoğu görev için kullanıma hazır haldeyken, AMD yazılımı önemli ölçüde yapılandırma gerektiriyor. 19
Ekosistem
NVIDIA gibi, AMD de donanımının benimsenmesini sağlamak için çözümlerinin kullanıcılarına seçici olarak yatırım yapıyor. 20
3. Intel
Intel, CPU pazarındaki en önemli oyuncudur ve uzun bir yarı iletken geliştirme geçmişine sahiptir. NVIDIA ve AMD'ün aksine, Intel çiplerini üretmek için kendi dökümhanesini kullanmaktadır.
Gaudi3, Intel yılından kalma en yeni yapay zeka hızlandırıcı işlemcisidir. 21 Ancak, Intel'nin Gaudi3 için 2024 yılı satış tahmini yaklaşık 500 milyon dolardı; bu, AMD'ün 2024 yılında kazanmayı öngördüğü milyarlarca dolara kıyasla önemli ölçüde daha düşüktür.
Intel, CEO'su Pat Gelsinger'in Aralık 2024'te ayrılmasıyla da görüldüğü üzere, yönetimsel sorunlar yaşıyor. Intel'nin yönetim kurulu üyelerinin önemli bir kısmı, bir yarı iletken şirketini operasyonel olarak yönetme konusunda deneyimsiz. 22 CEO'sunun ayrılmasının ardından, Intel'nin yapay zeka ve dökümhane pazarlarındaki stratejisi belirsizliğini koruyor.
Hangi genel bulut sağlayıcıları yapay zeka çipleri üretiyor?
4. AWS
AWS, model eğitimi için Tranium çipleri ve çıkarım için Inferentia çipleri üretmektedir. AWS, halka açık bulut hizmetlerinde pazar lideri olmasına rağmen, kendi çiplerini geliştirmeye Google yılından sonra başlamıştır.
LLM geliştiricisi Anthropic'nın modellerine güç veren Project Rainier kümesini oluşturmak için yüz binlerce Tranium2 çipi kullanılıyor.
5. Google Bulut Platformu
Google Cloud TPU, Çeviri, Fotoğraflar, Arama, Asistan ve Gmail gibi Google ürünlerine güç veren, amaca yönelik olarak tasarlanmış makine öğrenimi hızlandırıcı çipidir. Google Cloud üzerinden de kullanılabilir. Google, TPU'ları 2016 yılında duyurdu. 23 En yeni Trillium TPU, 6. nesildir. 24
Google Ironwood'u tanıttı. Bu en yeni nesil, LLM'ler ve MoE'ler gibi karmaşık "düşünme modelleri" için özel olarak tasarlanmıştır ve devasa paralel işlem gücü (çip başına 4.614 TFLOP) sunar ve 9.216 çiplik podlarda 42,5 Exaflops'a kadar ölçeklenebilir. 25
Ironwood, Trillium'a kıyasla önemli ilerlemeler sunuyor; bunlar arasında 2 kat daha iyi güç verimliliği, 6 kat daha fazla Yüksek Bant Genişliğine Sahip Bellek kapasitesi (çip başına 192 GB), 4,5 kat daha fazla HBM bant genişliği (çip başına 7,2 TBps) ve 1,5 kat daha yüksek Çipler Arası Bağlantı hızı (1,2 Tbps) yer alıyor. Ayrıca büyük gömme işlemleri için geliştirilmiş bir SparseCore özelliğine de sahip. Google ayrıca, akıllı telefonlar ve IoT donanımları gibi uç cihazlarda kullanılmak üzere tasarlanmış, farklı ihtiyaçlar için çok daha küçük Edge TPU'yu da üretiyor.
6. Alibaba
Alibaba, çıkarım işlemleri için Hanguang 800 gibi çipler üretiyor. Ancak bazı Kuzey Amerika, Avrupa ve Avustralya kuruluşları (örneğin savunma sanayindekiler) jeopolitik nedenlerle Alibaba Cloud'i kullanmayı tercih etmeyebilir.
7. IBM
IBM, 2022 yılında en yeni derin öğrenme çipi olan yapay zeka birimini (AIU) duyurdu. 26 IBM bu çipleri Watsonx üretken yapay zeka platformuna güç sağlamak için kullanmayı düşünüyor. 27
IBM AIU, IBM Z ana bilgisayar sunucularının yapay zeka işleme yeteneklerini sağlayan IBM Telum İşlemcisi üzerine kurulmuştur. Lansman sırasında, Telum işlemcilerinin öne çıkan kullanım alanları arasında dolandırıcılık tespiti yer alıyordu. 28
IBM ayrıca işlem gücü ve belleğin birleştirilmesinin verimliliğe yol açabileceğini de göstermiştir. Bu durum, Kuzey Kutbu işlemci prototipinde gösterilmiştir. 29
8. Huawei
Huawei'in HiSilicon Ascend 910C'si, 2019'da tanıtılan Ascend 910 çip ailesinin bir parçasıdır.
Yaptırımlar nedeniyle Çin'deki yapay zeka laboratuvarları, NVIDIA veya AMD gibi ABD firmalarından en yeni ve en yüksek performanslı çipleri satın alamıyor. Bu nedenle Ascend 910C ile deneyler yapıyorlar.
Huawei'in bulutunda DeepSeek modelleri barındırılıyor ve DeepSeek'daki bir araştırmacı, bunun NVIDIA H100 çıkarım performansının %60'ına ulaşabileceğini iddia ediyor. 30
Hangi bulut yapay zeka sağlayıcıları kendi çiplerini üretiyor?
Bu sağlayıcılar, büyük ölçekli bulut sağlayıcıları gibi kapsamlı yeteneklere sahip halka açık bulutlara sahip değiller. Genellikle yapay zeka çıkarımına odaklanan sınırlı bulut hizmetleri sunuyorlar. Satış ekipleriyle görüşmeden bu hizmetlere kaydolabildik:
9. Groq
Groq, eski Google çalışanları tarafından kurulmuştur. Şirket, yapay zeka çip mimarisi için yeni bir model olan LPU'ları temsil etmekte ve şirketlerin sistemlerini benimsemelerini kolaylaştırmayı amaçlamaktadır. Girişim, yaklaşık 350 milyon dolar yatırım almış ve GroqChip™ İşlemci, GroqCard™ Hızlandırıcı gibi ilk modellerini üretmiştir.
Şirket, LLM çıkarımına odaklanmış durumda ve Llama-2 70B için kıyaslama testleri yayınladı. 31
Groq, yakın zamanda Suudi Arabistan'dan ülkeye gelişmiş yapay zeka çiplerinin teslimatını genişletmek için 1,5 milyar dolarlık önemli bir yatırım taahhüdü aldı. Bu yatırım, Groq'un Aramco Digital ile ortaklaşa kurduğu Suudi Arabistan'ın Dammam kentindeki mevcut veri merkezini genişletmek için kullanılacak. 32
Şirket, 2024 yılının ilk çeyreğinde bulut platformuna 70.000 geliştiricinin kaydolduğunu ve 19.000 yeni uygulama geliştirdiğini açıkladı. 33
1 Mart 2022'de Groq, finansal hizmetler için yüksek performanslı bilgi işlem (HPC) çözümleri sunan Maxeler'i satın aldı. 34
10. SambaNova Sistemler
SambaNova Systems, yüksek hacimli üretken yapay zeka iş yükleri için yüksek performanslı, yüksek hassasiyetli donanım-yazılım sistemleri geliştirmek amacıyla 2017 yılında kurulmuştur. Şirket, Şubat 2026'da gerçekleşen 350 milyon dolarlık E Serisi yatırım turu da dahil olmak üzere toplamda 1,5 milyar dolardan fazla fon toplamıştır. 35
Şubat 2026'da SambaNova, en yeni Yeniden Yapılandırılabilir Veri Birimi (RDU) olan SN50 çipini tanıttı ve rakip çiplerden 5 kat daha hızlı maksimum hız ve ajan tabanlı yapay zeka iş yükleri için GPU'lara kıyasla 3 kat daha düşük toplam sahip olma maliyeti iddiasında bulundu. SN50, önceki nesil SN40L'ye göre hızlandırıcı başına 5 kat daha fazla işlem gücü ve 4 kat daha fazla ağ bant genişliği sunuyor ve 10 trilyondan fazla parametre modeli ve 10 milyondan fazla belirteç bağlam uzunluğu için üç katmanlı bir bellek mimarisini destekliyor. 36
SoftBank Corp., Japonya'daki yeni nesil yapay zeka veri merkezlerinde SN50'yi kullanan ilk müşteri olacak.
SambaNova ayrıca, Intel ile yapay zeka çıkarım çözümleri sunmak üzere planlanan çok yıllık stratejik bir iş birliğini duyurdu. Bu iş birliği, SambaNova'in sistemlerini Intel Xeon işlemcileri, Intel GPU'ları ve Intel ağ altyapısıyla birleştirerek, GPU merkezli çözümlere alternatif olarak ölçeklenebilir bir çıkarım altyapısı oluşturmayı amaçlıyor.
Şunu belirtmekte fayda var ki, SambaNova Systems, platformunu SambaCloud aracılığıyla işletmelere de kiralıyor. Bu yapay zeka platformu hizmeti yaklaşımı, sistemlerinin benimsenmesini kolaylaştırıyor ve döngüsel ekonomi için donanımın yeniden kullanımını teşvik ediyor. 37
Önde gelen yapay zeka çip girişimleri hangileri?
Ayrıca, yakın gelecekte adlarını daha sık duyabileceğimiz yapay zeka çip endüstrisindeki bazı girişim şirketlerini de tanıtmak istiyoruz. Bu şirketler henüz yakın zamanda kurulmuş olsalar da, şimdiden milyonlarca dolar yatırım almış durumdalar.
11. Cerebras
Cerebras 2015 yılında kurulmuştur ve wafer ölçekli çiplere odaklanan tek büyük çip üreticisidir. 38 Yonga levha ölçekli çipler, daha yüksek bellek bant genişlikleri sayesinde GPU'lara kıyasla paralellik açısından avantajlara sahiptir. Bununla birlikte, bu tür çiplerin tasarımı ve üretimi gelişmekte olan bir teknolojidir.
Cerebras çipleri şunları içerir:
- 1,2 trilyon transistöre ve 400 bin işlemci çekirdeğine sahip WSE-1.
- 2,6 trilyon transistör ve 850 bin çekirdeğe sahip WSE-2, Nisan 2021'de duyuruldu. TSMC'nin 7nm üretim sürecini kullandı.
- 4 trilyon transistör ve 900 bin yapay zeka çekirdeği içeren WSE-3, Mart 2024'te duyuruldu. TSMC'nin 5nm üretim sürecini kullanıyor. 39
Celebra'nın sistemi, AstraZeneca ve GlaxoSmithKline gibi ilaç şirketleri ve simülasyonlar için ona güvenen araştırma laboratuvarlarıyla çalışmaktadır. Ayrıca, çiplerinin sınır modelleri için çıkarım maliyetlerini düşürebilmesi nedeniyle LLM üreticilerini de hedeflemektedir.
Cerebras ayrıca çiplerini kurumsal müşterilere bulut üzerinden de sunmaktadır.
12. d-Matrix
d-Matrix, geleneksel von Neumann mimarisini terk ederek bellek içi hesaplamayı tercih eden yeni bir yaklaşım izliyor. Bu yaklaşım, bellek ve hesaplama arasındaki darboğazı çözme potansiyeline sahip olsa da, yeni ve henüz kanıtlanmamış bir yaklaşımdır. 40
13. İsyanlar
Kore merkezli bir girişim şirketi, 2024 yılında 124 milyon dolar yatırım aldı ve LLM çıkarımına odaklanıyor. 41
Rebellions, bir başka Koreli yarı iletken tasarım firması olan SAPEON ile birleşti ve 2024 yılında unicorn değerine ulaştı. 42
Temmuz 2025'te Rebellions, planlanan halka arz (IPO) öncesinde, 200 milyon dolara kadar ulaşmayı hedefleyen bir finansman turunun parçası olarak teknoloji devi Samsung'tan yatırım aldı. Şirket, 2020'deki kuruluşundan bu yana 220 milyon dolar topladı ve Samsung'un 4 nanometre üretim sürecinden yararlanarak ikinci nesil çipi Rebel-Quad'ı (dört Rebel AI çipinden oluşuyor) 2025'in sonlarında piyasaya sürmek için Samsung ile iş birliği yapıyor. 43
14. Tenstorrent
Tenstorrent'ün en yeni Blackhole Tensix İşlemcisi, 32 GB GDDR6 bellek ve 512 GB/s bellek bant genişliğiyle birlikte 664 TFLOPS (BLOCKFP8) performans sunuyor.
P150a kartının fiyatı 1.399 dolar olup, çoklu kart ölçeklendirmesi için dört adet QSFP-DD 800G portuna sahiptir. Giriş seviyesi P100a modeli ise 999 dolardan başlıyor. 44
Tenstorrent tamamen açık kaynaklı bir yazılım yığını sunmaktadır. Şirket, Aralık 2024'te Jeff Bezos da dahil olmak üzere yatırımcılardan 2,6 milyar dolardan fazla bir değerlemeyle 700 milyon dolar yatırım aldı. 45
15. Pozitron
Positron 2023 yılında kuruldu ve tamamen transformatör model çıkarımına odaklanıyor. Şirket, genel amaçlı GPU hesaplaması yerine, özellikle transformatör mimarileri için optimize edilmiş, amaca yönelik donanımlar üreten bir ASIC yaklaşımı benimsiyor.
Ürünler:
- Atlas (şimdi satışta): Toplam 256 GB HBM belleğe sahip 8 adet Positron Archer Transformer Hızlandırıcı içeren bir transformatör çıkarım sunucusu. Şirket, Llama 3.1 8B üzerinde BF16 hesaplama ile yapılan kıyaslamalarda, Hopper sistemlerine kıyasla watt başına 4 katın üzerinde ve dolar başına 3 katın üzerinde performans sağladığını iddia ediyor. 46
- Titan (2027'de geliyor): 4 adet Asimov özel çipiyle güçlendirilmiş, 8+ TB belleğe sahip, hava soğutmalı 4U form faktöründe 16 trilyona kadar parametre modelini ve 10 milyondan fazla belirteç bağlam penceresini desteklemek üzere tasarlanmış yeni nesil bir sistem. 47
- Asimov (2027'de geliyor): Çip başına 2+ TB belleğe sahip özel çıkarım hızlandırıcı silikonu.
Positron, 2026 yılının başlarında QIA, Arm Holdings, Arena ve Jump Trading gibi yatırımcıların katılımıyla 230 milyon doların üzerinde B Serisi yatırım turunu tamamladı. 48
Atlas şu anda ağ iletişimi, oyun, içerik denetimi, CDN ve Token-as-a-Service şirketleri tarafından kullanılmaktadır. Positron, Atlas sisteminin, karşılaştırılabilir H100 sistemlerine kıyasla, alım satım çıkarım iş yüklerinde uçtan uca gecikmeyi 3 kat daha düşük seviyede tutarken, gücün üçte birini tükettiğini iddia ediyor.
Positron'un çipleri Amerika Birleşik Devletleri'nde tasarlanmakta, üretilmekte ve monte edilmektedir.
16. _kazınmış
Onların yaklaşımı, transformatör mimarisini çiplerine entegre ederek verimlilik uğruna esneklikten ödün veriyor.
Takım iddia ediyor ki
- Sohu, dünyanın ilk transformatör ASIC'ini üretti.
- Bu 8 Sohu çipi saniyede 500.000'den fazla token üretebilir. Bu, 8 adet NVIDIA B200'ün başarabileceğinden kat kat daha fazladır.
Şu anda bunlar, ekibin dahili ölçümlerine dayanmaktadır. AIMultiple ekipleri henüz herhangi bir kıyaslama ölçütü veya müşteri referansıyla karşılaşmadı. Merak ettiğimiz konular şunlardır:
- Model eskidiğinde ne olur? Kullanıcıların yeni bir çip satın alması mı gerekir, yoksa eski çip bir sonraki modelle yeniden yapılandırılabilir mi?
- Performans testlerini nasıl gerçekleştirdiler? Hangi niceleme ve model kullanıldı?
_etched ekibi daha fazla ayrıntı yayınlar yayınlamaz bunu güncelleyeceğiz. Her birkaç ayda bir yeni modellerin piyasaya sürülmesi göz önüne alındığında, modelleri çiplere yazmanın sürdürülebilir olup olmayacağını görmek ilginç olacak.
17. Taalas
Taalas, 2023 yılının başlarında kuruldu ve yapay zeka çip uzmanlaşmasına en uç noktayı getiren yaklaşımı benimsiyor: bireysel modelleri doğrudan özel silikona entegre ederek, şirketin "Hardcore Modeller" olarak adlandırdığı ürünler üretiyor. 49 Şirket, daha önce görülmemiş herhangi bir yapay zeka modelini iki ay içinde özel silikona dönüştürebileceğini iddia ediyor.
Taalas'ın mimarisi, depolama ve hesaplamayı DRAM seviyesinde yoğunlukta tek bir çip üzerinde birleştirerek HBM, gelişmiş paketleme, 3D istifleme, sıvı soğutma veya yüksek hızlı G/Ç ihtiyacını ortadan kaldırıyor. Şirket bunu donanım yığınının radikal bir şekilde basitleştirilmesi olarak tanımlıyor.
Ürünler:
- HC1 (şu anda mevcut): TSMC 6nm teknolojisiyle üretilmiş ve 53 milyar transistöre sahip, Llama 3.1 8B ile donatılmış bir teknoloji gösterim cihazı. Taalas, kullanıcı başına saniyede 17.000 token işleme kapasitesine sahip olduğunu ve bunun mevcut en gelişmiş teknolojiden neredeyse 10 kat daha hızlı olduğunu, aynı zamanda üretim maliyetinin 20 kat daha düşük ve 2,5 kW hava soğutmalı bir sunucuda 10 kat daha az güç tükettiğini iddia ediyor. Bununla birlikte, model, GPU temel değerlerine kıyasla kalite düşüşlerine neden olan agresif özel 3 bit ve 6 bit niceleme kullanıyor. 50
- HC2 (planlanan): HC1'in niceleme sınırlamalarını gidermek için daha yüksek yoğunluklu, daha hızlı yürütmeli ve standart 4 bit kayan noktalı formatlara sahip ikinci nesil bir platform.
Taalas 200 milyon dolardan fazla yatırım almış olmasına rağmen, ilk ürününü piyasaya sürmek için sadece 30 milyon dolar harcadığını ve 24 kişilik bir ekiple çalıştığını belirtiyor.
18. Ekstropik
Extropic, termodinamiği hesaplama için kullanmak amacıyla 2023'ün sonlarında 14 milyon dolarlık bir yatırım turu gerçekleştirdi. Şirket henüz bir çip piyasaya sürmedi.
19. Varie
Vaire, neredeyse sıfır enerji tüketimli çipler oluşturmayı hedefleyen yenilikçi bir yaklaşım olan tersine çevrilebilir hesaplama alanında öncü olan İngiltere merkezli bir girişim şirketidir. Enerjinin ısı olarak kaybolduğu geleneksel hesaplamanın aksine, tersine çevrilebilir hesaplama, enerjinin önemli bir bölümünü sonraki hesaplamalar için geri dönüştürür.
Vaire, enerjisinin %50'sini geri kazanabilen bir test çipi sergileyerek, teknolojinin yapay zeka iş yüklerinin enerji tüketimini azaltma ve modern yarı iletken üretimini zorlayan fiziksel sınırlamaları veya termal bariyeri aşma potansiyelini gösterdi. 51
20. Fraktil
Fractile, Temmuz 2024'te 15 milyon dolarlık fonla gizlilik perdesini aralayarak, öncü model çıkarımı alanında NVIDIA'e meydan okumak üzere kurulmuş, İngiltere merkezli bir yapay zeka çıkarım çipi girişimidir. 52
Şirket, bellek ve hesaplamayı aynı yonga üzerinde fiziksel olarak iç içe geçiren işlemciler geliştiriyor ve bunun, GPU'ların sınır modeli çıkarımı için karşılayamadığı eş zamanlı düşük gecikme süresi ve yüksek işlem hızı gereksinimini çözdüğünü iddia ediyor. Fractile, tasarımının sınır modellerini mevcut çözümlere göre 25 kat daha hızlı ve 1/10 oranında daha düşük maliyetle çalıştırabileceğini ve saniyede binlerce token'ı binlerce eş zamanlı kullanıcıya sunmayı hedeflediğini belirtiyor.
Merkezi Londra'da bulunan ve donanım mühendisliği Bristol'da yer alan Fractile, Mart 2025'te Financial Times tarafından, NVIDIA'ün hakimiyetine meydan okuyan çıkarım odaklı girişimler dalgasının bir parçası olarak tanıtılmıştı. 53
Önümüzdeki dönemde yapay zeka donanımı üretecek firmalar kimler?
Bunlar cazip yapay zeka donanım çözümleri olsa da, piyasaya yeni girdikleri için etkinliklerine dair şu anda sınırlı sayıda kıyaslama verisi bulunmaktadır.
21. Apple
Apple'ın ACDC projesinin yapay zekâ çıkarımı için çipler geliştirmeye odaklandığı bildiriliyor. 54 Apple, iPhone, iPad ve MacBook'larda kullanılan, kendi bünyesinde tasarladığı yarı iletkenleriyle zaten önemli bir çip tasarımcısıdır.
22. Meta
Meta Eğitim ve Çıkarım Hızlandırıcı (MTIA), Meta'nın LLaMa modellerinin eğitimi gibi yapay zeka iş yükleri için bir işlemci ailesidir.
En yeni MTIA modeli olan Yeni Nesil MTIA, TSMC'nin 5nm teknolojisine dayanıyor ve MTIA v1'e göre 3 kat daha yüksek performans sunduğu iddia ediliyor. MTIA, 72 adede kadar hızlandırıcı içeren raflarda barındırılacak. 55
MTIA şu anda Meta'nın dahili kullanımı içindir. Ancak gelecekte, Meta LLaMa tabanlıkurumsal bir üretken yapay zeka çözümü sunarsa, bu çipler böyle bir çözüme güç sağlayabilir.
23. Microsoft Azure
Hot Chips 2024'te, Microsoft, donanım ve yazılım eş optimizasyonu yoluyla Azure'da büyük ölçekli yapay zeka iş yüklerini optimize etmek için tasarlanmış ilk özel yapay zeka hızlandırıcısı olan Maia 100'ü tanıttı. TSMC'nin N5 işlemcisi ve gelişmiş bellek ve ara bağlantı teknolojisi üzerine inşa edilen Maia 100, yüksek verimlilik ve çeşitli veri formatlarını hedefliyor ve geliştiricilere PyTorch ve Triton modellerinin hızlı dağıtımı için SDK'sı aracılığıyla esneklik sunuyor. Bununla birlikte, Microsoft'un Braga kod adlı yeni nesil yapay zeka çipi, tasarım değişiklikleri, personel kısıtlamaları ve yüksek personel devri nedeniyle 2025'ten 2026'ya ertelendi ve potansiyel olarak güç verimliliği açısından Nvidia'nın Blackwell çipinin gerisinde kalabilir.
24. OpenAI
OpenAI, Broadcom ve TSMC ile birlikte TSMC'nin 3 nanometre teknolojisini kullanarak ilk yapay zeka çipinin tasarımını tamamlıyor. OpenAI'in çip ekibinin liderliği, Google'da TPU tasarımı konusunda deneyime sahip ve çiplerinin 2026 yılında seri üretimine başlamayı hedefliyorlar. 56
Diğer yapay zeka çip üreticileri kimlerdir?
25. Graphcore
Graphcore, 2016 yılında kurulan bir İngiliz şirketidir. Şirket, amiral gemisi yapay zeka çipini IPU-POD256 olarak duyurdu. Graphcore, yaklaşık 700 milyon dolar yatırım aldı.
Şirketin DDN, Pure Storage ve Vast Data gibi veri depolama şirketleriyle stratejik ortaklıkları bulunmaktadır. Graphcore'in yapay zeka çipleri, Oxford-Man Kantitatif Finans Enstitüsü, Bristol Üniversitesi ve Kaliforniya Berkeley Üniversitesi gibi araştırma enstitülerine hizmet vermektedir.
Şirketin uzun vadeli sürdürülebilirliği risk altındaydı çünkü yılda yaklaşık 200 milyon dolar zarar ediyordu. 57 Graphcore numaralı hisse senedi, Ekim 2024'te SoftBank tarafından 600 milyon dolardan fazla bir bedelle satın alındı. 58
26. Efsanevi
Mythic, 2012 yılında kurulmuş olup uç yapay zekaya odaklanmıştır. Mythic, enerji verimli uç yapay zeka hesaplaması sunmayı amaçlayan, alışılmadık bir yol olan analog hesaplama mimarisini izlemektedir.
Şirket, M1076 AMP ve MM1076 anahtar kartı gibi ürünler geliştirmiş ve yaklaşık 165 milyon dolar yatırım fonu toplamıştır. 59
Mythic, Mart 2023'teki finansman turuyla birlikte personelinin büyük bir kısmını işten çıkardı ve iş yapısını yeniden yapılandırdı. 60
27. Speedata
2019 yılında Tel Aviv'de kurulan Speedata, büyük veri analitiği ve yapay zeka iş yüklerini hızlandırmak için tasarlanmış bir Analitik İşleme Birimi (APU) geliştiriyor. Apache Spark iş yüklerini hedefleyen bu APU'nun, diğer büyük veri analitiği platformlarını da desteklemesi planlanıyor.
Speedata, Haziran 2025'te Walden Catalyst Ventures, 83North ve diğerlerinin öncülüğünde gerçekleştirilen B Serisi yatırım turunda 44 milyon dolar fon topladı ve toplam fonlamasını 114 milyon dolara çıkardı. Şirket, APU'sunun genel amaçlı işlemcilerden ve GPU'lardan daha iyi performans gösterdiğini, sunucu raflarını tek bir çiple değiştirerek veri işleme için üstün performans ve enerji verimliliği sağladığını iddia ediyor. 61
28. Axelera AI
Temmuz 2021'de Hollanda'nın Eindhoven şehrinde kurulan Axelera AI, bilgisayar görüşü ve üretken yapay zeka için yapay zeka donanım hızlandırma teknolojisinde uzmanlaşmıştır. Şirket, uçtan buluta kadar yapay zeka iş yüklerini hızlandırmak için tasarlanmış, Dijital Bellek İçi Hesaplama (D-IMC) mimarisine dayalı bir yapay zeka çıkarım çipi olan Titania'yı geliştirmektedir.
Axelera AI, Mart 2025'te EuroHPC Ortak Girişimi (JU) ve üye devletlerden DARE Projesi kapsamında 61,6 milyon Euro'ya kadar fon sağladı; bu, daha önce 68 milyon dolarlık bir Seri B finansman turunun ardından geldi. Bu, üç yılda toplam fonlama miktarını 200 milyon doların üzerine çıkarıyor. Axelera AI, yüksek performanslı, uygun maliyetli ve sürdürülebilir yapay zeka çözümlerine yönelik artan talebi karşılamak amacıyla Titania'yı 2028 yılına kadar devreye almayı hedefliyor ve geleneksel bulut çözümlerine kıyasla verimliliği ve işlem hacmini artırma yeteneğini vurguluyor. 62
Dökümhane ortakları ve TSMC'nin rolü
Dünyanın önde gelen saf dökümhane şirketi olan TSMC, kendi çiplerini üretmek yerine müşteri tasarımlarına dayalı yarı iletkenler üretiyor ve bu özelliğiyle NVIDIA ve AMD gibi şirketlerden ayrılıyor. Samsung Foundry ve Intel Foundry Services bu alanda rekabet ederken, TSMC teknolojik üstünlüğünü koruyor.
Özellikle öncü 5nm ve 3nm düğümleri olmak üzere gelişmiş işlem teknolojileri, aşağıda listelenen yapay zeka çip tasarımcılarıyla olan üretim ortaklıklarında da görüldüğü gibi, en son yapay zeka uygulamaları için gerekli olan performans ve enerji verimliliğinin temel kombinasyonunu sağlar:
Genişleme planları
TSMC, operasyonel kontrolü elinde tutacak ancak %50'den az sahiplik payına sahip olacak şekilde, Intel'nin dökümhane bölümünü işletmek üzere bir ortak girişim kurmak için Nvidia, AMD, Broadcom ve Qualcomm'ı yatırım yapmaya davet ediyor. Trump yönetimi tarafından desteklenen bu girişim, TSMC'nin önemli bir ABD yatırımı planlarını açıklamasının ardından geliyor ve Intel'yi canlandırmayı ve ABD çip üretimini güçlendirmeyi amaçlıyor. Anlaşma, süreç farklılıkları nedeniyle zorluklarla karşı karşıya olsa da, TSMC'nin önde gelen bir dökümhane olarak güçlü yönlerine dayanıyor. 63 64
Çin'deki yapay zeka çip üreticileri kimlerdir?
ABD yaptırımları nedeniyle birçok Çinli şirketin AMD ve NVIDIA yıllarından kalma en gelişmiş yapay zeka çiplerini edinmesi engellendiğinden, Çinli alıcılar yerel üreticilerden alımlarını artırdılar.
Yukarıda bahsedilen Huawei ve Alibaba dışında, Çin'deki önde gelen yapay zeka çip üreticileri şunlardır:
- Cambricon yapay zeka donanımına odaklanıyor ve son faaliyet yılında yaklaşık 150 milyon dolarlık satış bekliyor. 65
- Baidu, bulut hizmetlerinde Kunlun çiplerini kullanıyor ve 3. nesil çipi tasarlıyor. Kunlun 2, NVIDIA A100 ile karşılaştırılabilir nitelikteydi.
- NVIDIA mezunları tarafından kurulan Biren , BR106 ve BR110 GPU çipleri üretmektedir.
- Moore Threads, MTT S2000 GPU'larını üretmektedir.
SSS'ler
Çipler ve onları üreten ekipmanlar, insanlar tarafından şimdiye kadar inşa edilmiş en karmaşık makinelerdir. Yarı iletken ekosisteminde birçok şirket olmasına rağmen, bu makalede NVIDIA gibi çip tasarımcılarına odaklandık.
Çoğu çip tasarımcısı, çip üretimini TSMC gibi dökümhanelere yaptırır. Dökümhaneler, bu çiplerin üretiminde ASML gibi şirketler tarafından üretilen litografi ekipmanlarını kullanır. Ekosistem, IP ve tasarım araçları sağlayan Arm ve Synopsys gibi sağlayıcılar tarafından desteklenmektedir.
Yukarıda görüldüğü gibi, artan sayıda parametre, veri seti boyutu ve işlem gücü, üretken yapay zeka modellerinin daha doğru hale gelmesine yol açmıştır. Daha iyi derin öğrenme modelleri oluşturmak ve üretken yapay zeka uygulamalarına güç sağlamak için kuruluşlar, artan işlem gücüne ve bellek bant genişliğine ihtiyaç duymaktadır.
Güçlü genel amaçlı çipler (örneğin CPU'lar) yüksek oranda paralelleştirilmiş derin öğrenme modellerini destekleyemez. Bu nedenle, paralel hesaplama yetenekleri sağlayan yapay zeka çiplerine (örneğin GPU'lara) olan talep giderek artmaktadır.
Büyük ölçekli bulut sağlayıcıları buna kendi çiplerini tasarlayarak yanıt veriyor; bu da yıllar süren bir süreç. Geri kalanların ise kendi yapay zeka modellerini oluşturmak için şu yollardan birini izlemesi gerekiyor: Bulut GPU sağlayıcılarından kapasite kiralamak veya bu makalede listelenen en iyi yapay zeka çip üreticilerinden donanım satın almak.
Yapay zeka donanımına ayrıca sinirsel işlem birimleri (NPU), yapay zeka hızlandırıcıları veya derin öğrenme işlemcileri (DLP) de denir.
Daha fazla okuma
Bu makalede ele alınan çiplerin performans karşılaştırmaları için, kıyaslama testlerimize göz atabilirsiniz:
- Çoklu GPU kıyaslaması : NVIDIA'ün B200, H200, H100 ve AMD'ün MI300X işlemcilerinin LLM çıkarımı için 1, 2, 4 ve 8 GPU konfigürasyonlarında nasıl performans gösterdiği, verimlilik, gecikme ve belirteç başına maliyet analizi ile birlikte.
- GPU eşzamanlılık kıyaslaması : NVIDIA'ün B200, H200, H100 ve AMD'ün MI300X'inin 1 ila 512 eşzamanlı isteği nasıl işlediği, sistem verimliliği, sorgu başına hız, uçtan uca gecikme ve her eşzamanlılık seviyesinde dolar başına token sayısı dahil.
Yorumlar 2
Düşüncelerinizi Paylaşın
E-posta adresiniz yayınlanmayacak. Tüm alanlar gereklidir.
You forgot to include Tesla with their DOJO supercomputer. From the ground-up, the supercomputer was specifically designed for machine learning and image recognition - which means that every component was designed for it including, but not limited to, PCI board design, CPU, RAM, cooling, power, scalable hardware design and software. If I'm not mistaken, the AI is also the second most widely tested and used in the "wild", just below that of Google due to Google using it in their Search.
Thank you for your feedback, Dave! Here we are only covering companies that sell the chips that they produce. Therefore, companies like Tesla that build supercomputers for their own use or companies that embed chips in their products are out of our scope.
surprised that brainchip (akida) missing in this report. any reasons?
All included companies here raised $100+M. Last time we collected the data, that wasn't the case for akida. Why don't you reach out to us at info@aimultiple.com and let's discuss why it should be included. Thank you!