Ekrem Sarı

17 Tem

En İyi 20+ Agentic RAG Çerçevesi

Agentic RAG, LLM performansını artırarak ve daha fazla uzmanlaşma sağlayarak geleneksel RAG'ı geliştirir. Birden çok veritabanı arasında yönlendirme ve sorgu oluşturma konusundaki performansını değerlendirmek için bir kıyaslama gerçekleştirdik. Agentic RAG çerçevelerini ve kütüphanelerini, standart RAG'tan temel farklarını, avantajlarını ve zorluklarını keşfedin ve tam potansiyellerini ortaya çıkarın. Sistemin, her biri benzersiz bağlamsal bilgilere sahip beş farklı…

16 Tem

Bulut GPU Fiyatlandırması, Performansı & Sağlayıcı Karşılaştırması

Bulut GPU liste fiyatları aynı model için bir sağlayıcıdan diğerine birkaç kat farklılık gösterebilir. Tüm üç fiyatlandırma kademesindeki 40+ GPU yapılandırması için en düşük fiyatı, sağlayıcıyı, piyasa aralığını ve medyanı, ayrıca 10 model üzerinde dolar başına işlem hacmi kıyaslamasını derledik. 13 hiper ölçekli ve neo-bulut sağlayıcısında iş yükünüz için en uygun maliyetli GPU'yu, dolar başına…

Özellik Karşılaştırması

16 Tem

Bulut GPU Kiralama Fiyat Endeksi

Yeni nesil bulut GPU'lar (B200, B300, MI300X, RTX 5090) için isteğe bağlı ücretler geçtiğimiz yıl kabaca iki katına çıktı; yaygın kartlar (H100, H200, A100) ise dar bir bantta kaldı. GPU endeksini, 63 sağlayıcıdan ve 17 GPU modelinden aylık olarak derliyoruz; isteğe bağlı, spot ve 1 yıllık rezervasyon katmanlarını kapsıyor. Grafik, üç çıkış tarihi grubu için…

İçgörü

12 Tem

LLM Self-Hosting için VRAM Hesaplayıcı

Kendi barındırılan bir LLM, çıkarımın operatörün kontrol ettiği donanım üzerinde, üçüncü taraf bir API üzerinden değil, çalıştırılması anlamına gelir; bu durum maliyet, veri kontrolü ve gizlilik profilini değiştirir. Bir modelin çalışıp çalışmadığı tamamen belleğe bağlıdır. Hesaplayıcı, modelin, hassasiyetinin, bağlam uzunluğunun ve hedef donanımın temelinde bir modelin yerel olarak çalışması için gereken VRAM veya birleşik belleği…

10 Tem

Finans Alanında 40+ LLM Karşılaştırması: Claude Fable 5 ve GPT-5.6 Sol

Finans alanında 40+ LLM'i, hangi modellerin tablo analizi, tahminleme ve oran hesaplamaları gibi karmaşık finansal muhakeme görevlerinde üstün performans gösterdiğini belirlemek için FinanceReasoning karşılaştırma testindeki 238 zor soru üzerinde değerlendirdik. LLM'leri FinanceReasoning karşılaştırma testindeki (Tang ve diğerleri) 238 zor soru üzerinde değerlendirdik.1 Bu alt küme, finansal kavramları ve formülleri içeren karmaşık, çok adımlı nicel muhakemeyi…

3 Tem

RAG için Açık Kaynak Embedding Model Karşılaştırması

Tek bir H100 üzerinde self-hosted olarak çalıştırılan 14 açık kaynak embedding modelini, hukuk sözleşmeleri, müşteri destek teknik notları ve tıbbi özetleri kapsayan 500'den fazla elle seçilmiş erişim sorgusu üzerinde karşılaştırdık. NVIDIA Llama-Embed-Nemotron-8B doğrulukta lider. Maliyet açısından, Google'ın EmbeddingGemma-300m modeli, küçük bir doğruluk kaybı karşılığında Nemotron'dan yaklaşık 4x daha ucuz çalışıyor. nDCG@3: Kesme noktası 3'te normalize…

İlişkisel Temel Modelleri Karşılaştırın

17 tabular veri setinde, yarı anlamsal-yarı sayısal spektrum, küçük/yüksek anlamsal tablolar, karmaşık iş veri setleri ve büyük düşük anlamsal sayısal veri setleri üzerinde gradient boosting (LightGBM, CatBoost) karşısında SAP-RPT-1-OSS benchmark'ını yaptık. Amaçımız, ilişkisel bir LLM'in önceden eğitilmiş anlamsal öncüllerinin geleneksel ağaç modellerine göre avantaj sağlayabileceği ve ölçek altında veya düşük anlamsal yapıda zorluklarla karşılaştığı noktaları…

Kurumsal Yazılım

E-posta Arşivleme Yazılımı Karşılaştırması

Bir Microsoft 365 kiracısı oluşturduk, bunu 10.000 e-postadan oluşan sentetik bir külliyat ve 8 dosya türü alt tipinde 1.700 ek ile doldurduk, ardından aynı kiracı üzerinde NinjaOne SaaS Archiver, Barracuda Cloud Archiving Service, Acronis Cyber Protect Cloud Email Archiving ve MailPiler'ı alım, arama, ek çağırma, dışa aktarma, değişmezlik, yasal bekletme, denetim, şifreleme, saklama ve satıcı…

Kurumsal Yazılım

En İyi Sunucusuz Fonksiyonlar: Vercel vs Azure vs AWS

Sunucusuz fonksiyonlar, geliştiricilerin bir sunucu yönetmek zorunda kalmadan kod çalıştırmasını sağlar. Bu, altyapı ölçeklendirme ve bakım arka planda otomatik olarak yapılırken uygulama yazma ve dağıtmaya odaklanmalarına olanak tanır. Bu kıyaslamada, sunucusuz fonksiyon performanslarını test etmek için metodolojimizi takip ederek 7 popüler bulut hizmeti sağlayıcısını değerlendirdik. En hızlı ve en yavaş yanıt sürelerini, 1000 istek için…