Ekrem Sarı
Ekrem, AIMultiple'da yapay zeka araştırmacısı olup, akıllı otomasyon, GPU'lar, yapay zeka ajanları ve RAG çerçeveleri için LLMOps konularına odaklanmaktadır.
Profesyonel Deneyim
Yandex'te Değerlendirme Uzmanı olarak görev yaptığı süre boyunca, tescilli çerçeveler ve otomatik protokoller kullanarak arama sonuçlarını değerlendirdi. Aylık 10.000'den fazla sorgu üzerinde veri etiketleme, alaka düzeyi puanlaması ve kullanıcı amacı eşlemesi yoluyla kalite güvence testleri uygularken, makine öğrenimi geri bildirim döngülerini kullanarak performans izleme ve spam tespiti de dahil olmak üzere teknik değerlendirmeler gerçekleştirdi.Araştırma Alanı
AIMultiple'da araştırmaları, MLOps yaşam döngüsü ve uçtan uca yapay zeka sistemlerinin performansı ve kıyaslaması üzerine yoğunlaşmaktadır. Geri Alma Destekli Üretim (RAG) optimizasyonu, kapsamlı Büyük Dil Modeli (LLM) kıyaslaması ve ajan tabanlı yapay zeka çerçevelerinin tasarımı da dahil olmak üzere çok çeşitli projelere katkıda bulunmaktadır. Ekrem, doğruluk, verimlilik, API maliyeti ve ölçeklenebilirlik gibi kritik operasyonel ölçütler genelinde yapay zeka teknolojisi performansını ölçmek ve iyileştirmek için veri odaklı metodolojiler geliştirmede uzmanlaşmıştır. Analizi, gömme modelleri ve vektör veritabanları gibi temel bileşenlerden, yapay zeka ajanlarının dağıtımı için gerekli olan yüksek performanslı GPU ve bulut altyapısına kadar tüm teknoloji yığınını kapsamaktadır.Eğitim
Ekrem, Hacettepe Üniversitesi'nden lisans, Başkent Üniversitesi'nden yüksek lisans derecesine sahiptir.Ekrem Tarafından Son Makaleler
RAG için En İyi Vektör Veritabanı: Qdrant vs Weaviate vs Pinecone
Vektör veritabanları, belge ve sorgu gömülülerini yüksek boyutlu vektörler olarak depolayarak RAG iş akışlarındaki arama katmanını destekler. Vektör mesafelerine dayalı hızlı benzerlik aramalarına olanak tanırlar.
İlişkisel Temel Modellerini Karşılaştırın
SAP-RPT-1-OSS modelini, anlamsal-sayısal spektrumu kapsayan, küçük/yüksek anlamsal tablolar, karma iş veri kümeleri ve büyük düşük anlamsal sayısal veri kümeleri içeren 17 tablo veri kümesi üzerinde gradyan artırma (LightGBM, CatBoost) yöntemleriyle karşılaştırdık. Amacımız, ilişkisel bir LLM'nin önceden eğitilmiş anlamsal önceliklerinin geleneksel ağaç modellerine göre nerede avantaj sağlayabileceğini ve ölçek veya düşük anlamsal yapı altında nerede zorluklarla karşılaşabileceğini ölçmektir.
RAG için En İyi 10 Çok Dilli Gömme Modeli
6 dilde (Almanca, İngilizce, İspanyolca, Fransızca, Japonca, Çince) yaklaşık 606 bin Amazon yorumu üzerinde 10 çok dilli gömme modelini karşılaştırmalı olarak test ettik. Her biri kaynak yorumundan somut ayrıntılara atıfta bulunan 1.800 sorgu (dil başına 300) oluşturduk. Arama için eğitilmiş modeller (sorgu ve belge ayrımı), genel metin benzerliği için eğitilmiş daha büyük modellerden daha iyi performans gösterdi: e5_base (110 milyon parametre) modellerinden daha iyi performans gösterdi.
LLM Kantizasyonu: BF16 vs FP8 vs INT4
Qwen3-32B'yi tek bir NVIDIA H100 80GB GPU üzerinde 4 hassasiyet seviyesinde (BF16, FP8, GPTQ-Int8, GPTQ-Int4) kıyasladık. Her yapılandırma, bilgi ve kod üretimi konularını kapsayan 2 kıyaslama testinde (~12.2K soru) ve verimliliği ölçmek için 2.000'den fazla çıkarım çalıştırmasında değerlendirildi.
GPU Eşzamanlılık Performans Testi: H100 vs H200 vs B200 vs MI300X
Son 20 yılımı sistem düzeyinde hesaplama performansı optimizasyonuna odaklanarak geçirdim. Eşzamanlılık ölçeklendirme analizi için, NVIDIA'nin H100, H200 ve B200'ü ile AMD'nin MI300X'i de dahil olmak üzere en yeni NVIDIA GPU'larını kıyasladık. gpt-oss-20b modeliyle vLLM çerçevesini kullanarak, bu GPU'ların 1'den 512'ye kadar eşzamanlı istekleri nasıl işlediğini test ettik.
Çoklu GPU Performans Testi: B200 vs H200 vs H100 vs MI300X
Yirmi yılı aşkın süredir, işlem performansını optimize etmek çalışmalarımın temel taşlarından biri olmuştur. Büyük Dil Modeli (LLM) çıkarımı için ne kadar iyi ölçeklenebildiklerini değerlendirmek amacıyla NVIDIA'ün B200, H200, H100 ve AMD'ün MI300X işlemcilerini kıyasladık. meta-llama/Llama-3.1-8B-Instruct modeliyle vLLM çerçevesini kullanarak 1, 2, 4 ve 8 GPU üzerinde testler gerçekleştirdik.
Grafik RAG ve Vektör RAG Karşılaştırması
Vektör RAG, anlamsal benzerliğe göre belgeleri alır. Grafik RAG ise bunun üzerine bir bilgi grafiği ekler, belgelerinizden varlıkları ve ilişkileri çıkarır, bunları bir grafik veritabanında saklar ve sorgu zamanında vektör aramasıyla birlikte grafik geçişini kullanır. Bu ek katmanın, 3.
RAG Değerlendirme Araçları: Weights & Biases vs Ragas vs DeepEval
Bir RAG işlem hattı yanlış bağlamı aldığında, LLM güvenle yanlış cevabı üretir. Bağlam alaka düzeyi puanlayıcıları birincil savunma mekanizmasıdır. Aynı koşullar altında 1.460 soru ve 14.600'den fazla puanlanmış bağlam üzerinden beş aracı karşılaştırdık: aynı yargıç modeli (GPT-4o), varsayılan yapılandırmalar ve özel istemler yok.
En İyi RAG Araçları, Çerçeveleri ve Kütüphaneleri
RAG (Retrieval-Augmented Generation), harici veri kaynakları ekleyerek LLM yanıtlarını iyileştirir. RAG sistemleri için hangi kombinasyonların en iyi sonucu verdiğini belirlemek amacıyla farklı gömme modellerini karşılaştırdık ve çeşitli öbek boyutlarını ayrı ayrı test ettik. En iyi RAG çerçevelerini ve araçlarını keşfedin, RAG'ın ne olduğunu, nasıl çalıştığını, faydalarını ve günümüzün LLM ortamındaki rolünü öğrenin.
Uzaktan Tarayıcılar: Yapay Zeka Ajanları için Web Altyapısının Karşılaştırılması
Yapay zekâ ajanları, veri kazıma önleme önlemleriyle engellenmeden web görevlerini otomatikleştirmek için uzaktan tarayıcılara güvenir. Bu tarayıcı altyapısının performansı, bir ajanın başarısı için kritik öneme sahiptir. Başarı oranı, hız ve özellikler açısından 8 sağlayıcıyı karşılaştırdık.
AIMultiple Bülteni
Haftada 1 ücretsiz e-posta ile en son B2B teknoloji haberleri ve uzman içgörüler ile işletmenizi hızlandırın.