Hizmetler
Bize Ulaşın
Ekrem Sarı

Ekrem Sarı

Yapay Zeka Araştırmacısı
31 Makale
B2B Teknolojisinde Güncel Kalın

Ekrem, AIMultiple'da yapay zeka araştırmacısı olup, akıllı otomasyon, GPU'lar, yapay zeka ajanları ve RAG çerçeveleri için LLMOps konularına odaklanmaktadır.

Profesyonel Deneyim

Yandex'te Değerlendirme Uzmanı olarak görev yaptığı süre boyunca, tescilli çerçeveler ve otomatik protokoller kullanarak arama sonuçlarını değerlendirdi. Aylık 10.000'den fazla sorgu üzerinde veri etiketleme, alaka düzeyi puanlaması ve kullanıcı amacı eşlemesi yoluyla kalite güvence testleri uygularken, makine öğrenimi geri bildirim döngülerini kullanarak performans izleme ve spam tespiti de dahil olmak üzere teknik değerlendirmeler gerçekleştirdi.

Araştırma Alanı

AIMultiple'da araştırmaları, MLOps yaşam döngüsü ve uçtan uca yapay zeka sistemlerinin performansı ve kıyaslaması üzerine yoğunlaşmaktadır. Geri Alma Destekli Üretim (RAG) optimizasyonu, kapsamlı Büyük Dil Modeli (LLM) kıyaslaması ve ajan tabanlı yapay zeka çerçevelerinin tasarımı da dahil olmak üzere çok çeşitli projelere katkıda bulunmaktadır. Ekrem, doğruluk, verimlilik, API maliyeti ve ölçeklenebilirlik gibi kritik operasyonel ölçütler genelinde yapay zeka teknolojisi performansını ölçmek ve iyileştirmek için veri odaklı metodolojiler geliştirmede uzmanlaşmıştır. Analizi, gömme modelleri ve vektör veritabanları gibi temel bileşenlerden, yapay zeka ajanlarının dağıtımı için gerekli olan yüksek performanslı GPU ve bulut altyapısına kadar tüm teknoloji yığınını kapsamaktadır.

Eğitim

Ekrem, Hacettepe Üniversitesi'nden lisans, Başkent Üniversitesi'nden yüksek lisans derecesine sahiptir.

Ekrem Tarafından Son Makaleler

Yapay zekaNis 24

RAG için En İyi Vektör Veritabanı: Qdrant vs Weaviate vs Pinecone

Vektör veritabanları, belge ve sorgu gömülülerini yüksek boyutlu vektörler olarak depolayarak RAG iş akışlarındaki arama katmanını destekler. Vektör mesafelerine dayalı hızlı benzerlik aramalarına olanak tanırlar.

Yapay zekaNis 15

İlişkisel Temel Modellerini Karşılaştırın

SAP-RPT-1-OSS modelini, anlamsal-sayısal spektrumu kapsayan, küçük/yüksek anlamsal tablolar, karma iş veri kümeleri ve büyük düşük anlamsal sayısal veri kümeleri içeren 17 tablo veri kümesi üzerinde gradyan artırma (LightGBM, CatBoost) yöntemleriyle karşılaştırdık. Amacımız, ilişkisel bir LLM'nin önceden eğitilmiş anlamsal önceliklerinin geleneksel ağaç modellerine göre nerede avantaj sağlayabileceğini ve ölçek veya düşük anlamsal yapı altında nerede zorluklarla karşılaşabileceğini ölçmektir.

Yapay zekaNis 15

RAG için En İyi 10 Çok Dilli Gömme Modeli

6 dilde (Almanca, İngilizce, İspanyolca, Fransızca, Japonca, Çince) yaklaşık 606 bin Amazon yorumu üzerinde 10 çok dilli gömme modelini karşılaştırmalı olarak test ettik. Her biri kaynak yorumundan somut ayrıntılara atıfta bulunan 1.800 sorgu (dil başına 300) oluşturduk. Arama için eğitilmiş modeller (sorgu ve belge ayrımı), genel metin benzerliği için eğitilmiş daha büyük modellerden daha iyi performans gösterdi: e5_base (110 milyon parametre) modellerinden daha iyi performans gösterdi.

Yapay zekaNis 15

LLM Kantizasyonu: BF16 vs FP8 vs INT4

Qwen3-32B'yi tek bir NVIDIA H100 80GB GPU üzerinde 4 hassasiyet seviyesinde (BF16, FP8, GPTQ-Int8, GPTQ-Int4) kıyasladık. Her yapılandırma, bilgi ve kod üretimi konularını kapsayan 2 kıyaslama testinde (~12.2K soru) ve verimliliği ölçmek için 2.000'den fazla çıkarım çalıştırmasında değerlendirildi.

Yapay zekaNis 15

GPU Eşzamanlılık Performans Testi: H100 vs H200 vs B200 vs MI300X

Son 20 yılımı sistem düzeyinde hesaplama performansı optimizasyonuna odaklanarak geçirdim. Eşzamanlılık ölçeklendirme analizi için, NVIDIA'nin H100, H200 ve B200'ü ile AMD'nin MI300X'i de dahil olmak üzere en yeni NVIDIA GPU'larını kıyasladık. gpt-oss-20b modeliyle vLLM çerçevesini kullanarak, bu GPU'ların 1'den 512'ye kadar eşzamanlı istekleri nasıl işlediğini test ettik.

Yapay zekaNis 15

Çoklu GPU Performans Testi: B200 vs H200 vs H100 vs MI300X

Yirmi yılı aşkın süredir, işlem performansını optimize etmek çalışmalarımın temel taşlarından biri olmuştur. Büyük Dil Modeli (LLM) çıkarımı için ne kadar iyi ölçeklenebildiklerini değerlendirmek amacıyla NVIDIA'ün B200, H200, H100 ve AMD'ün MI300X işlemcilerini kıyasladık. meta-llama/Llama-3.1-8B-Instruct modeliyle vLLM çerçevesini kullanarak 1, 2, 4 ve 8 GPU üzerinde testler gerçekleştirdik.

Yapay zekaMar 27

Grafik RAG ve Vektör RAG Karşılaştırması

Vektör RAG, anlamsal benzerliğe göre belgeleri alır. Grafik RAG ise bunun üzerine bir bilgi grafiği ekler, belgelerinizden varlıkları ve ilişkileri çıkarır, bunları bir grafik veritabanında saklar ve sorgu zamanında vektör aramasıyla birlikte grafik geçişini kullanır. Bu ek katmanın, 3.

Yapay zekaMar 23

RAG Değerlendirme Araçları: Weights & Biases vs Ragas vs DeepEval

Bir RAG işlem hattı yanlış bağlamı aldığında, LLM güvenle yanlış cevabı üretir. Bağlam alaka düzeyi puanlayıcıları birincil savunma mekanizmasıdır. Aynı koşullar altında 1.460 soru ve 14.600'den fazla puanlanmış bağlam üzerinden beş aracı karşılaştırdık: aynı yargıç modeli (GPT-4o), varsayılan yapılandırmalar ve özel istemler yok.

Yapay zekaŞub 4

En İyi RAG Araçları, Çerçeveleri ve Kütüphaneleri

RAG (Retrieval-Augmented Generation), harici veri kaynakları ekleyerek LLM yanıtlarını iyileştirir. RAG sistemleri için hangi kombinasyonların en iyi sonucu verdiğini belirlemek amacıyla farklı gömme modellerini karşılaştırdık ve çeşitli öbek boyutlarını ayrı ayrı test ettik. En iyi RAG çerçevelerini ve araçlarını keşfedin, RAG'ın ne olduğunu, nasıl çalıştığını, faydalarını ve günümüzün LLM ortamındaki rolünü öğrenin.

VeriOca 30

Uzaktan Tarayıcılar: Yapay Zeka Ajanları için Web Altyapısının Karşılaştırılması

Yapay zekâ ajanları, veri kazıma önleme önlemleriyle engellenmeden web görevlerini otomatikleştirmek için uzaktan tarayıcılara güvenir. Bu tarayıcı altyapısının performansı, bir ajanın başarısı için kritik öneme sahiptir. Başarı oranı, hız ve özellikler açısından 8 sağlayıcıyı karşılaştırdık.