Ekrem Sarı
Ekrem, AIMultiple'da yapay zeka araştırmacısı olup, akıllı otomasyon, GPU'lar, yapay zeka ajanları ve RAG çerçeveleri için LLMOps konularına odaklanmaktadır.
Profesyonel Deneyim
Yandex'te Değerlendirme Uzmanı olarak görev yaptığı süre boyunca, tescilli çerçeveler ve otomatik protokoller kullanarak arama sonuçlarını değerlendirdi. Aylık 10.000'den fazla sorgu üzerinde veri etiketleme, alaka düzeyi puanlaması ve kullanıcı amacı eşlemesi yoluyla kalite güvence testleri uygularken, makine öğrenimi geri bildirim döngülerini kullanarak performans izleme ve spam tespiti de dahil olmak üzere teknik değerlendirmeler gerçekleştirdi.Araştırma Alanı
AIMultiple'da araştırmaları, MLOps yaşam döngüsü ve uçtan uca yapay zeka sistemlerinin performansı ve kıyaslaması üzerine yoğunlaşmaktadır. Geri Alma Destekli Üretim (RAG) optimizasyonu, kapsamlı Büyük Dil Modeli (LLM) kıyaslaması ve ajan tabanlı yapay zeka çerçevelerinin tasarımı da dahil olmak üzere çok çeşitli projelere katkıda bulunmaktadır. Ekrem, doğruluk, verimlilik, API maliyeti ve ölçeklenebilirlik gibi kritik operasyonel ölçütler genelinde yapay zeka teknolojisi performansını ölçmek ve iyileştirmek için veri odaklı metodolojiler geliştirmede uzmanlaşmıştır. Analizi, gömme modelleri ve vektör veritabanları gibi temel bileşenlerden, yapay zeka ajanlarının dağıtımı için gerekli olan yüksek performanslı GPU ve bulut altyapısına kadar tüm teknoloji yığınını kapsamaktadır.Eğitim
Ekrem, Hacettepe Üniversitesi'nden lisans, Başkent Üniversitesi'nden yüksek lisans derecesine sahiptir.Ekrem Tarafından Son Makaleler
Email Archiving Software Benchmark
We provisioned a Microsoft 365 tenant, populated it with a 10,000-mail synthetic corpus and 1,700 attachments across 8 file-type subtypes, then benchmarked NinjaOne SaaS Archiver, Barracuda Cloud Archiving Service, Acronis Cyber Protect Cloud Email Archiving, and MailPiler on the same tenant against 10 dimensions covering ingestion, search, attachment recall, export, immutability, legal hold, audit, encryption,
Metinden SQL'e Dönüştürme: LLM Doğruluğunun Karşılaştırılması
Danışmanlık günlerimde başlayan süreçte, 18 yıldır veri analizi için SQL'e güveniyorum. Doğal dil sorularını SQL'e çevirmek, verilere erişimi kolaylaştırarak, teknik becerisi olmayanlar da dahil olmak üzere herkesin doğrudan veritabanlarıyla çalışmasına olanak tanır.
En İyi 20+ Agentic RAG Çerçevesi
Agentic RAG, LLM performansını artırarak ve daha fazla uzmanlaşmayı sağlayarak geleneksel RAG'ı geliştirir. Çoklu veritabanları arasında yönlendirme ve sorgu oluşturma performansını değerlendirmek için bir kıyaslama testi gerçekleştirdik. Agentic RAG çerçevelerini ve kütüphanelerini, standart RAG'dan temel farklılıklarını, faydalarını ve zorluklarını keşfederek tam potansiyellerini ortaya çıkarın.
Finans alanındaki 38 LLM programının kıyaslama puanı: Claude Opus 4.6, Gemini 3.1 Pro ve daha fazlası.
Finansal akıl yürütme alanındaki 38 LLM modelini, mali tablo analizi, tahminleme ve oran hesaplamaları gibi karmaşık finansal akıl yürütme görevlerinde hangi modellerin üstün olduğunu belirlemek için FinanceReasoning kıyaslama testinden alınan 238 zor soru üzerinde değerlendirdik. LLM finans kıyaslama testine genel bakış: LLM modellerini FinanceReasoning kıyaslama testinden (Tang vd.) alınan 238 zor soru üzerinde değerlendirdik.
DLP İncelemesi: 6 DLP Ürününün Karşılaştırmalı Testi
Siber güvenlik uzmanı olarak 20 yıllık deneyimimden yararlanarak, hassas bilgilerin güvenliğini sağlamak ve düzenleyici standartlara uymak için en iyi DLP yazılımını seçtim. Kanal kapsamı, kurulum kolaylığı ve sınıflandırma doğruluğu gibi temel özelliklere odaklanarak bir ay boyunca 6 DLP çözümünü test ettim.
RAG Gözlemlenebilirlik Araçları Kıyaslama Testi
Dört RAG gözlemlenebilirlik platformunu, 7 düğümlü bir LangGraph işlem hattında üç pratik boyutta karşılaştırmalı olarak değerlendirdik: gecikme yükü, entegrasyon çabası ve platformlar arası ödünleşmeler. Gecikme yükü metrikleri Metriklerin açıklaması: Ortalama, ölçülen 150 graph.invoke() çağrısı boyunca ortalama gecikmedir. LLM-judge değerlendirmeleri zamanlayıcı durduktan sonra çalışır. Medyan, 50. yüzdelik dilimdeki gecikmedir.
RAG Çerçeveleri: LangChain, LangGraph ve LlamaIndex
5 RAG çerçevesini (LangChain, LangGraph, LlamaIndex, Haystack ve DSPy) aynı ajan tabanlı RAG iş akışını standartlaştırılmış bileşenlerle oluşturarak karşılaştırmalı olarak değerlendirdik: özdeş modeller (GPT-4.1-mini), gömülü vektörler (BGE-small), alıcı (Qdrant) ve araçlar (Tavily web araması). Bu, her çerçevenin gerçek ek yükünü ve belirteç verimliliğini ortaya koymaktadır.
'da Ajan Tabanlı Arama: Ajanlar için 8 Arama API'sinin Karşılaştırmalı Değerlendirilmesi
Ajan tabanlı arama, geleneksel arama motorları ile yapay zeka arama yetenekleri arasındaki boşluğu doldurmada çok önemli bir rol oynar. Bu sistemler, yapay zeka ajanlarının ilgili bilgileri otonom olarak bulmasını, almasını ve yapılandırmasını sağlayarak araştırma yardımından gerçek zamanlı izlemeye ve çok adımlı akıl yürütmeye kadar çeşitli uygulamalara güç verir.
Backup software benchmark: Acronis vs NinjaOne vs Comet vs MSP360
We benchmarked Acronis Cyber Protect Cloud Backup, Comet Backup, MSP360 Managed Backup, and NinjaOne Backup on identical AWS infrastructure. Each vendor ran a file-mode backup of the same 625,946-file / 50 GB workload and a full image backup of the system disk, then restored the 15 GB medium subdirectory.
Bulut GPU Kiralama Fiyat Endeksi
En yeni nesil bulut GPU'larının (B200, B300, MI300X, RTX 5090) talep üzerine fiyatları geçen yıl yaklaşık iki katına çıkarken, ana akım kartlar (H100, H200, A100) dar bir aralıkta kaldı. Talep üzerine, spot ve 1 yıllık rezerve kademelerini kapsayan 58 sağlayıcı ve 17 GPU modelinden aylık olarak GPU endeksini derliyoruz.
AIMultiple Bülteni
Haftada 1 ücretsiz e-posta ile en son B2B teknoloji haberleri ve uzman içgörüler ile işletmenizi hızlandırın.