RAG Ölçümleri: Gömme Modelleri, Vektör Veritabanları ve Yeniden Sıralayıcılar

RAG, yanıtları harici verilere dayandırarak LLM güvenilirliğini artırır. RAG yığınını, embedding model'ler, reranker'lar, vektör veritabanları, framework'ler ve değerlendirme araçları karşısında getirme doğruluğu, gecikme ve kalite açısından kıyaslıyoruz.

RAG için Vektör Veritabanı

Aşağıdaki hesaplayıcı, aynı embedding'ler üzerinde eşleşen geri çağırma oranında çalıştırılan yedi kendi kendine barındırılan vektör veritabanına ait kıyaslama sonuçlarımızdan her ikisini de yanıtlıyor.

RAG için Vektör Veritabanı

Geri Getirme Destekli Üretim

Bir RAG sistemini oluşturan bileşenleri kıyasladık ve sonuçları, yığının her parçasını seçmeye yönelik pratik bir rehberle birlikte tek bir yerde topladık.

Geri Getirme Destekli Üretim

Açık Kaynaklı Vektör Veritabanları

Yedi açık kaynak, kendi kendine barındırılan vektör veritabanını bir RAG pipeline'ının erişim katmanı olarak benchmark ettik; her biri aynı bge-m3 embedding'leri ve gerçek tıbbi ve teknik sorgular üzerinde teker teker çalıştırıldı, böylece veritabanı endeksi tek değişken oldu.

Açık Kaynaklı Vektör Veritabanları

Ajansal RAG

Birden çok veritabanı arasında yönlendirme ve sorgu oluşturma konusundaki performansını değerlendirmek için bir kıyaslama gerçekleştirdik.

Ajansal RAG

RAG Ölçümleri: Gömme Modelleri, Vektör Veritabanları ve Yeniden Sıralayıcılar Keşfedin

En İyi RAG Araçları, Çerçeveleri ve Kütüphaneleri

RAG

Kıyaslama

18 Tem

RAG, LLM yanıtlarını yalnızca modelin eğitim sırasında ezberledikleri yerine harici verilerle temellendirerek iyileştirir. Bir RAG sistemini oluşturan bileşenleri kıyasladık ve sonuçları, yığının her parçasını seçmeye yönelik pratik bir rehberle birlikte tek bir yerde topladık. Her RAG bileşeni için kıyaslama sonuçlarımıza, RAG yığını seçme rehberimize veya RAG temellerine bakın: nedir, nasıl çalışır ve nerede yer alır.…

En İyi 20+ Agentic RAG Çerçevesi

Agentic RAG, LLM performansını artırarak ve daha fazla uzmanlaşma sağlayarak geleneksel RAG'ı geliştirir. Birden çok veritabanı arasında yönlendirme ve sorgu oluşturma konusundaki performansını değerlendirmek için bir kıyaslama gerçekleştirdik. Agentic RAG çerçevelerini ve kütüphanelerini, standart RAG'tan temel farklarını, avantajlarını ve zorluklarını keşfedin ve tam potansiyellerini ortaya çıkarın. Sistemin, her biri benzersiz bağlamsal bilgilere sahip beş farklı…

RAG

Kıyaslama

3 Tem

RAG için Açık Kaynak Embedding Model Karşılaştırması

Tek bir H100 üzerinde self-hosted olarak çalıştırılan 14 açık kaynak embedding modelini, hukuk sözleşmeleri, müşteri destek teknik notları ve tıbbi özetleri kapsayan 500'den fazla elle seçilmiş erişim sorgusu üzerinde karşılaştırdık. NVIDIA Llama-Embed-Nemotron-8B doğrulukta lider. Maliyet açısından, Google'ın EmbeddingGemma-300m modeli, küçük bir doğruluk kaybı karşılığında Nemotron'dan yaklaşık 4x daha ucuz çalışıyor. nDCG@3: Kesme noktası 3'te normalize…

RAG

Kıyaslama

2 Tem

Çok Modlu Gömme Modelleri: Apple vs Meta vs OpenAI

Çok modlu gömme modelleri nesneleri tanımlamada mükemmel olsa da ilişkiler konusunda zorlanıyor. Mevcut modeller, "harita üzerindeki telefon" ile "telefon üzerindeki harita"yı ayırt etmekte zorlanıyor. Bu spesifik sınırlamayı ölçmek için MS-COCO ve Winoground üzerinde 7 önde gelen modeli karşılaştırdık. Adil bir karşılaştırma sağlamak için her modeli NVIDIA A40 donanımı ve bfloat16 hassasiyeti altında aynı koşullarda değerlendirdik.…

RAG

Kıyaslama

2 Tem

RAG Değerlendirme Araçları: Weights & Biases vs Ragas vs DeepEval

Bir RAG pipeline'ı yanlış bağlamı getirdiğinde, LLM yanlış cevabı kendinden emin bir şekilde üretir. Bağlam uygunluk skorlayıcıları birincil savunmadır. Aynı koşullar altında 1.460 soru ve 14.600'den fazla skorlanmış bağlam üzerinden beş aracı kıyasladık: aynı yargıç modeli (GPT-4o), varsayılan yapılandırmalar ve özel prompt'lar yok. Standart koşullar altında WandB, TruLens ve Ragas en iyi performans gösterenler olarak…

RAG

Kıyaslama

30 Haz

En İyi 10 Çok Dilli Embedding Model'leri RAG için

10 çok dilli embedding model'ini ~606k Amazon yorumu üzerinde 6 dilde (Almanca, İngilizce, İspanyolca, Fransızca, Japonca, Çince) kıyasladık. 1,800 sorgu oluşturduk (dil başına 300), her biri kaynak incelemesinden somut ayrıntılara değinir. Arama için eğitilmiş modeller (sorgu vs belge ayrımı), genel metin benzerliği için eğitilmiş daha büyük modellerden daha iyi performans gösterir: e5_base (110M parametre), 5x…

RAG

Kıyaslama

29 Haz

Embedding Modelleri: OpenAI vs Gemini vs Voyage

15 İngilizce metin embedding modelini ve bir BM25 temel çizgisini, üç erişim alanında (hukuk sözleşmeleri (CUAD), müşteri desteği (IBM TechQA) ve sağlık hizmetleri (MedRAG PubMed)) 500'den fazla elle derlenmiş sorgu üzerinde kıyasladık. Voyage-3.5 genel sıralamada ilk sırada yer alıyor. Perplexity Embed V1 0.6b, kıyaslamamızdaki en düşük fiyat noktasında üst-orta seviyeye ulaşıyor. nDCG@3: Kesme noktası 3'te…

RAG

Kıyaslama

29 Haz

RAG Çerçeveleri: LangChain vs LangGraph vs LlamaIndex

Aynı agentic RAG iş akışını standartlaştırılmış bileşenlerle oluşturarak 5 RAG çerçevesini karşılaştırdık: LangChain, LangGraph, LlamaIndex, Haystack ve DSPy: özdeş modeller (GPT-4.1-mini), embedding'ler (BGE-small), alıcı (Qdrant) ve araçlar (Tavily web araması). Bu, her bir çerçevenin gerçek ek yükünü ve token verimliliğini yalıtır. Karşılaştırma 100 sorgudan oluşuyordu, her bir çerçeve kararlı ortalamalar sağlamak için tam seti 100…

RAG

Kıyaslama

29 Haz

Yeniden Sıralayıcı Benchmark: En İyi 8 Model Karşılaştırıldı

Yoğun arama (dense retrieval) aşamasının bir yeniden sıralama evresiyle ne kadar iyileştiğini ölçmek için 8 yeniden sıralayıcı modeli ~145k İngilizce Amazon incelemesi üzerinde test ettik. multilingual-e5-base ile en iyi 100 adayı getirdik, her modelle yeniden sıraladık ve en iyi 10 sonucu, her biri kaynak incelemesinden somut detaylara atıfta bulunan 300 sorguya karşı değerlendirdik. En iyi…

RAG Ölçümleri: Gömme Modelleri, Vektör Veritabanları ve Yeniden Sıralayıcılar

RAG için Vektör Veritabanı

Geri Getirme Destekli Üretim

Açık Kaynaklı Vektör Veritabanları

Ajansal RAG

RAG Ölçümleri: Gömme Modelleri, Vektör Veritabanları ve Yeniden Sıralayıcılar Keşfedin

En İyi RAG Araçları, Çerçeveleri ve Kütüphaneleri

En İyi 20+ Agentic RAG Çerçevesi

RAG için Açık Kaynak Embedding Model Karşılaştırması

Çok Modlu Gömme Modelleri: Apple vs Meta vs OpenAI

RAG Değerlendirme Araçları: Weights & Biases vs Ragas vs DeepEval

En İyi 10 Çok Dilli Embedding Model'leri RAG için

Embedding Modelleri: OpenAI vs Gemini vs Voyage

RAG Çerçeveleri: LangChain vs LangGraph vs LlamaIndex

Yeniden Sıralayıcı Benchmark: En İyi 8 Model Karşılaştırıldı

SSS

RAG için Vektör Veritabanı

Geri Getirme Destekli Üretim

Açık Kaynaklı Vektör Veritabanları

Ajansal RAG