Hizmetler
Bize Ulaşın
Nazlı Şipi

Nazlı Şipi

Yapay Zeka Araştırmacısı
30 Makale
B2B Teknolojisinde Güncel Kalın
Nazlı, AIMultiple'da veri analisti olarak çalışmaktadır. Daha önce çeşitli sektörlerde veri analizi alanında deneyim kazanmış olup, karmaşık veri kümelerini eyleme dönüştürülebilir içgörülere dönüştürme üzerine çalışmıştır. Ayrıca, büyük dil modelleri (LLM'ler), yapay zeka ajanları ve ajan tabanlı çerçevelere odaklanan kıyaslama ekibinin de bir parçasıdır. Nazlı, Denver Üniversitesi'nden İş Analitiği alanında yüksek lisans derecesine sahiptir.

Nazlı Tarafından Son Makaleler

Yapay zekaHaz 18

Yapay Zeka Destekli Halüsinasyon Tespit Araçları: W&B Weave ve Comet

Üç halüsinasyon tespit aracını karşılaştırdık: Weights & Biases (W&B) Weave HallucinationFree Scorer, Arize Phoenix HallucinationEvaluator ve Comet Opik Hallucination Metric, 100 test vakası üzerinden. Her araç, gerçek dünya performanslarının adil bir karşılaştırmasını sağlamak için doğruluk, hassasiyet, geri çağırma ve gecikme açısından değerlendirildi.

Yapay zekaHaz 17

LLM Gözlemlenebilirlik Araçları: Ağırlıklar ve Sapmalar, Langsmith

LLM tabanlı uygulamalar giderek daha yetenekli ve karmaşık hale geliyor, bu da davranışlarının yorumlanmasını zorlaştırıyor. Her model çıktısı, doğrudan incelenemeyen istemlerden, araç etkileşimlerinden, alma adımlarından ve olasılıksal akıl yürütmeden kaynaklanır. LLM gözlemlenebilirliği, modellerin gerçek dünya koşullarında nasıl çalıştığına dair sürekli görünürlük sağlayarak bu zorluğun üstesinden gelir.

Yapay zekaHaz 10

Yılında Kullanım Senaryolarına Göre LLM Gecikme Süresi Karşılaştırması

Büyük dil modellerinin (LLM'ler) etkinliği yalnızca doğrulukları ve yetenekleriyle değil, aynı zamanda kullanıcılarla etkileşim kurma hızlarıyla da belirlenir. Önde gelen dil modellerinin performansını çeşitli kullanım durumlarında karşılaştırdık ve kullanıcı girdilerine verdikleri yanıt sürelerini ölçtük.

VeriHaz 10

En İyi Airbnb Veri Kazıyıcıları: Bright Data, Apify ve Oxylabs

Airbnb üzerinde altı web kazıma sağlayıcısını test ettik ve tüm sağlayıcılara toplam 1.500 kazıma isteği gönderdik. Her sağlayıcıya aynı tatil evi kiralama URL'leri verildi ve tamamlanma süresi, başarı oranı ve ilan başına kullanılabilir meta veri alanları ölçüldü.

Yapay zekaHaz 10

Görsel Akıl Yürütme Üzerine Çok Modlu Yapay Zeka Modellerini Karşılaştırın

200 görsel tabanlı soru kullanarak, önde gelen 15 çok modlu yapay zeka modelini görsel akıl yürütme konusunda kıyasladık. Değerlendirme iki bölümden oluştu: Veri görselleştirme yorumlamasını test eden 100 grafik anlama sorusu ve örüntü tanıma ve mekansal akıl yürütmeyi değerlendiren 100 görsel mantık sorusu. Tutarlı ve güvenilir sonuçlar elde etmek için her soru 5 kez çalıştırıldı. Görsel akıl yürütme kıyaslaması Bkz.

VeriHaz 10

'da En İyi 6 LLM Veri Kazıyıcısı

Bright Data, Oxylabs ve Apify gibi en iyi LLM veri çekme sağlayıcılarının ChatGPT, Gemini, Perplexity ve Google gibi yapay zeka modlarıyla nasıl performans gösterdiğini karşılaştırmak için bir kıyaslama testi gerçekleştirdik. Güvenilir sonuçlar elde etmek için, her bir sağlayıcı için 1000 test yaptık ve her bir istemi tutarlılık için 10 kez tekrarladık. En iyi performans gösteren sağlayıcı aşağıda detaylandırılmıştır.

Yapay Zeka AjanıHaz 9

Yılında En İyi 5 Açık Kaynaklı Ajan Tabanlı Yapay Zeka Çerçevesi

Uçtan uca gecikmeyi, belirteç tüketimini ve mimari farklılıkları ölçerek, 2.000 çalıştırma (her çerçeve için 100 çalıştırma olmak üzere 5 görev) üzerinden 4 popüler açık kaynaklı ajan tabanlı çerçeveyi karşılaştırmalı olarak test ettik. Ajan tabanlı yapay zeka çerçevelerinin karşılaştırmalı testinde, çerçevelerin kendilerinin ajan davranışını nasıl etkilediğini ve bunun gecikme ve belirteç tüketimi üzerindeki etkisini inceledik. LangGraph, en düşük gecikme süresine sahip en hızlı çerçevedir.

Yapay Zeka AjanıHaz 9

Analitik İş Akışlarında Ajan Tabanlı Yapay Zeka Çerçevelerinin Kıyaslanması

Ajan tabanlı iş akışları oluşturmaya yönelik çerçeveler, kararları ve hataları ele alma biçimleri açısından önemli ölçüde farklılık gösterir; ancak kusurlu gerçek dünya verileri üzerindeki performansları büyük ölçüde test edilmemiştir. Gerçek dünya analitik iş akışlarındaki performanslarını değerlendirmek için, 100 kayıttan oluşan ve eksik veriler gibi kontrollü veri tutarsızlıkları içeren bir e-ticaret veri kümesi kullanarak LangGraph, LangChain, CrewAI ve Swarm'ı 3 gün boyunca karşılaştırmalı olarak test ettik.

VeriHaz 4

'nın En İyi 7 Video Veri Çekme Aracı: Test Edildi ve Sıralandı

Büyük video paylaşım ağları, otomatik veri çıkarma için önemli zorluklar sunan oldukça dinamik ortamlardır. Kısa video akışlarında sonsuz kaydırma düzenlerinin yaygınlığı gibi teknik engeller, standart veri çekme araçlarının verileri tutarlı bir şekilde alamamasına neden olmaktadır. En verimli veri çekme araçlarını belirlemek için 100 anahtar kelime ve 1.

VeriHaz 2

6 En İyi Google Veri Kazıma Sağlayıcısının Karşılaştırılması

Web kazıma sağlayıcılarının Google yorum çıkarma işlemini nasıl ele aldığını test etmek için, 5 sağlayıcı üzerinden 500 Google Haritalar işletme URL'si üzerinde 2.500 istek çalıştırdık ve başarı oranını, tamamlanma süresini ve meta veri çıktısını ölçtük. Google Haritalar yorum kazıma kıyaslaması Test süreci hakkında daha fazla bilgi için kıyaslama metodolojisini okuyabilirsiniz.