Dienstleistungen
Jetzt kontaktieren
Ekrem Sarı

Ekrem Sarı

KI-Forscher
31 Artikel
Bleiben Sie über B2B-Technologie auf dem Laufenden

Ekrem ist KI-Forscher bei AIMultiple und konzentriert sich auf intelligente Automatisierung, GPUs, KI-Agenten und LLMOps für RAG-Frameworks.

Berufserfahrung

Während seiner Tätigkeit als Assessor bei Yandex bewertete er Suchergebnisse mithilfe firmeneigener Frameworks und automatisierter Protokolle. Er implementierte Qualitätssicherungstests durch Datenannotation, Relevanzbewertung und Nutzerintention-Mapping für monatlich über 10.000 Suchanfragen und führte gleichzeitig technische Bewertungen durch, darunter Leistungsüberwachung und Spam-Erkennung mithilfe von ML-Feedbackschleifen.

Forschungsinteresse

Bei AIMultiple konzentriert sich seine Forschung auf den MLOps-Lebenszyklus sowie die Leistungsfähigkeit und das Benchmarking von End-to-End-KI-Systemen. Er wirkt an einer Vielzahl von Projekten mit, darunter die Optimierung von Retrieval-Augmented Generation (RAG), umfassende Benchmarking-Studien für große Sprachmodelle (LLM) und die Entwicklung agentenbasierter KI-Frameworks. Ekrem ist spezialisiert auf die Entwicklung datengetriebener Methoden zur Messung und Verbesserung der Leistungsfähigkeit von KI-Technologien anhand kritischer Kennzahlen wie Genauigkeit, Effizienz, API-Kosten und Skalierbarkeit. Seine Analysen umfassen den gesamten Technologie-Stack, von grundlegenden Komponenten wie Einbettungsmodellen und Vektordatenbanken bis hin zur leistungsstarken GPU- und Cloud-Infrastruktur, die für den Einsatz von KI-Agenten erforderlich ist.

Ausbildung

Ekrem hat einen Bachelor-Abschluss der Hacettepe Üniversitesi und einen Master-Abschluss der Başkent Üniversitesi.

Neueste Artikel von Ekrem

UnternehmenssoftwareJun 13

Email Archiving Software Benchmark

We provisioned a Microsoft 365 tenant, populated it with a 10,000-mail synthetic corpus and 1,700 attachments across 8 file-type subtypes, then benchmarked NinjaOne SaaS Archiver, Barracuda Cloud Archiving Service, Acronis Cyber Protect Cloud Email Archiving, and MailPiler on the same tenant against 10 dimensions covering ingestion, search, attachment recall, export, immutability, legal hold, audit, encryption,

KIJun 11

Text-zu-SQL: Vergleich der LLM-Genauigkeit

Ich nutze SQL seit 18 Jahren für die Datenanalyse, angefangen in meiner Zeit als Berater. Die Übersetzung von natürlichsprachlichen Anfragen in SQL macht Daten zugänglicher und ermöglicht es jedem, auch ohne technische Vorkenntnisse, direkt mit Datenbanken zu arbeiten.

KIJun 10

Top 20+ Agentic RAG Frameworks

Agentic RAG erweitert das traditionelle RAG durch eine verbesserte LLM-Performance und ermöglicht eine stärkere Spezialisierung. Wir haben einen Benchmark durchgeführt, um die Performance beim Routing zwischen mehreren Datenbanken und der Generierung von Abfragen zu bewerten. Erfahren Sie mehr über Agentic-RAG-Frameworks und -Bibliotheken, die wichtigsten Unterschiede zum Standard-RAG sowie die Vorteile und Herausforderungen, um deren volles Potenzial auszuschöpfen.

KIJun 10

Benchmark von 38 LLM-Studiengängen im Bereich Finanzen: Claude Opus 4.6, Gemini 3.1 Pro & mehr

Wir evaluierten 38 LLM-Studiengänge im Bereich Finanzen anhand von 238 anspruchsvollen Fragen des FinanceReasoning-Benchmarks, um diejenigen Modelle zu identifizieren, die sich bei komplexen Aufgaben des finanziellen Denkens wie Bilanzanalyse, Prognosen und Kennzahlenberechnungen besonders gut eignen. Überblick über den LLM-Benchmark im Bereich Finanzen: Wir evaluierten LLM-Studiengänge anhand von 238 anspruchsvollen Fragen des FinanceReasoning-Benchmarks (Tang et al.).

CybersicherheitJun 10

DLP-Test: Vergleichstests von 6 DLP-Produkten

Aufbauend auf meiner zwanzigjährigen Erfahrung als Cybersicherheitsexperte habe ich die beste DLP-Software für den Schutz sensibler Daten und die Einhaltung regulatorischer Standards ausgewählt. Ich testete sechs DLP-Lösungen über einen Monat hinweg und konzentrierte mich dabei auf Schlüsselfunktionen wie Kanalabdeckung, einfache Implementierung und Klassifizierungsgenauigkeit.

KIJun 3

RAG Observability Tools Benchmark

Wir haben vier RAG-Observability-Plattformen in einer 7-Knoten-LangGraph-Pipeline anhand von drei praktischen Dimensionen verglichen: Latenz-Overhead, Integrationsaufwand und Plattform-Kompromisse. Metriken zum Latenz-Overhead: Erläuterung der Metriken: Der Mittelwert ist die durchschnittliche Latenz aus 150 gemessenen `graph.invoke()`-Aufrufen. Die LLM-Judge-Auswertungen erfolgen nach Ablauf des Timers. Der Median ist die Latenz des 50. Perzentils.

KIJun 3

RAG-Frameworks: LangChain vs. LangGraph vs. LlamaIndex

Wir haben fünf RAG-Frameworks – LangChain, LangGraph, LlamaIndex, Haystack und DSPy – anhand desselben agentenbasierten RAG-Workflows mit standardisierten Komponenten verglichen: identische Modelle (GPT-4.1-mini), Einbettungen (BGE-small), Retriever (Qdrant) und Tools (Tavily-Websuche). Dadurch lassen sich der tatsächliche Overhead und die Token-Effizienz jedes Frameworks isolieren.

KI-AgentMai 25

Agentensuche im Jahr: Benchmark 8 Such-APIs für Agenten

Agentenbasierte Suche spielt eine entscheidende Rolle bei der Überbrückung der Lücke zwischen traditionellen Suchmaschinen und KI-gestützten Suchfunktionen. Diese Systeme ermöglichen es KI-Agenten, relevante Informationen selbstständig zu finden, abzurufen und zu strukturieren und unterstützen so Anwendungen von der Forschungsunterstützung bis hin zu Echtzeitüberwachung und mehrstufigem Schließen.

CybersicherheitMai 22

Backup software benchmark: Acronis vs NinjaOne vs Comet vs MSP360

We benchmarked Acronis Cyber Protect Cloud Backup, Comet Backup, MSP360 Managed Backup, and NinjaOne Backup on identical AWS infrastructure. Each vendor ran a file-mode backup of the same 625,946-file / 50 GB workload and a full image backup of the system disk, then restored the 15 GB medium subdirectory.

KIMai 20

Preisindex für Cloud-GPU-Miete

Die On-Demand-Preise für Cloud-GPUs der neuesten Generation (B200, B300, MI300X, RTX 5090) haben sich im letzten Jahr etwa verdoppelt, während die Preise für Mainstream-Karten (H100, H200, A100) relativ stabil blieben. Wir erstellen den GPU-Index monatlich anhand von Daten von 58 Anbietern und 17 GPU-Modellen und berücksichtigen dabei On-Demand-, Spot- und Jahresreservierungstarife. Preistrends nach GPU-Generation (siehe Grafik ).