Servizi
Contattaci
Ekrem Sarı

Ekrem Sarı

Ricercatore di intelligenza artificiale
31 Articoli
Rimani aggiornato sulle novità tecnologiche B2B.

Ekrem è un ricercatore di intelligenza artificiale presso AIMultiple, specializzato in automazione intelligente, GPU, agenti di IA e LLMOps per framework RAG.

Esperienza professionale

Durante il suo incarico come valutatore presso Yandex, ha analizzato i risultati di ricerca utilizzando framework proprietari e protocolli automatizzati. Ha implementato test di controllo qualità tramite annotazione dei dati, punteggio di pertinenza e mappatura dell'intento dell'utente su oltre 10.000 query al mese, conducendo al contempo valutazioni tecniche, tra cui il monitoraggio delle prestazioni e il rilevamento dello spam tramite cicli di feedback basati sull'apprendimento automatico.

Capacità di ricerca

Presso AIMultiple, la sua ricerca si concentra sul ciclo di vita MLOps e sulle prestazioni e il benchmarking di sistemi di intelligenza artificiale end-to-end. Contribuisce a una vasta gamma di progetti, tra cui l'ottimizzazione del Retrieval-Augmented Generation (RAG), un ampio benchmarking di Large Language Model (LLM) e la progettazione di framework di intelligenza artificiale agentica. Ekrem è specializzato nello sviluppo di metodologie basate sui dati per misurare e migliorare le prestazioni della tecnologia IA in base a metriche operative critiche come accuratezza, efficienza, costo delle API e scalabilità. La sua analisi copre l'intero stack tecnologico, dai componenti fondamentali come i modelli di embedding e i database vettoriali fino alle GPU ad alte prestazioni e all'infrastruttura cloud necessarie per implementare agenti IA.

Preparazione

Ekrem ha conseguito una laurea presso la Hacettepe Üniversitesi e un master presso la Başkent Üniversitesi.

Ultimi articoli di Ekrem

Software aziendaleGiu 13

Email Archiving Software Benchmark

We provisioned a Microsoft 365 tenant, populated it with a 10,000-mail synthetic corpus and 1,700 attachments across 8 file-type subtypes, then benchmarked NinjaOne SaaS Archiver, Barracuda Cloud Archiving Service, Acronis Cyber Protect Cloud Email Archiving, and MailPiler on the same tenant against 10 dimensions covering ingestion, search, attachment recall, export, immutability, legal hold, audit, encryption,

IAGiu 11

Da testo a SQL: confronto dell'accuratezza di LLM

Utilizzo SQL per l'analisi dei dati da 18 anni, fin dai tempi in cui lavoravo come consulente. Tradurre le domande in linguaggio naturale in SQL rende i dati più accessibili, consentendo a chiunque, anche a chi non possiede competenze tecniche, di lavorare direttamente con i database.

IAGiu 10

Oltre 20 framework RAG per agenti

Agentic RAG migliora il RAG tradizionale potenziando le prestazioni di LLM e consentendo una maggiore specializzazione. Abbiamo condotto un benchmark per valutarne le prestazioni nel routing tra più database e nella generazione di query. Scopri i framework e le librerie di agentic RAG, le principali differenze rispetto al RAG standard, i vantaggi e le sfide per sbloccarne il pieno potenziale.

IAGiu 10

Valutazione comparativa di 38 LLM in Finanza: Claude Opus 4.6, Gemini 3.1 Pro e altri

Abbiamo valutato 38 LLM in ambito finanziario su 238 domande complesse del benchmark FinanceReasoning per identificare quali modelli eccellono in compiti di ragionamento finanziario complessi come l'analisi dei bilanci, le previsioni e il calcolo dei rapporti. Panoramica del benchmark LLM in finanza Abbiamo valutato gli LLM su 238 domande complesse del benchmark FinanceReasoning (Tang et al.).

Sicurezza informaticaGiu 10

Recensione DLP: Test comparativi di 6 prodotti DLP

Sfruttando la mia esperienza ventennale come professionista della sicurezza informatica, ho selezionato il miglior software DLP per proteggere le informazioni sensibili e rispettare gli standard normativi. Ho testato 6 soluzioni DLP per un mese, concentrandomi su funzionalità chiave come la copertura dei canali, la facilità di implementazione e l'accuratezza della classificazione.

IAGiu 3

RAG Strumenti di osservabilità - Benchmark

Abbiamo eseguito un benchmark di quattro piattaforme di osservabilità RAG su una pipeline LangGraph a 7 nodi, considerando tre dimensioni pratiche: overhead di latenza, sforzo di integrazione e compromessi tra piattaforme. Metriche dell'overhead di latenza Spiegazione delle metriche: La media è la latenza media su 150 chiamate graph.invoke() misurate. Le valutazioni di LLM-judge vengono eseguite dopo l'arresto del timer. La mediana è la latenza al 50° percentile.

IAGiu 3

Framework RAG: LangChain vs LangGraph vs LlamaIndex

Abbiamo eseguito un benchmark su 5 framework RAG: LangChain, LangGraph, LlamaIndex, Haystack e DSPy, costruendo lo stesso flusso di lavoro RAG agentico con componenti standardizzati: modelli identici (GPT-4.1-mini), embedding (BGE-small), retriever (Qdrant) e strumenti (ricerca web Tavily). Questo isola il vero overhead e l'efficienza dei token di ciascun framework.

Agente IAMag 25

Agentic Search nel: benchmark 8 API di ricerca per agenti

La ricerca agentiva svolge un ruolo cruciale nel colmare il divario tra i motori di ricerca tradizionali e le capacità di ricerca dell'IA. Questi sistemi consentono agli agenti IA di trovare, recuperare e strutturare autonomamente informazioni pertinenti, alimentando applicazioni che vanno dall'assistenza alla ricerca al monitoraggio in tempo reale e al ragionamento a più fasi.

Sicurezza informaticaMag 22

Backup software benchmark: Acronis vs NinjaOne vs Comet vs MSP360

We benchmarked Acronis Cyber Protect Cloud Backup, Comet Backup, MSP360 Managed Backup, and NinjaOne Backup on identical AWS infrastructure. Each vendor ran a file-mode backup of the same 625,946-file / 50 GB workload and a full image backup of the system disk, then restored the 15 GB medium subdirectory.

IAMag 20

Indice dei prezzi di noleggio delle GPU cloud

Le tariffe on-demand per le GPU cloud di ultima generazione (B200, B300, MI300X, RTX 5090) sono praticamente raddoppiate nell'ultimo anno, mentre le schede mainstream (H100, H200, A100) hanno mantenuto prezzi pressoché invariati. Compiliamo mensilmente l'indice GPU da 58 provider e 17 modelli di GPU, coprendo le fasce di prezzo on-demand, spot e con abbonamento annuale.