Şevval Alper
Şevval è una ricercatrice di intelligenza artificiale presso AIMultiple. Ha maturato esperienza nella generazione di numeri pseudocasuali utilizzando sistemi caotici.
Interessi di ricerca
Şevval si concentra su strumenti di programmazione per l'intelligenza artificiale, agenti di intelligenza artificiale e tecnologie quantistiche.
Fa parte del team di benchmarking di AIMultiple, dove conduce valutazioni e fornisce approfondimenti per aiutare i lettori a comprendere le diverse tecnologie emergenti e le loro applicazioni.
Esperienza professionale
Ha contribuito all'organizzazione e alla guida dei partecipanti a tre eventi "CERN International Masterclasses - hands-on particle physics" in Turchia, collaborando con i docenti per facilitare l'apprendimento.
Preparazione
Şevval ha conseguito una laurea in Fisica presso l'Università Tecnica del Medio Oriente.
Ultimi articoli di Şevval
Benchmark delle piattaforme di agenti AI: Claude Managed Agents vs Google Vertex Agent Engine
Abbiamo confrontato 4 piattaforme di agenti AI in base a 3 dimensioni: completamento delle attività (10 attività di programmazione × 3 esecuzioni), funzionalità specifiche dell'infrastruttura (gestione, riconnessione, richiamo di conversazioni lunghe, gestione di file di grandi dimensioni) e costo.
MCP Benchmark: i migliori server MCP per l'accesso web
Abbiamo eseguito un benchmark su 8 server MCP per la ricerca e l'estrazione web, nonché per le attività di automazione del browser, eseguendo 4 attività diverse 5 volte su tutti gli MCP idonei. Abbiamo anche effettuato un test di carico con 250 agenti AI simultanei.
E-Commerce AI Video Maker Benchmark: Veo 3 vs Sora 2
La visualizzazione del prodotto gioca un ruolo cruciale nel successo dell'e-commerce, eppure la creazione di video di prodotto di alta qualità rimane una sfida significativa. I recenti progressi nella tecnologia di generazione video basata sull'intelligenza artificiale offrono soluzioni promettenti.
Strumenti di benchmark per la revisione del codice tramite intelligenza artificiale
Con il crescente utilizzo di strumenti di programmazione basati sull'IA, le codebase sono diventate più soggette a vulnerabilità, aumentando la necessità di efficaci revisioni del codice.
AGI Benchmark: l'intelligenza artificiale può generare valore economico?
L'IA avrà il suo massimo impatto quando i sistemi di IA inizieranno a creare valore economico in modo autonomo. Abbiamo valutato se i modelli di frontiera possono generare valore economico. Li abbiamo invitati a creare una nuova applicazione digitale (ad esempio, un sito web o un'app mobile) che possa essere monetizzata con un modello SaaS o basato sulla pubblicità.
8 modelli di codice AI sottoposti a benchmarking: LMC-Eval
Oltre il 37% delle attività svolte sui modelli di IA riguarda la programmazione e la matematica.
Benchmark OCR: accuratezza di estrazione/acquisizione del testo
La precisione dell'OCR è fondamentale per molte attività di elaborazione dei documenti e i sistemi LLM multimodali SOTA offrono ora un'alternativa all'OCR.
Benchmark del generatore di testo in video
Un generatore di video da testo è un sistema di intelligenza artificiale che trasforma i prompt scritti in brevi video generando elementi visivi, movimenti e talvolta audio direttamente dal linguaggio naturale.
Esecuzione del codice con MCP: un nuovo approccio all'efficienza degli agenti di intelligenza artificiale
Anthropic ha introdotto un metodo in cui gli agenti di intelligenza artificiale interagiscono con i server del Model Context Protocol (MCP) scrivendo codice eseguibile anziché effettuare chiamate dirette agli strumenti. L'agente tratta gli strumenti come file su un computer, trova ciò di cui ha bisogno e li utilizza direttamente con il codice, in modo che i dati intermedi non debbano passare attraverso la memoria del modello.
Parametri LLM: GPT-5 Alto, Medio, Basso e Minimo
I nuovi LLM, come la famiglia GPT-5 di OpenAI, sono disponibili in diverse versioni (ad esempio, GPT-5, GPT-5-mini e GPT-5-nano) e con varie impostazioni dei parametri, tra cui alta, media, bassa e minima. Di seguito, esploriamo le differenze tra queste versioni del modello raccogliendo le loro prestazioni di benchmark e i costi per eseguirli. Prezzo vs.
Newsletter AI Multiple
Una email gratuita a settimana con le ultime notizie tecnologiche B2B e approfondimenti di esperti per dare impulso alla tua azienda.