Şevval Alper
Şevval est chercheuse en intelligence artificielle chez AIMultiple. Elle possède une expérience de recherche antérieure dans le domaine de la génération de nombres pseudo-aléatoires à l'aide de systèmes chaotiques.
Intérêts de recherche
Şevval se concentre sur les outils de codage IA, les agents IA et les technologies quantiques.
Elle fait partie de l'équipe d'analyse comparative d'AIMultiple, où elle réalise des évaluations et fournit des analyses pour aider les lecteurs à comprendre diverses technologies émergentes et leurs applications.
Expérience professionnelle
Elle a contribué à l'organisation et à l'encadrement des participants à trois événements « Masterclasses internationales du CERN - physique des particules pratique » en Turquie, en collaborant avec les professeurs pour faciliter l'apprentissage.
Éducation
Şevval est titulaire d'une licence en physique de l'Université technique du Moyen-Orient.
Derniers articles de Şevval
Comparatif des plateformes d'agents IA : Claude Managed Agents vs Vertex Agent Engine (991259_843).
Nous avons évalué quatre plateformes d'agents IA selon trois critères : la réalisation des tâches (10 tâches de codage × 3 exécutions), les fonctionnalités spécifiques (guidage, reconnexion, rappel de conversations longues, gestion de fichiers volumineux) et le coût. Les résultats de cette évaluation montrent que Claude Managed Agents et Vertex AI Agent Engine obtiennent tous deux un taux de réussite de 100 % sur la suite de tâches, Vertex se distinguant par son coût.
Analyse comparative MCP : Meilleurs serveurs MCP pour l'accès Web
Nous avons évalué les performances de 8 serveurs MCP pour la recherche et l'extraction web, ainsi que pour des tâches d'automatisation de navigateur, en exécutant 4 tâches différentes 5 fois sur tous les serveurs MCP compatibles. Nous avons également réalisé un test de charge impliquant 250 agents d'IA simultanés.
Benchmark des créateurs de vidéos IA pour le commerce électronique : Veo 3 contre Sora 2
La visualisation des produits joue un rôle crucial dans le succès du e-commerce, pourtant la création de vidéos de produits de haute qualité demeure un défi de taille. Les récentes avancées en matière de génération vidéo par IA offrent des solutions prometteuses. Nous avons comparé les 6 meilleurs outils de création vidéo par IA à l'aide de 12 entrées (images et textes) afin d'évaluer leurs capacités à générer des vidéos de démonstration de produits : résultats du test comparatif des outils de création vidéo par IA (Figure ).
Outils de revue de code IA
Avec l'utilisation croissante des outils de codage basés sur l'IA, les bases de code sont devenues plus vulnérables, d'où la nécessité accrue de revues de code efficaces. Pour répondre à ce besoin, nous présentons RevEval (AI Code Review Eval), qui compare les performances des quatre principaux outils de revue de code basés sur l'IA sur 309 requêtes d'extraction provenant de dépôts de tailles variées.
Analyse comparative de l'IA: L'IA peut-elle générer de la valeur économique ?
L'IA aura son plus grand impact lorsque les systèmes d'IA commenceront à créer de la valeur économique de manière autonome. Nous avons évalué si des modèles de pointe pouvaient générer de la valeur économique. Nous leur avons demandé de développer une nouvelle application numérique (par exemple, un site web ou une application mobile) monétisable via un modèle SaaS ou publicitaire.
Évaluation comparative de 8 modèles de code d'IA : LMC-Eval
Plus de 37 % des tâches effectuées sur des modèles d'IA concernent la programmation informatique et les mathématiques. Afin d'identifier le modèle d'IA le plus adapté au codage, nous lançons un nouveau benchmark, LMC-Eval, qui teste les meilleurs modèles d'IA pour évaluer leurs performances sur des questions de codage logique : résultats de LMC-Eval.
Test de performance OCR : Précision d'extraction/de capture de texte
La précision de la reconnaissance optique de caractères (OCR) est essentielle pour de nombreuses tâches de traitement de documents, et les logiciels multimodaux de pointe offrent désormais une alternative à l'OCR. Nous avons comparé les principaux services d'OCR dans DeltOCR Bench afin d'identifier leurs niveaux de précision pour différents types de documents : Analyse comparative OCR : DeltOCR Bench.
Analyse comparative des générateurs de texte en vidéo
Un générateur de texte en vidéo est un système d'IA qui transforme des consignes écrites en courtes vidéos en générant des éléments visuels, des mouvements et parfois de l'audio directement à partir du langage naturel.
Exécution de code avec MCP : une nouvelle approche de l'efficacité des agents d'IA
Le document Anthropic a introduit une méthode dans laquelle les agents d'IA interagissent avec les serveurs MCP (Model Context Protocol) en écrivant du code exécutable plutôt qu'en appelant directement les outils. L'agent traite les outils comme des fichiers sur un ordinateur, trouve ce dont il a besoin et les utilise directement dans son code, évitant ainsi que les données intermédiaires ne transitent par la mémoire du modèle.
Paramètres LLM : GPT-5 Élevé, Moyen, Faible et Minimal
Les nouveaux LLM, tels que la famille OpenAI, se déclinent en différentes versions (par exemple, GPT-5, GPT-5-mini et GPT-5-nano) et avec divers paramètres : élevé, moyen, faible et minimal. Nous explorons ci-dessous les différences entre ces versions en analysant leurs performances de référence et les coûts d’exécution des tests. Rapport qualité-prix : principaux enseignements.
Newsletter AIMultiple
Un e-mail gratuit par semaine contenant les dernières actualités technologiques B2B et des analyses d'experts pour accélérer la croissance de votre entreprise.