Services
Contactez-nous
Şevval Alper

Şevval Alper

Chercheur en IA
24 Articles
Restez informé des dernières technologies B2B

Şevval est chercheuse en intelligence artificielle chez AIMultiple. Elle possède une expérience de recherche antérieure dans le domaine de la génération de nombres pseudo-aléatoires à l'aide de systèmes chaotiques.

Intérêts de recherche

Şevval se concentre sur les outils de codage IA, les agents IA et les technologies quantiques.

Elle fait partie de l'équipe d'analyse comparative d'AIMultiple, où elle réalise des évaluations et fournit des analyses pour aider les lecteurs à comprendre diverses technologies émergentes et leurs applications.

Expérience professionnelle

Elle a contribué à l'organisation et à l'encadrement des participants à trois événements « Masterclasses internationales du CERN - physique des particules pratique » en Turquie, en collaborant avec les professeurs pour faciliter l'apprentissage.

Éducation

Şevval est titulaire d'une licence en physique de l'Université technique du Moyen-Orient.

Derniers articles de Şevval

Agent IAMai 5

Comparatif des plateformes d'agents IA : Claude Managed Agents vs Vertex Agent Engine (991259_843).

Nous avons évalué quatre plateformes d'agents IA selon trois critères : la réalisation des tâches (10 tâches de codage × 3 exécutions), les fonctionnalités spécifiques (guidage, reconnexion, rappel de conversations longues, gestion de fichiers volumineux) et le coût. Les résultats de cette évaluation montrent que Claude Managed Agents et Vertex AI Agent Engine obtiennent tous deux un taux de réussite de 100 % sur la suite de tâches, Vertex se distinguant par son coût.

Agent IAAvr 24

Analyse comparative MCP : Meilleurs serveurs MCP pour l'accès Web

Nous avons évalué les performances de 8 serveurs MCP pour la recherche et l'extraction web, ainsi que pour des tâches d'automatisation de navigateur, en exécutant 4 tâches différentes 5 fois sur tous les serveurs MCP compatibles. Nous avons également réalisé un test de charge impliquant 250 agents d'IA simultanés.

IAMar 30

Benchmark des créateurs de vidéos IA pour le commerce électronique : Veo 3 contre Sora 2

La visualisation des produits joue un rôle crucial dans le succès du e-commerce, pourtant la création de vidéos de produits de haute qualité demeure un défi de taille. Les récentes avancées en matière de génération vidéo par IA offrent des solutions prometteuses. Nous avons comparé les 6 meilleurs outils de création vidéo par IA à l'aide de 12 entrées (images et textes) afin d'évaluer leurs capacités à générer des vidéos de démonstration de produits : résultats du test comparatif des outils de création vidéo par IA (Figure ).

IAMar 14

Outils de revue de code IA

Avec l'utilisation croissante des outils de codage basés sur l'IA, les bases de code sont devenues plus vulnérables, d'où la nécessité accrue de revues de code efficaces. Pour répondre à ce besoin, nous présentons RevEval (AI Code Review Eval), qui compare les performances des quatre principaux outils de revue de code basés sur l'IA sur 309 requêtes d'extraction provenant de dépôts de tailles variées.

IAMar 13

Analyse comparative de l'IA: L'IA peut-elle générer de la valeur économique ?

L'IA aura son plus grand impact lorsque les systèmes d'IA commenceront à créer de la valeur économique de manière autonome. Nous avons évalué si des modèles de pointe pouvaient générer de la valeur économique. Nous leur avons demandé de développer une nouvelle application numérique (par exemple, un site web ou une application mobile) monétisable via un modèle SaaS ou publicitaire.

IAJan 28

Évaluation comparative de 8 modèles de code d'IA : LMC-Eval

Plus de 37 % des tâches effectuées sur des modèles d'IA concernent la programmation informatique et les mathématiques. Afin d'identifier le modèle d'IA le plus adapté au codage, nous lançons un nouveau benchmark, LMC-Eval, qui teste les meilleurs modèles d'IA pour évaluer leurs performances sur des questions de codage logique : résultats de LMC-Eval.

IAJan 28

Test de performance OCR : Précision d'extraction/de capture de texte

La précision de la reconnaissance optique de caractères (OCR) est essentielle pour de nombreuses tâches de traitement de documents, et les logiciels multimodaux de pointe offrent désormais une alternative à l'OCR. Nous avons comparé les principaux services d'OCR dans DeltOCR Bench afin d'identifier leurs niveaux de précision pour différents types de documents : Analyse comparative OCR : DeltOCR Bench.

IAJan 28

Analyse comparative des générateurs de texte en vidéo

Un générateur de texte en vidéo est un système d'IA qui transforme des consignes écrites en courtes vidéos en générant des éléments visuels, des mouvements et parfois de l'audio directement à partir du langage naturel.

Agent IAJan 28

Exécution de code avec MCP : une nouvelle approche de l'efficacité des agents d'IA

Le document Anthropic a introduit une méthode dans laquelle les agents d'IA interagissent avec les serveurs MCP (Model Context Protocol) en écrivant du code exécutable plutôt qu'en appelant directement les outils. L'agent traite les outils comme des fichiers sur un ordinateur, trouve ce dont il a besoin et les utilise directement dans son code, évitant ainsi que les données intermédiaires ne transitent par la mémoire du modèle.

IAJan 22

Paramètres LLM : GPT-5 Élevé, Moyen, Faible et Minimal

Les nouveaux LLM, tels que la famille OpenAI, se déclinent en différentes versions (par exemple, GPT-5, GPT-5-mini et GPT-5-nano) et avec divers paramètres : élevé, moyen, faible et minimal. Nous explorons ci-dessous les différences entre ces versions en analysant leurs performances de référence et les coûts d’exécution des tests. Rapport qualité-prix : principaux enseignements.