Services
Contactez-nous
Nazlı Şipi

Nazlı Şipi

Chercheur en IA
30 Articles
Restez informé des dernières technologies B2B
Nazlı est analyste de données chez AIMultiple. Elle possède une expérience en analyse de données acquise dans divers secteurs, où elle a travaillé à la transformation d'ensembles de données complexes en informations exploitables. Elle fait également partie de l'équipe d'évaluation comparative, spécialisée dans les grands modèles de langage (LLM), les agents d'IA et les frameworks d'agents. Nazlı est titulaire d'un master en analyse commerciale de l'Université de Denver.

Derniers articles de Nazlı

IAJuin 17

Outils d'observabilité LLM : Poids et biais, Langsmith

Les applications basées sur les modèles linéaires latents (LLM) gagnent en puissance et en complexité, rendant leur comportement plus difficile à interpréter. Chaque résultat de modèle résulte d'instructions, d'interactions avec des outils, d'étapes de récupération et d'un raisonnement probabiliste qui ne peuvent être inspectés directement. L'observabilité des LLM répond à ce défi en offrant une visibilité continue sur le fonctionnement des modèles en conditions réelles.

IAJuin 10

Analyse comparative de la latence LLM par cas d'utilisation en

L'efficacité des grands modèles de langage (GML) dépend non seulement de leur précision et de leurs capacités, mais aussi de leur rapidité d'interaction avec les utilisateurs. Nous avons évalué les performances des principaux modèles de langage dans divers cas d'utilisation, en mesurant leurs temps de réponse aux entrées utilisateur.

DonnéesJuin 10

Meilleurs outils d'extraction de données Airbnb : Bright Data, Apify et Oxylabs

Nous avons testé six fournisseurs de web scraping sur Airbnb, en envoyant un total de 1 500 requêtes de scraping à l'ensemble des fournisseurs. Chaque fournisseur a reçu le même ensemble d'URL d'annonces de locations de vacances et a été évalué sur le temps d'exécution, le taux de réussite et les champs de métadonnées disponibles par annonce. Pour plus de détails sur notre méthodologie de benchmark Airbnb, veuillez consulter notre site web.

IAJuin 10

Comparaison de modèles d'IA multimodaux en matière de raisonnement visuel

Nous avons évalué les performances de 15 modèles d'IA multimodaux de pointe en matière de raisonnement visuel à l'aide de 200 questions visuelles. L'évaluation comportait deux volets : 100 questions de compréhension de graphiques testant l'interprétation de la visualisation des données, et 100 questions de logique visuelle évaluant la reconnaissance de formes et le raisonnement spatial. Chaque question a été posée 5 fois afin de garantir des résultats cohérents et fiables.

DonnéesJuin 10

Les 6 meilleurs grattoirs LLM en

Nous avons effectué un test de performance pour comparer les résultats des principaux fournisseurs de scraping LLM, tels que Bright Data, Oxylabs et Apify, avec des modèles comme ChatGPT, Gemini, Perplexity et Google AI Mode. Afin de garantir des résultats fiables, nous avons réalisé 1 000 tests par fournisseur, chaque requête étant répétée 10 fois pour assurer la cohérence des résultats. Le fournisseur le plus performant est présenté ci-dessous.

Agent IAJuin 9

Les 5 meilleurs frameworks d'IA agentique open source en

Nous avons comparé les performances de 4 frameworks d'IA open source populaires sur 2 000 exécutions (5 tâches, 100 exécutions par framework), en mesurant la latence de bout en bout, la consommation de jetons et les différences architecturales. Nous avons examiné comment les frameworks influencent le comportement des agents et l'impact qui en résulte sur la latence et la consommation de jetons. LangGraph est le framework le plus rapide avec la latence la plus faible.

Agent IAJuin 9

Évaluation comparative des cadres d'IA agentiques dans les flux de travail analytiques

Les frameworks de création de workflows multi-agents diffèrent considérablement dans leur gestion des décisions et des erreurs, mais leurs performances sur des données réelles imparfaites restent largement inexplorées. Afin d'évaluer leurs performances sur des workflows analytiques réels, nous avons consacré trois jours à comparer les performances de LangGraph, LangChain, CrewAI et Swarm à l'aide d'un jeu de données e-commerce de 100 enregistrements présentant des incohérences contrôlées, telles que des données manquantes.

DonnéesJuin 4

Les 7 meilleurs extracteurs de vidéos en  : testés et classés

Les principaux réseaux de partage de vidéos sont des environnements très dynamiques qui présentent des défis importants pour l'extraction automatisée de données. Des obstacles techniques, tels que la prévalence du défilement infini dans les flux vidéo courts, empêchent souvent les outils d'extraction classiques de récupérer les données de manière systématique. Nous avons mené une analyse comparative des fournisseurs sur 100 mots-clés et 1 000 ressources vidéo uniques afin d'identifier les plus performants.

DonnéesJuin 2

Comparaison des 6 meilleurs fournisseurs de web scraping (991259_843)

Pour tester la performance des fournisseurs de web scraping lors de l'extraction d'avis (Google), nous avons effectué 2 500 requêtes auprès de 5 fournisseurs sur 500 URL d'établissements Maps (Google). Nous avons ensuite mesuré le taux de réussite, le temps d'exécution et les métadonnées générées. Pour plus de détails sur le processus de test, consultez la méthodologie de test.

DonnéesJuin 2

Les 5 meilleures API de scraping de cartes (991259_811) en  : testées et classées

Pour trouver le meilleur outil d'extraction de données cartographiques (Google), nous avons comparé les principaux fournisseurs (Apify, Oxylabs, Octoparse et SerpApi) en effectuant 100 recherches pour chacun. Nous avons testé 10 catégories et analysé 4 000 fiches d'établissement. Nous avons également vérifié les numéros de téléphone et les avis afin de garantir l'utilité des données pour la génération de prospects.