Services
Contactez-nous
Ekrem Sarı

Ekrem Sarı

Chercheur en IA
31 Articles
Restez informé des dernières technologies B2B

Ekrem est chercheur en IA chez AIMultiple, spécialisé dans l'automatisation intelligente, les GPU, les agents IA et le LLMOps pour les frameworks RAG.

Expérience professionnelle

Durant son poste d'évaluateur chez Yandex, il a analysé les résultats de recherche à l'aide de frameworks propriétaires et de protocoles automatisés. Il a mis en œuvre des tests d'assurance qualité par l'annotation de données, l'attribution de scores de pertinence et la cartographie de l'intention de l'utilisateur sur plus de 10 000 requêtes mensuelles, tout en réalisant des évaluations techniques, notamment le suivi des performances et la détection de spam grâce à des boucles de rétroaction d'apprentissage automatique.

Intérêts de recherche

Chez AIMultiple, ses recherches portent sur le cycle de vie MLOps et l'évaluation des performances des systèmes d'IA de bout en bout. Il contribue à de nombreux projets, notamment l'optimisation de la génération augmentée par la recherche (RAG), l'évaluation comparative de modèles de langage étendus (LLM) et la conception de frameworks d'IA agentiques. Ekrem est spécialisé dans le développement de méthodologies basées sur les données pour mesurer et améliorer les performances des technologies d'IA selon des indicateurs opérationnels critiques tels que la précision, l'efficacité, le coût des API et la scalabilité. Son analyse couvre l'ensemble de la pile technologique, des composants fondamentaux comme les modèles embarqués et les bases de données vectorielles jusqu'à l'infrastructure GPU et cloud haute performance nécessaire au déploiement des agents d'IA.

Éducation

Ekrem est titulaire d'un baccalauréat de l'université Hacettepe et d'une maîtrise de l'université Başkent.

Derniers articles de Ekrem

Logiciel d'entrepriseJuin 16

Email Archiving Software Benchmark

We provisioned a Microsoft 365 tenant, populated it with a 10,000-mail synthetic corpus and 1,700 attachments across 8 file-type subtypes, then benchmarked NinjaOne SaaS Archiver, Barracuda Cloud Archiving Service, Acronis Cyber Protect Cloud Email Archiving, and MailPiler on the same tenant against 10 dimensions covering ingestion, search, attachment recall, export, immutability, legal hold, audit, encryption,

IAJuin 16

Les 30 principaux fournisseurs de GPU cloud et leurs GPU en

Nous avons évalué les performances des 10 GPU les plus courants dans des scénarios typiques (par exemple, l'optimisation d'un LLM comme Llama 3.2). À partir de ces résultats, si vous : Classement : Les sponsors sont mis en évidence en haut de la page. Ensuite, les hyperscalers sont classés par part de marché aux États-Unis. Enfin, les fournisseurs sont triés par nombre de modèles proposés.

cybersécuritéJuin 16

Backup software benchmark: Acronis vs NinjaOne vs Comet vs MSP360

We benchmarked Acronis Cyber Protect Cloud Backup, Comet Backup, MSP360 Managed Backup, and NinjaOne Backup on identical AWS infrastructure. Each vendor ran a file-mode backup of the same 625,946-file / 50 GB workload and a full image backup of the system disk, then restored the 15 GB medium subdirectory.

IAJuin 11

Text-to-SQL : Comparaison de la précision LLM

J'utilise SQL pour l'analyse de données depuis 18 ans, et ce, depuis mes débuts comme consultant. La traduction des requêtes en langage naturel en SQL rend les données plus accessibles, permettant à tous, même sans compétences techniques, de travailler directement avec les bases de données.

IAJuin 10

Les 20 meilleurs frameworks RAG d'agentic

Agentic RAG améliore le RAG traditionnel en optimisant les performances LLM et en permettant une plus grande spécialisation. Nous avons réalisé un test de performance pour évaluer ses performances en matière de routage entre plusieurs bases de données et de génération de requêtes. Découvrez les frameworks et bibliothèques Agentic RAG, leurs principales différences avec le RAG standard, leurs avantages et les défis à relever pour exploiter pleinement leur potentiel.

IAJuin 10

Comparatif de 38 LLM en finance : Claude Opus 4.6, Gemini 3.1 Pro et plus

Nous avons évalué 38 masters en droit (LLM) en finance sur 238 questions difficiles issues du benchmark FinanceReasoning afin d'identifier les modèles qui excellent dans les tâches complexes de raisonnement financier telles que l'analyse d'états financiers, les prévisions et les calculs de ratios. Aperçu du benchmark FinanceReasoning : Nous avons évalué les LLM sur 238 questions difficiles issues du benchmark FinanceReasoning (Tang et al.).

cybersécuritéJuin 10

Analyse comparative de 6 produits DLP

Fort de mes vingt ans d'expérience en cybersécurité, j'ai sélectionné les meilleurs logiciels DLP pour la protection des informations sensibles et la conformité aux normes réglementaires. J'ai testé six solutions DLP pendant un mois, en me concentrant sur des fonctionnalités clés telles que la couverture des canaux, la facilité de déploiement et la précision de la classification.

IAJuin 3

Outils d'observabilité RAG - Analyse comparative

Nous avons évalué quatre plateformes d'observabilité RAG sur un pipeline LangGraph à 7 nœuds selon trois dimensions pratiques : la latence, l'effort d'intégration et les compromis entre les plateformes. Métriques de latence : Explication des métriques : La moyenne correspond à la latence moyenne mesurée sur 150 appels à `graph.invoke()`. Les évaluations LLM-judge sont exécutées après l'arrêt du chronomètre. La médiane correspond au 50e percentile de la latence.

IAJuin 3

Frameworks RAG : LangChain vs LangGraph vs LlamaIndex

Nous avons évalué les performances de cinq frameworks RAG : LangChain, LangGraph, LlamaIndex, Haystack et DSPy, en construisant le même flux de travail RAG multi-agents avec des composants standardisés : modèles identiques (GPT-4.1-mini), plongements lexicaux (BGE-small), récupérateur (Qdrant) et outils (recherche web Tavily). Ceci permet d’isoler la surcharge réelle et l’efficacité de chaque framework en termes de jetons.

Agent IAMai 25

Recherche d'agents en  : 8 API de recherche de référence pour les agents

La recherche agentique joue un rôle crucial pour combler le fossé entre les moteurs de recherche traditionnels et les capacités de recherche de l'IA. Ces systèmes permettent aux agents d'IA de trouver, d'extraire et de structurer de manière autonome les informations pertinentes, alimentant ainsi des applications allant de l'aide à la recherche à la surveillance en temps réel et au raisonnement multi-étapes. Les API de recherche constituent la première couche d'un outil de recherche agentique, où les performances sont directement impactées.