Serviços
Contate-nos
Ekrem Sarı

Ekrem Sarı

Pesquisador de IA
31 Artigos
Mantenha-se atualizado sobre tecnologia B2B.

Ekrem é pesquisador de IA na AIMultiple, com foco em automação inteligente, GPUs, agentes de IA e LLMOps para frameworks RAG.

Experiência profissional

Durante sua atuação como Avaliador na Yandex, ele avaliou resultados de busca utilizando frameworks proprietários e protocolos automatizados. Implementou testes de controle de qualidade por meio de anotação de dados, pontuação de relevância e mapeamento da intenção do usuário em mais de 10.000 consultas mensais, além de conduzir avaliações técnicas, incluindo monitoramento de desempenho e detecção de spam utilizando ciclos de feedback de aprendizado de máquina.

Interesse de pesquisa

Na AIMultiple, sua pesquisa se concentra no ciclo de vida de MLOps e no desempenho e benchmarking de sistemas de IA de ponta a ponta. Ele contribui para uma ampla gama de projetos, incluindo otimização de Geração Aumentada por Recuperação (RAG), benchmarking extensivo de Modelos de Linguagem Amplos (LLM) e o design de frameworks de IA para agentes. Ekrem se especializa no desenvolvimento de metodologias orientadas a dados para medir e aprimorar o desempenho da tecnologia de IA em métricas operacionais críticas, como precisão, eficiência, custo de API e escalabilidade. Sua análise abrange toda a pilha de tecnologia, desde componentes fundamentais, como modelos de incorporação e bancos de dados vetoriais, até a infraestrutura de nuvem e GPU de alto desempenho necessária para a implantação de agentes de IA.

Educação

Ekrem é bacharel pela Hacettepe Üniversitesi e mestre pela Başkent Üniversitesi.

Últimos artigos de Ekrem

Software EmpresarialJun 13

Email Archiving Software Benchmark

We provisioned a Microsoft 365 tenant, populated it with a 10,000-mail synthetic corpus and 1,700 attachments across 8 file-type subtypes, then benchmarked NinjaOne SaaS Archiver, Barracuda Cloud Archiving Service, Acronis Cyber Protect Cloud Email Archiving, and MailPiler on the same tenant against 10 dimensions covering ingestion, search, attachment recall, export, immutability, legal hold, audit, encryption,

IAJun 11

Texto para SQL: Comparação da precisão do LLM

Utilizo SQL para análise de dados há 18 anos, desde a minha época como consultor. Traduzir perguntas em linguagem natural para SQL torna os dados mais acessíveis, permitindo que qualquer pessoa, mesmo sem conhecimentos técnicos, trabalhe diretamente com bancos de dados.

IAJun 10

Mais de 20 frameworks RAG agenic

O RAG agente aprimora o RAG tradicional, aumentando o desempenho do LLM e permitindo maior especialização. Realizamos um teste comparativo para avaliar seu desempenho no roteamento entre múltiplos bancos de dados e na geração de consultas. Explore frameworks e bibliotecas de RAG agente, as principais diferenças em relação ao RAG padrão, os benefícios e os desafios para desbloquear todo o seu potencial.

IAJun 10

Análise comparativa de 38 mestrados em Direito (LLM) em Finanças: Claude Opus 4.6, Gemini 3.1 Pro e outros.

Avaliamos 38 LLMs em finanças com base em 238 questões complexas do benchmark FinanceReasoning para identificar quais modelos se destacam em tarefas complexas de raciocínio financeiro, como análise de demonstrações financeiras, projeções e cálculos de índices. Visão geral do benchmark de finanças para LLMs: Avaliamos os LLMs com base em 238 questões complexas do benchmark FinanceReasoning (Tang et al.).

Segurança cibernéticaJun 10

Análise de DLP: Testes comparativos de 6 produtos de DLP

Aproveitando minhas duas décadas de experiência como profissional de cibersegurança, selecionei o melhor software DLP para proteger informações confidenciais e atender aos padrões regulatórios. Testei 6 soluções DLP ao longo de um mês, com foco em recursos essenciais como cobertura de canais, facilidade de implantação e precisão de classificação.

IAJun 3

Análise comparativa das ferramentas de observabilidade RAG

Comparamos quatro plataformas de observabilidade RAG em um pipeline LangGraph de 7 nós em três dimensões práticas: sobrecarga de latência, esforço de integração e compensações entre plataformas. Métricas de sobrecarga de latência Explicação das métricas: A média é a latência média em 150 chamadas graph.invoke() medidas. As avaliações do LLM-judge são executadas após a parada do temporizador. A mediana é o 50º percentil da latência.

IAJun 3

Frameworks RAG: LangChain vs LangGraph vs LlamaIndex

Avaliamos o desempenho de 5 frameworks RAG: LangChain, LangGraph, LlamaIndex, Haystack e DSPy, construindo o mesmo fluxo de trabalho RAG agentivo com componentes padronizados: modelos idênticos (GPT-4.1-mini), embeddings (BGE-small), retriever (Qdrant) e ferramentas (busca na web Tavily). Isso isola a sobrecarga real e a eficiência de tokens de cada framework. Resultados da avaliação comparativa dos frameworks RAG.

Agente de IAMai 25

Busca Agenética em: Análise Comparativa de 8 APIs de Busca para Agentes

A busca por agentes desempenha um papel crucial na redução da lacuna entre os mecanismos de busca tradicionais e as capacidades de busca da IA. Esses sistemas permitem que agentes de IA encontrem, recuperem e estruturem informações relevantes de forma autônoma, impulsionando aplicações que vão desde o auxílio à pesquisa até o monitoramento em tempo real e o raciocínio em múltiplas etapas.

Segurança cibernéticaMai 22

Backup software benchmark: Acronis vs NinjaOne vs Comet vs MSP360

We benchmarked Acronis Cyber Protect Cloud Backup, Comet Backup, MSP360 Managed Backup, and NinjaOne Backup on identical AWS infrastructure. Each vendor ran a file-mode backup of the same 625,946-file / 50 GB workload and a full image backup of the system disk, then restored the 15 GB medium subdirectory.

IAMai 20

Índice de preços de aluguel de GPUs na nuvem

As taxas sob demanda para as GPUs de nuvem de última geração (B200, B300, MI300X, RTX 5090) praticamente dobraram no último ano, enquanto as placas convencionais (H100, H200, A100) mantiveram-se estáveis. Compilamos o índice de GPUs mensalmente a partir de 58 provedores e 17 modelos de GPU, abrangendo níveis sob demanda, spot e com reserva anual. Tendências de preço por geração de GPU.