Berk Kalelioğlu

Pesquisador de IA

10 Artigos

Mantenha-se atualizado sobre tecnologia B2B.

Berk é um pesquisador de IA na AIMultiple. Ele tem experiência anterior em desenvolvimento de jogos e no desenvolvimento de geradores de números pseudoaleatórios usando sistemas caóticos.

Interesses de pesquisa

Berk concentra-se em aprendizado de máquina, ferramentas de IA agentiva e modelos de linguagem grandes e pequenos (LLMs e SLMs).

Ele faz parte da equipe de benchmark da AIMultiple, conduzindo avaliações e fornecendo insights para ajudar os leitores a entender tecnologias emergentes e suas aplicações no mundo real.

Experiência profissional

Ele começou sua carreira como Líder de Projetos Técnicos na ODTU IVME-R, onde liderou um projeto para construir geradores físicos de números quânticos e pseudoaleatórios.

Após seu período na IVME-R, ele co-fundou uma empresa de desenvolvimento de jogos e lançou um jogo no Steam.

Mais tarde, ele redirecionou sua carreira para a IA e ingressou na AIMultiple como Pesquisador.

Educação

Berk possui um bacharelado em Matemática pela Universidade de Ankara.

Últimos artigos de Berk

IA Agêntica

Benchmark

29 Jul

Agentes de Uso de Computador: Benchmark & Arquitetura

Agentes de uso de computador prometem operar desktops reais e aplicativos web, mas seus designs, limitações e compensações muitas vezes não são claros. Examinamos sistemas líderes decompondo como funcionam, como aprendem e como suas arquiteturas diferem. Também referenciamos um benchmark focado de ancoragem de UI em 100 capturas de tela de desktop, abrangendo 4 tipos…

IA Agêntica

Benchmark

28 Jul

Benchmark AIM Agentic Marketing

Estamos apresentando o Benchmark AIM Agentic Marketing, que mede o desempenho de agentes em três fluxos de trabalho de marketing: análise de gap competitivo, preparação de lista de alvos ABM e um deck de vendas personalizado. Testamos o desempenho de 11 modelos em três tarefas reais e medimos o desempenho de execução ponta a ponta:…

Avaliação em Mundo Aberto

23 Jul

Melhores provedores de LLM API com tarifa fixa

Os provedores de LLM com tarifa fixa vendem uso ilimitado de modelos por um preço mensal fixo em vez de cobrar por token. Esse modelo se espalhou porque as sessões de codificação agentic podem usar dezenas de milhões de tokens, então uma conta por token é difícil de prever. Muito poucos provedores oferecem uma tarifa…

IA Agêntica

Benchmark

23 Jul

A-CODE-LLM Bench: Benchmark de Codificação Agentic

Comparamos os principais Large Language Models (LLMs) em 10 tarefas de desenvolvimento de software usando uma ferramenta CLI agentic. Executamos ~3,500 etapas de validação automatizadas por modelo em ambas as camadas de API e UI. Cada alias foi executado 3 vezes em 10 tarefas (30 amostras por alias, 400 células por iteração em 40 aliases).…

IA Agêntica

Benchmark

21 Jul

Benchmark de IA para VC: 11 Agentes de IA em Tarefas Reais de Capital de Risco

Em parceria com VCs em estágio inicial, convertemos dois fluxos de trabalho de analistas em benchmarks com verdade de campo verificada por humanos e avaliámos 11 agentes de IA neles. Veja as tarefas, os resultados e o método de pontuação: Cada um dos 11 modelos executou cada tarefa uma vez. As pontuações são em 100.…

IA Agêntica16 Jul

Moltbook: Mídia Social Orientada por Agentes

O rápido crescimento do OpenClaw desencadeou um experimento social incomum: Moltbook, uma plataforma social semelhante ao Reddit onde agentes interagem entre si. Lançado em 28 de janeiro de 2026, e começou a ganhar atenção em um curto período. Atingiu 1.5m+ agentes na primeira semana. Para mais plataformas para agentes de IA, leia Por dentro do…

IA Agêntica16 Jul

OpenClaw (Moltbot/Clawdbot) Casos de Uso e Segurança

OpenClaw (anteriormente Moltbot e Clawdbot) é um assistente de IA de código aberto e auto-hospedado projetado para executar tarefas de computação local e interagir com utilizadores através de plataformas de mensagens padrão. Ao contrário dos chatbots tradicionais que funcionam como conselheiros gerando texto, o OpenClaw opera como um agente autónomo que pode executar comandos shell,…

IA Agêntica

Benchmark

6 Jul

A-CODE-CLI Bench: Benchmark de CLI Agentic

Ferramentas CLI agentic são ferramentas de codificação com IA que podem criar e excluir arquivos, executar comandos, planejar e executar a codificação de todo o projeto. Comparamos as principais ferramentas em 10 cenários reais de desenvolvimento web, realizando ~600 verificações de validação atômicas por agente e mais de ~5.000 execuções de teste automatizadas no total,…

Benchmark

3 Jul

Benchmark de Modelos Tabulares: Desempenho em 19 Datasets

Comparamos 8 modelos de aprendizagem tabular em 19 datasets reais que abrangem aproximadamente 260.000 amostras, com tamanhos de dataset de 435 a 48.800 linhas. Todos os modelos foram executados na mesma máquina com validação cruzada de 5 dobras e divisões idênticas. Cada dataset é um round-robin de confrontos diretos entre modelos, decididos pela métrica principal.…

Software Empresarial

Benchmark

14 Mai

Teste de Referência VPS: Hetzner vs Digital Ocean

Testamos 6 provedores de Servidor Virtual Privado (VPS) executando ~1.200 testes automatizados por servidor em CPU, memória, I/O de disco e velocidade de rede usando sysbench, fio e speedtest-cli. Também documentamos a experiência completa de cadastro ao SSH para cada provedor. Utilizamos planos de 4 vCPU (Compartilhada) / 8 GB de cada provedor, sem adicionar…

Mantenha-se à frente da concorrência com

Boletim informativo AIMultiple

Receba um e-mail gratuito por semana com as últimas notícias de tecnologia B2B e insights de especialistas para impulsionar o seu negócio.