Berk Kalelioğlu
Forschungsschwerpunkte
Berk konzentriert sich auf maschinelles Lernen, agentenbasierte KI-Tools sowie große und kleine Sprachmodelle (LLMs und SLMs). Er ist Mitglied des AIMultiple-Benchmark-Teams, wo er Bewertungen durchführt und Erkenntnisse liefert, um Lesern das Verständnis neuer Technologien und ihrer praktischen Anwendungen zu erleichtern.Berufserfahrung
Er begann seine Karriere als technischer Projektleiter am ODTU IVME-R, wo er ein Projekt zur Entwicklung physikalischer Quanten- und Pseudozufallszahlengeneratoren leitete. Nach seiner Zeit am IVME-R war er Mitbegründer eines Spieleentwicklungsunternehmens und veröffentlichte ein Spiel auf Steam. Später verlagerte er seinen Schwerpunkt auf KI und trat AIMultiple als Forscher bei.Ausbildung
Berk besitzt einen Bachelor-Abschluss in Mathematik von der Universität Ankara.Neueste Artikel von Berk
Agente-CLI-Tools: Codex vs Claude Code
Agentic CLI tools are AI coding tools that can create and delete files, run commands, plan, and execute the coding of the entire project.
Tabular-Modelle Benchmark: Leistung über 19 Datensätze
We benchmarked 7 widely used tabular learning models across 19 real-world datasets, covering ~260,000 samples and over 250 total features, with dataset sizes ranging from 435 to nearly 49,000 rows. Our goal was to understand top-performing model families for datasets of different sizes and structure (e.g. numeric vs.
Agentic LLM Benchmark: Führende Modelle im Vergleich
We benchmarked the top LLMs across 10 software development tasks by using an agentic CLI tool. We executed ~3,500 automated validation steps per model across both API and UI layers. Agentic LLM benchmark results Success rate comparison Each alias ran 3 times across 10 tasks (30 samples per alias, 230 cells per iteration).
VPS-Benchmark: Hetzner vs Digital Ocean
We benchmarked 6 Virtual Private Server (VPS) providers by running ~1,200 automated tests per server across CPU, memory, disk I/O, and network speed using sysbench, fio, and speedtest-cli. We also documented the full signup-to-SSH experience for each provider.
RL-Umgebungen: Die Infrastruktur hinter agenter KI
Reinforcement learning environments are controlled environments where AI agents take actions, observe outcomes, and receive feedback. They are becoming more useful as models move from one-shot answers to multi-step work in coding, browser tasks, customer support, and business software. RL environment companies Some companies sell custom environments for coding, finance, enterprise workflows, or computer-use tasks.
OpenClaw (Moltbot/Clawdbot) Anwendungsfälle und Sicherheit
OpenClaw (formerly Moltbot and Clawdbot) is an open-source, self-hosted AI assistant designed to execute local computing tasks and interface with users through standard messaging platforms. Unlike traditional chatbots that function as advisors generating text, OpenClaw operates as an autonomous agent that can execute shell commands, manage files, and automate browser operations on the host machine.
Moltbook: Von Agenten betriebene soziale Medien
The rapid growth of OpenClaw has triggered an unusual social experiment: Moltbook, a Reddit-like social platform where agents interact with each other. Launched on the 28th of January, 2026, and started to get attention in a short time span. It reached 1.5m+ agents in its first week.
AIMultiple Newsletter
1 kostenlose E-Mail pro Woche mit den neuesten B2B-Technachrichten und Experten Einblicken.