Berk Kalelioğlu

KI-Forscher

9 Artikel

Bleiben Sie über B2B-Technologie auf dem Laufenden

Berk ist KI-Forscher bei AIMultiple. Er verfügt über Erfahrung in der Spieleentwicklung und der Entwicklung von Pseudozufallszahlengeneratoren mit chaotischen Systemen.

Forschungsinteressen

Berk konzentriert sich auf maschinelles Lernen, agentenbasierte KI-Tools sowie große und kleine Sprachmodelle (LLMs und SLMs).

Er ist Teil des Benchmark-Teams von AIMultiple, das Bewertungen durchführt und Erkenntnisse liefert, um Lesern zu helfen, neue Technologien und ihre realen Anwendungen zu verstehen.

Berufserfahrung

Er begann seine Karriere als Tech Project Lead bei ODTU IVME-R, wo er ein Projekt zum Bau physischer Quanten- und Pseudozufallszahlengeneratoren leitete.

Nach seiner Zeit bei IVME-R war er Mitbegründer einer Spieleentwicklungsfirma und veröffentlichte ein Spiel auf Steam.

Später verlagerte er seinen Karrierefokus auf KI und kam als Forscher zu AIMultiple.

Ausbildung

Berk hat einen Bachelor-Abschluss in Mathematik von der Universität Ankara.

Neueste Artikel von Berk

Open-World-Bewertung

23. Jul

Beste Pauschalpreis-LLM API Anbieter

Pauschalpreis-LLM-Anbieter verkaufen unbegrenzte Modellnutzung zu einem festen Monatspreis statt pro Token abzurechnen. Dieses Modell verbreitete sich, weil agentische Kodierungssitzungen zig Millionen Token verbrauchen können, sodass eine tokenbasierte Rechnung schwer vorhersehbar ist. Nur sehr wenige Anbieter bieten eine echte Pauschalgebühr; die meisten als Pauschal vermarkteten Pläne enthalten eine Nutzungsquote. Im Folgenden vergleichen wir die Anbieter, die…

Agentische KI

Benchmark

23. Jul

A-CODE-LLM Bench: Agentischer Coding-Benchmark

Wir haben die führenden Large Language Models (LLMs) über 10 Softwareentwicklungsaufgaben hinweg mit einem agentischen CLI-Tool benchmarkt. Wir führten pro Modell ~3.500 automatisierte Validierungsschritte in sowohl der API- als auch der UI-Ebene durch. Jeder Alias wurde 3 Mal über 10 Aufgaben hinweg ausgeführt (30 Proben pro Alias, 400 Zellen pro Iteration über 40 Aliase). Weitere…

Agentische KI

Benchmark

21. Jul

AIM Agentic-Marketing-Benchmark

Wir stellen den AIM Agentic-Marketing-Benchmark vor, der die Leistung von Agenten bei der Wettbewerbslückenanalyse und der Vorbereitung von ABM-Ziellisten misst. Wir haben die Leistung von 11 Modellen getestet und die End-to-End-Ausführungsleistung gemessen: Die Aufgabenergebnisse sind auf einer Skala von 0–100 normalisiert. Die Gesamtpunktzahl ist der arithmetische Mittelwert der beiden Aufgabenwerte, wobei jede Aufgabe trotz unterschiedlicher…

Agentische KI

Benchmark

21. Jul

KI VC Benchmark: 11 KI-Agenten bei echten Venture-Capital-Aufgaben

In Zusammenarbeit mit Frühphasen-VCs haben wir zwei Analysten-Workflows in Benchmarks mit menschlich verifizierter Ground Truth umgewandelt und 11 KI-Agenten daran gemessen. Hier sind die Aufgaben, Ergebnisse und die Bewertungsmethode: Jedes der 11 Modelle führte jede Aufgabe einmal aus. Die Punktzahlen gehen bis 100. Kimi K3 lieferte keinen bewertbaren Deal-Sourcing-Durchlauf und wird mit 0 geführt. Beide…

Agentische KI16. Jul

Moltbook: Agentengesteuerte soziale Medien

Das schnelle Wachstum von OpenClaw hat ein ungewöhnliches soziales Experiment ausgelöst: Moltbook, eine Reddit-ähnliche soziale Plattform, auf der Agenten miteinander interagieren. Gestartet am 28th Januar 2026 und begann innerhalb kurzer Zeit Aufmerksamkeit zu erregen. Es erreichte 1.5m+ Agenten in seiner ersten Woche. Für weitere Plattformen für KI-Agenten lesen Sie Im Inneren des OpenClaw-Ökosystems: 8 KI-Agenten-gesteuerte…

Agentische KI16. Jul

OpenClaw (Moltbot/Clawdbot) Anwendungsfälle und Sicherheit

OpenClaw (ehemals Moltbot und Clawdbot) ist ein quelloffener, selbst gehosteter KI-Assistent, der für die Ausführung lokaler Rechenaufgaben und die Interaktion mit Benutzern über Standard-Messaging-Plattformen entwickelt wurde. Anders als herkömmliche Chatbots, die als Berater fungieren und Text generieren, arbeitet OpenClaw als autonomer Agent, der Shell-Befehle ausführen, Dateien verwalten und Browser-Operationen auf der Host-Maschine automatisieren kann. Anfang…

Agentische KI

Benchmark

6. Jul

A-CODE-CLI Bench: Agentic CLI Benchmark

Agentic CLI-Tools sind KI-Coding-Tools, die Dateien erstellen und löschen, Befehle ausführen, planen und die Codierung des gesamten Projekts durchführen können. Wir haben die führenden Tools in 10 realen Webentwicklungsszenarien einem Benchmark unterzogen, wobei wir ~600 atomare Validierungsprüfungen pro Agent und insgesamt mehr als ~5.000 automatisierte Testausführungen durchgeführt haben – einschließlich Backend-Logik, Frontend-Funktionalität und Konsistenzprüfungen über…

Benchmark

3. Jul

Benchmark für tabellarische Modelle: Leistung über 19 Datensätze

Wir haben 8 tabellarische Lernmodelle auf 19 realen Datensätzen mit rund 260.000 Stichproben verglichen, mit Datensatzgrößen von 435 bis 48.800 Zeilen. Jedes Modell lief auf derselben Maschine mit 5-facher Kreuzvalidierung und identischen Aufteilungen. Jeder Datensatz ist ein Round-Robin von direkten Vergleichen zwischen Modellen, entschieden durch die primäre Metrik. Elo fasst alle 483 Vergleiche zu einer…

Unternehmenssoftware

Benchmark

14. Mai

VPS-Benchmark: Hetzner vs Digital Ocean

Wir haben 6 Anbieter virtueller privater Server (VPS) getestet, indem wir pro Server etwa 1.200 automatisierte Tests für CPU, Speicher, Datenträger-I/O und Netzwerkgeschwindigkeit mit sysbench, fio und speedtest-cli durchführten. Außerdem dokumentierten wir die gesamte Erfahrung vom Anmelden bis zum SSH-Zugriff für jeden Anbieter. Wir verwendeten 4 vCPU (Shared) / 8 GB Pläne jedes Anbieters, ohne…

Bleiben Sie voraus mit

AIMultiple Newsletter

1 kostenlose E-Mail pro Woche mit den neuesten B2B-Technachrichten und Experten Einblicken.