Berk Kalelioğlu
Araştırma ilgi alanları
Berk, makine öğrenimi, ajan tabanlı yapay zeka araçları ve büyük ve küçük dil modelleri (LLM'ler ve SLM'ler) üzerine odaklanmaktadır. AIMultiple kıyaslama ekibinin bir parçası olarak, okuyucuların yeni teknolojileri ve bunların gerçek dünya uygulamalarını anlamalarına yardımcı olmak için değerlendirmeler yapmakta ve bilgiler sunmaktadır.Profesyonel deneyim
Kariyerine ODTU IVME-R'de Teknoloji Proje Lideri olarak başladı ve burada fiziksel kuantum ve sözde rastgele sayı üreteçleri geliştirmeye yönelik bir projeye liderlik etti. IVME-R'deki görev süresinin ardından bir oyun geliştirme şirketinin kurucu ortağı oldu ve Steam'de bir oyun yayınladı. Daha sonra kariyerini yapay zekaya yönlendirdi ve AIMultiple'a Araştırmacı olarak katıldı.Eğitim
Berk, Ankara Üniversitesi Matematik bölümü mezunudur.Berk Tarafından Son Makaleler
Geniş Bağlam Penceresi İçin En İyi LLM'lar
We ran a proprietary 32-message conversation test on 22 leading AI models to see how much of their advertised context windows actually work. The conversation includes synthesis tasks that require recalling information from earlier messages, not just parroting the last thing said.
Yapay Zeka Belleği: En İyi Belleğe Sahip En Popüler Yapay Zeka Modelleri
Smarter models often have worse memory. We tested 26 large language models in a 32-message business conversation to determine which actually retain information. AI memory benchmark results We tested 26 popular large language models through a simulated 32-message business conversation with 43 questions.
Yapay Zeka Halüsinasyonu: En iyi LLM'ları GPT-5.2 gibi karşılaştırın
AI models can generate answers that seem plausible but are incorrect or misleading, known as AI hallucinations. 77% of businesses concerned about AI hallucinations.
Agentic CLI Araçları: Codex vs Claude Code
Agentic CLI tools are AI coding tools that can create and delete files, run commands, plan, and execute the coding of the entire project.
Tablo Modeller Benchmarki: 19 Veri Setinde Performans
We benchmarked 7 widely used tabular learning models across 19 real-world datasets, covering ~260,000 samples and over 250 total features, with dataset sizes ranging from 435 to nearly 49,000 rows. Our goal was to understand top-performing model families for datasets of different sizes and structure (e.g. numeric vs.
Agentic LLM Benchmark: Önde Gelen Modeller Karşılaştırıldı
We benchmarked the top LLMs across 10 software development tasks by using an agentic CLI tool. We executed ~3,500 automated validation steps per model across both API and UI layers. Agentic LLM benchmark results Success rate comparison Each alias ran 3 times across 10 tasks (30 samples per alias, 230 cells per iteration).
VPS Karşılaştırması: Hetzner vs Digital Ocean
Sysbench, fio ve speedtest-cli kullanarak CPU, bellek, disk G/Ç ve ağ hızı açısından sunucu başına yaklaşık 1200 otomatik test çalıştırarak 6 Sanal Özel Sunucu (VPS) sağlayıcısını karşılaştırdık. Ayrıca her sağlayıcı için kayıttan SSH'ye kadar olan tüm deneyimi belgeledik.
RL Ortamları: Ajanlı Yapay Zekanın Altyapısı
Reinforcement learning environments are controlled environments where AI agents take actions, observe outcomes, and receive feedback. They are becoming more useful as models move from one-shot answers to multi-step work in coding, browser tasks, customer support, and business software. RL environment companies Some companies sell custom environments for coding, finance, enterprise workflows, or computer-use tasks.
OpenClaw (Moltbot/Clawdbot) Kullanım Alanları ve Güvenlik
OpenClaw (formerly Moltbot and Clawdbot) is an open-source, self-hosted AI assistant designed to execute local computing tasks and interface with users through standard messaging platforms. Unlike traditional chatbots that function as advisors generating text, OpenClaw operates as an autonomous agent that can execute shell commands, manage files, and automate browser operations on the host machine.
Moltbook: Temsilci Odaklı Sosyal Medya [2026]
OpenClaw'ın hızlı büyümesi, alışılmadık bir sosyal deneyi tetikledi: Ajanların birbirleriyle etkileşim kurduğu Reddit benzeri bir sosyal platform olan Moltbook. 28 Ocak 2026'da piyasaya sürülen platform, kısa sürede dikkat çekmeye başladı ve ilk haftasında 1,5 milyondan fazla ajana ulaştı. Yapay zeka ajanları için diğer platformlar hakkında daha fazla bilgi için Inside 'ı okuyun.
AIMultiple Bülteni
Haftada 1 ücretsiz e-posta ile en son B2B teknoloji haberleri ve uzman içgörüler ile işletmenizi hızlandırın.