İçgörü

Bu Araştırmayı Kaynak Göster

Büyük Eylem Modelleri: Abartı mı Gerçek mi?

Güncellenme tarihi: 1 Tem 2026

Bakınız etik normlar

Bu Araştırmayı Kaynak Göster

Mobil uygulamaları kullanabilen bir yapay zeka cihazı olan Rabbit'in piyasaya sürülmesinin ardından, büyük eylem modelleri (LAM'lar) terimi popülerlik kazanmaktadır. Bu modeller, LLM'leri, kullanıcıların uygulamalara tıklamasını veya API'leri entegre etmesini gerektirmeden, silolanmış, uygulama odaklı dünyayı birbirine bağlayabilen "ajanlara" dönüştürerek konuşmanın ötesine geçer.

LAM'ların abartı ve gerçeklik arasındaki çizgisi bulanıktır, ancak kısaca LAM, özellikle eylem gerçekleştirmek (ör. API istekleri göndermek) üzere eğitilmiş bir büyük dil modelidir (LLM).¹

Büyük eylem modeli (LAM) nedir?

Büyük Eylem Modeli (LAM), Büyük Dil Modelleri (LLM'ler) üzerine inşa edilen, yalnızca metni anlayıp üretmekle kalmayıp aynı zamanda gerçek dünya (dijital veya fiziksel) ortamlarında eylemleri planlayıp yürüten, kullanıcı niyetine dayalı olarak görevleri otomatikleştirmesini ve sistemlerle doğrudan etkileşime girmesini sağlayan gelişmiş bir yapay zeka türüdür.

Büyük Eylem Modellerinin (LAM'lar) temel özellikleri arasında, farklı girdilerden (metin, ses, görüntü) kullanıcı niyetini anlama, bu niyeti yürütülebilir eylemlere dönüştürme, değişen ortamlarda görevleri adım adım planlayıp uyarlama ve belirli alanlarda uzmanlaşma yoluyla verimli çalışma yetenekleri bulunur; bu da onların karmaşık gerçek dünya görevlerini otonom olarak tamamlamalarını sağlar.

Büyük Eylem Modellerinin (LAM'lar) temel özellikleri şunlardır:

Kullanıcı niyetini yorumlama: Talimat belirsiz veya örtük olsa bile, metin, ses, görüntü veya videolardan kullanıcı isteklerini anlayabilirler.
Eylem üretme: Kullanıcı hedeflerini, GUI kullanma, API'leri çağırma, robotları kontrol etme veya kod üretme gibi dijital veya fiziksel ortamlarda somut eylemlere dönüştürürler.
Dinamik planlama ve uyarlama: Karmaşık görevleri daha küçük adımlara bölebilir, bir planı takip edebilir ve durum değiştiğinde veya hatalar oluştuğunda planı ayarlayabilirler.
Uzmanlaşma ve verimlilik: Genellikle belirli görevler veya ortamlar içinşa edilirler, bu da onları o alanda genel amaçlı modellerden daha doğru ve verimli kılar.

Kısacası, LAM'lar dili anlamaktan fazlasını yapar. Anlayışı eylemle birleştirir ve gerçek dünya ortamlarında çok adımlı görevleri yerine getirebilirler.

Büyük eylem modelleri (LAM) nasıl çalışır?

LAM'lar uygulamalarla kullanıcı arayüzleri aracılığıyla veya daha yaygın olarak API'ler aracılığıyla etkileşime girer. Örneğin, sonraki adımlarına karar vermek ve eylemleri gerçekleştirmek için bir web sitesinin veya uygulamanın görüntülerini ve kodunu işleyebilirler.

Kaynak: Salesforce²

Bu, LAM'ların kullanıcı ve uygulama arayüzlerinde gezinmesini sağlar. Örneğin, bilgi başka bir uygulamada mevcutsa veya erişilebilirse, kullanıcıya sormak yerine o uygulamadan alır.

LAM'lar bünyesinde, bu düzeydeki otonomi ve kavrayış, üretken yapay zekayı aşağıdaki gibi görevleri yerine getirebilen aktif bir asistana dönüştürür:

sosyal medya platformlarını yönetmek
hava durumu bilgisi almak
rezervasyon yapmak
finansal işlemleri gerçekleştirmek
IoT cihazlarına bağlanarak onlara komut göndermenizi sağlamak (ör. Uber çağırmak)

LAM'lar ve LLM'ler: Farkı anlamak

Kaynak: Large Action Models: From Inception to Implementation³

Büyük Eylem Modelleri (LAM'lar), Büyük Dil Modellerini (LLM'leri), kullanıcı isteklerini hem anlayarak hem de web sitelerinde görevleri tamamlama gibi gerçek dünya eylemlerini planlayıp yürüterek genişletir; bu da onları gerçek dünya uygulamaları için daha verimli, görev odaklı ve pratik hale getirir, genellikle daha küçük ve daha özel tasarımlarla.

LAM'lar ve büyük dil modelleri, insan niyetlerini kavrama yetenekleri gibi bazı benzerlikler paylaşsalar da, temel amaçları büyük ölçüde farklılık gösterir.

LAM'lar eylem gerçekleştirmek için tasarlanmışken, LLM'ler dili işleme ve üretmede üstündür. Bir LLM girdinize dayalı olarak fikirler önerebilir veya metin üretebilirken, bir LAM randevu alma, ürün sipariş etme veya form doldurma gibi görevleri otonom olarak yerine getirerek bir adım öteye geçer.

Ekibimiz, iş süreçlerinizden birini yapay zeka ajanlarıyla ücretsiz olarak otomatikleştirsin.

Bir süreci otomatikleştir

Büyük ajansal modeller (LAM) abartı mı gerçek mi?

Bazı şirketler LAM'ları yeni bir mimari olarak tanıtsa da, onlara atfedilen işlevler bir süredir LLM ajanları kullanılarak uygulanmaktadır.⁴

Ayrıca, LLM ajanları daha önce LAM'ların yaptığı tarif edilen görevleri yerine getirmektedir. İki kavram ortak işlevleri paylaşır (şekle bakınız):

Bağlam temelli analiz
İstem mühendisliği
Araçlardan yararlanma
Akıl yürütme⁵

Şekil: Dil temelli yapay zeka ajanı iş akışı

Kaynak: ICLR⁶

Ayrıca, LAM'lar; (1) prompt'lar şablonu temelli yapay zeka ajanları; (2) öğrenilebilir prompt'lar yapay zeka ajanları; ve (3) büyük eylem modelleri (LAM'lar) gibi dil temelli ajan tasarımları olarak tanımlanabilir ve bir LAM'ı, verilerden insan eylemlerini yürütmek üzere özel olarak eğitilmiş bir LLM olarak düşünebileceğimiz belirtilmektedir.⁷

Yapay zeka modelleri hakkında daha fazla bilgi için veri odaklı araştırmalarımıza bakın:

Gerçek hayattan LAM örnekleri

1. Web sitelerindeki formları veya elektronik tabloları otomatik olarak doldurma

Bir LAM, bir formdaki gerekli alanları tanıyabilir, gerekli verileri (ör. adresler, isimler, parolalar ve kredi kartı numaraları) bir veritabanından veya kullanıcı profilinden toplayabilir ve uygun alanlara girebilir.

Video: LAM ile formları veya elektronik tabloları otomatik olarak doldurma

2. Çevrimiçi işlemleri tamamlama

Bir LAM; butonlar, bağlantılar ve açılır menülerle çalışabilir. Ayrıca metin alanlarına ve arama çubuklarına belirli metinler ekleyebilir. Bu tam olarak çevrimiçi pizza sipariş etmenin gerektirdiği şeydir: metin formlarını doldurmak, butonlara tıklamak ve menü seçimlerini yapmak.

Video: HyperWriteAI Assistant Studio'nun çevrimiçi sipariş vermek için tarayıcıyı kullanması

Kaynak: HyperWriteAI⁹

3. Müşteri hizmetleri taleplerini uçtan uca çözme

Bir Büyük Eylem Modeli (LAM), kullanıcının hedefini anlayarak, gerekli adımlara karar vererek ve bunları birden fazla sistemde (CRM, faturalandırma ve destek platformları gibi) yürüterek, tam bir müşteri talebini baştan sona ele alabilir.

Genesys Cloud Agentic Virtual Agent bu kullanım alanının bir örneğidir: bir müşterinin sorununu (ör. bir faturalandırma sorunu) anlayabilir, ne yapılması gerektiğini belirleyebilir ve insan müdahalesi olmadan hesap verilerini kontrol etme, kayıtları güncelleme veya hizmet süreçlerini tetikleme gibi gerekli eylemleri tamamlayabilir.¹⁰

Yanıtlar sağlamak yerine, sistem farklı araçlar ve iş akışlarıyla etkileşime girerek görevi kendisi tamamlar, tekrarlanan açıklamalara veya manuel takiplere olan ihtiyacı azaltır.

4. Otonom sürüş ve karar verme

Bir Büyük Eylem Modeli (LAM), gerçek dünya girdilerini yorumlayarak, durumlar hakkında akıl yürüterek ve gerçek zamanlı olarak eylemleri yürüterek otonom sistemlere güç verebilir.

NVIDIA'nın Alpamayo'su, kamera videosunu işlemek, sürüş ortamını anlamak, neler olduğuna dair akıl yürütmek ve direksiyon, fren veya gaz gibi sürüş eylemleri üretmek için Vizyon-Dil-Eylem modellerini kullanır.¹¹

Sabit kuralları takip etmek yerine, sistem bağlama (ör. trafik, engeller, yol koşulları) dayalı olarak ne yapacağına karar verir ve akıl yürütmesini açıklar; bu da daha güvenli ve daha şeffaf otonom sürüş sağlar.

5. Günlük uygulamalar arasında kişisel görev yürütme

Bir Büyük Eylem Modeli (LAM), kullanıcının hedefini birden fazla araçta somut eylemlere dönüştürebilir ve adım adım talimatlar olmadan görevleri tamamlayabilir. Örneğin, OpenClaw gibi ajansal yapay zeka sistemleri benzer ilkeleri kullanır: adımları planlayarak ve otonom olarak yürüterek e-postaları, takvimleri ve seyahat rezervasyonlarını yönetebilirler. OpenClaw tam bir ajansal yapay zeka sistemini temsil ederken, LAM'lar bu tür sistemlerin çok adımlı iş akışlarını güvenilir bir şekilde yürütmesini sağlayan eylem alma çekirdeğini sağlar.

Google Arama'da daha fazla kıyaslamamızı ve veri odaklı içgörülerimizi görün.

Tercih edilen kaynak olarak ekle

LAM'lardaki teknolojiler

Bir LAM aşağıdaki teknikleri kullanabilir:

Bağlantılar: Birden fazla uygulamaya ve API'ye bağlanır.
Nöro-sembolik yaklaşım: Nöro-sembolik programlama, LAM'ların büyük veri kümeleri üzerinde eğitilmiş sinir ağlarını yerleşik sembolik mantıksal akıl yürütme yetenekleriyle birleştirmesini sağlayan bir yöntemdir. Bu, kalıpları fark ederken aynı zamanda altta yatan mantığı kavramalarını sağlayarak onları daha uyarlanabilir ve kullanıcı isteklerinin "nedenine" dayalı anlamlı yanıtlar verebilir hale getirir.
Talimat soyutlaması: Bir arayüz aracılığıyla modelleme için modüler ve hiyerarşik soyutlama sağlayan talimatlar oluşturur.
Doğrudan insan modellemesi: Eylem için bir şablon geliştirmek üzere uygulamalar arasında kullanıcı niyetini, alışkanlıklarını ve rutinlerini belirler.
Görev akıl yürütme: Görevler arasındaki ilişkileri analiz eder, bağımlılıkları belirler ve en uygun yürütme sırasını tespit eder. Bağımlı görevler başlamadan önce ön koşul görevlerin tamamlanmasını sağlar. Bu, LAM'ın geçmiş etkileşimlere dayalı olarak iş akışlarını iyileştirmesini sağlar.
Sürekli öğrenme: LAM'lar hem görevleri yürütür hem de sürekli öğrenme yoluyla performanslarını geliştirir. Örneğin, LAM siparişler, iadeler ve ürün bilgileri hakkında müşteri sorularını yönetebilir. Sorunları hızla çözmede daha usta hale gelir, hatta müşteriler ulaşmadan önce potansiyel sorunları tahmin edip ele alır.

Büyük eylem modeli örnekleri

LAM terimi, tüketici ürünleri, eylem odaklı modeller ve kullanıcı niyetini yazılım eylemlerine dönüştürmeye çalışan araştırma sistemlerinin bir karışımını kapsar.

Rabbit R1: Rabbit, R1'i LAM fikri etrafında pazarlar ve resmi materyalleri artık kullanıcıları web sitesi görevleri için LAM Playground ve öğretme modu gibi özelliklere yönlendirir. Aynı zamanda, erken incelemeler oldukça eleştireldi; The Verge cihazı "tamamlanmamış" ve "yararsız" olarak nitelendirdi ve lansmanda üründe güvenilir şekilde çalışan bir LAM olduğuna dair çok az kanıt olduğunu söyledi.
Adept ACT-1: Adept, ACT-1'i yazılım araçlarını, API'leri ve web uygulamalarını kullanmak üzere eğitilmiş bir "eylemler için temel model" olarak tanımladı. Kendi başına tamamen ayrı bir yapay zeka kategorisinden ziyade, gelişmiş bir eylem odaklı ajan sistemi olarak anlaşılması en doğrusudur.
Salesforce xLAM: Salesforce, xLAM'i fonksiyon çağırma ve yapay zeka ajanları için optimize edilmiş bir model ailesi olarak yayınladı ve daha sonra daha güçlü çok turlu destekle genişletti. Bu, xLAM'i LAM tarzı bir model ailesinin en net resmi örneklerinden biri yapar.
Microsoft TaskMatrix.AI: TaskMatrix.AI, görevleri tamamlamak için temel modelleri milyonlarca API ile birleştirmeyi öneren bir Microsoft Research vizyon makalesidir. Bir araştırma vizyonu ve pozisyon makalesi olarak çerçevelendiği için, dağıtılabilir bir üründen ziyade akademik bir LAM benzeri çerçeve olarak tanımlanması daha doğrudur.

Bu araştırmayı kaynak gösterin

Yayınlayacağınız yere uygun formatı seçin. Bağlantılı sürümü CMS'inize yapıştırmak, geri bağlantıyı korur.

Cem Dilmegani (2026) - "Büyük Eylem Modelleri: Abartı mı Gerçek mi?". AIMultiple.com adresinde çevrimiçi yayımlanmıştır. Erişim tarihi: 1 Temmuz 2026, kaynak: https://aimultiple.com/large-action-models [Çevrimiçi Kaynak]

Dilmegani, C. (2026, 1 Temmuz). Büyük Eylem Modelleri: Abartı mı Gerçek mi?. AIMultiple. https://aimultiple.com/large-action-models

@misc{dilmegani2026,
  author = {Dilmegani, Cem},
  title  = {{Büyük Eylem Modelleri: Abartı mı Gerçek mi?}},
  year   = {2026},
  month  = jul,
  howpublished    = {\url{https://aimultiple.com/large-action-models}},
  note   = {AIMultiple. Erişim tarihi: 1 Temmuz 2026}
}

Referans Linkleri

SuperAGI/SAM · Hugging Face

Salesforce/xLAM-1b-fc-r · Hugging Face

[2412.10047] Large Action Models: From Inception to Implementation

Language-based AI Agents and Large Action Models (LAMs) | Juan Carlos Niebles

What Are Large Action Models (LAMs)? - How Do They Work in 2026

Trinetix | Globally Trusted Digital Partner

[2210.03629] ReAct: Synergizing Reasoning and Acting in Language Models

[2402.15506] AgentOhana: Design Unified Data and Training Pipeline for Effective Agent Learning

UiPath joins Large Action Model Race - YouTube

Matt Shumer on X: "Today, we’re unveiling Personal Assistant - @HyperWriteAI's groundbreaking AI agent that can use a web browser like a human. One agent to rule them all. It’s time to reimagine the way we interact with the internet. https://t.c

Genesys unveils industry’s first Agentic virtual agent powered by LAMs for enterprise CX – Intelligent CIO Europe

Sawyer Merritt on X: "NEWS: NVIDIA just announced Alpamayo, what CEO Jensen Huang calls the world’s first thinking, reasoning autonomous vehicle AI, launching on U.S. roads later this year, starting with the Mercedes CLA. Jensen: "It's trai

Cem Dilmegani

Baş Analist

Cem, 2017'den beri AIMultiple'da baş analist olarak görev yapmaktadır. AIMultiple, her ay Fortune 500 şirketlerinin %55'i de dahil olmak üzere yüz binlerce işletmeye (benzer Web'e göre) bilgi sağlamaktadır. Cem'in çalışmaları, Business Insider, Forbes, Washington Post gibi önde gelen küresel yayınlar, Deloitte, HPE gibi küresel firmalar, Dünya Ekonomik Forumu gibi STK'lar ve Avrupa Komisyonu gibi uluslararası kuruluşlar tarafından alıntılanmıştır. AIMultiple'ı referans gösteren daha fazla saygın şirket ve kaynağı görebilirsiniz. Kariyeri boyunca Cem, teknoloji danışmanı, teknoloji alıcısı ve teknoloji girişimcisi olarak görev yapmıştır. On yıldan fazla bir süre McKinsey & Company ve Altman Solon'da işletmelere teknoloji kararları konusunda danışmanlık yapmıştır. Ayrıca dijitalleşme üzerine bir McKinsey raporu yayınlamıştır. Bir telekom şirketinin CEO'suna bağlı olarak teknoloji stratejisi ve tedarikini yönetmiştir. Ayrıca, 2 yıl içinde sıfırdan 7 haneli yıllık yinelenen gelire ve 9 haneli değerlemeye ulaşan derin teknoloji şirketi Hypatos'un ticari büyümesini yönetmiştir. Cem'in Hypatos'taki çalışmaları TechCrunch ve Business Insider gibi önde gelen teknoloji yayınlarında yer aldı. Cem düzenli olarak uluslararası teknoloji konferanslarında konuşmacı olarak yer almaktadır. Boğaziçi Üniversitesi'nden bilgisayar mühendisliği diplomasına ve Columbia Business School'dan MBA derecesine sahiptir.

Tam Profili Görüntüle

Yorum yapan ilk kişi olun

E-posta adresiniz yayınlanmayacak. Tüm alanlar gereklidir. Yorumlar orijinal dilinde bırakılır.

Sıradaki Okunma

Yapay Zeka Ajanları

Yapay Zeka Ajan Tuzakları: 20 Gerçek Hayat Olayı

Ezgi Arslan, PhD.

Yapay Zeka Ajanları

Özellik Karşılaştırması

OpenClaw Alternatifleri: Hermes vs ZeroClaw vs PicoClaw

Yapay Zeka Ajanları

Özellik Karşılaştırması

Yerel AI Ajanları: Goose, Observer AI, AnythingLLM

Yapay Zeka Verimliliği

En İyi AI Belge Oluşturucu Araçları

Ezgi Arslan, PhD.

Ajan Tabanlı Finans

Yapay Zeka Tabanlı Hisse Senedi Alım Satımı: Hangi Üretken Yapay Zeka Aracı Daha İyi

Ezgi Arslan, PhD.

Yapay Zeka Ajanları

En İyi 30+ Ajan Yapay Zeka Şirketi

Özellik	Büyük eylem modelleri (LAM'lar)	Büyük dil modelleri (LLM'ler)
İşlevsellik	Görevleri yürütmek için eylemler gerçekleştirir	Akıl yürütür ve metin yanıtları üretir
Öğrenme yaklaşımı	İnsan etkileşimlerinden öğrenir	Bağlamı ve insan sesini kavramak için büyük veri kümeleri üzerinde eğitilir
Örnek görev: Oda rezervasyonu	LAM'lar, arayüzlerde gezinme ve otel formlarını doldurma dahil olmak üzere tüm prosedürü tek bir komutla gerçekleştirebilir	LLM'ler yönlendirmeler ve bağlantılar verebilir, ancak görevi sonuçlandıramazlar
Performans	Sınırlı kapsamdaki belirli görevler için yeterlidir	Geniş bir görev yelpazesinde yüksek performans
Uyarlanabilirlik	Yeni görevlere veya alanlara uyum sağlamak için daha fazla manuel müdahale gerektirir	Minimum yeniden eğitimle geniş bir görev yelpazesine daha kolay uyum sağlayabilir