Bize Ulaşın
Sonuç bulunamadı.

Büyük Boy Aksiyon Figürleri: Abartı mı, Gerçek mi?

Cem Dilmegani
Cem Dilmegani
güncellendi Nis 1, 2026
Bakınız etik normlar

Mobil uygulamaları kullanabilen bir yapay zeka cihazı olan Rabbit'in piyasaya sürülmesinin ardından, büyük eylem modelleri (LAM'ler) terimi popülerlik kazanıyor. Bu modeller, büyük ölçekli modelleri ( LLM'ler ) kullanıcıların uygulamalara tıklamasına veya bir API entegre etmesine gerek kalmadan, birbirinden ayrı, uygulama odaklı dünyayı birbirine bağlayabilen "ajanlar"a dönüştürerek konuşmanın ötesine geçiyor.

LAM'lerin abartısı ile gerçekliği arasındaki çizgi bulanık olsa da kısaca özetlemek gerekirse: LAM, özellikle eylemler gerçekleştirmek (örneğin API istekleri göndermek) üzere eğitilmiş büyük bir dil modelidir (LLM). 1

Büyük aksiyon modeli (LAM) nedir?

Büyük eylem modeli, karmaşık görevleri eylemlere dönüştürerek akıl yürütme ve gerçekleştirme yeteneğine sahip bir yapay zekâdır.

Büyük aksiyon modelleri (LAM) nasıl çalışır?

LAM'ler, uygulamalarla kullanıcı arayüzleri veya daha yaygın olarak API'ler aracılığıyla etkileşim kurar. Örneğin, bir web sitesinin veya uygulamanın resimlerini ve kodunu işleyerek sonraki adımlarına karar verebilir ve eylemler gerçekleştirebilirler.

Bu, LAM'lerin kullanıcı ve uygulama arayüzlerinde gezinmesine olanak tanır. Örneğin, bilgi zaten mevcutsa veya başka bir uygulama aracılığıyla erişilebiliyorsa, kullanıcıya sormak yerine o uygulamadan bilgiyi alır.

LAM'ler içerisinde, bu tür özerklik ve kavrama düzeyleri, üretken yapay zekayı aşağıdaki gibi görevleri yerine getirebilen aktif bir asistana dönüştürür:

  • sosyal medya platformlarını yönetmek
  • hava durumu bilgisi almak
  • rezervasyon yapmak
  • finansal işlemlerin işlenmesi
  • IoT cihazlarına bağlanarak onlara komut göndermenizi sağlar (örneğin Uber çağırmak).

Kaynak: Salesforce 2

LAM'ler ve LLM'ler – Aralarındaki Farkı Anlamak

LAM'ler ve büyük dil modelleri, insan niyetlerini kavrama yetenekleri gibi bazı benzerlikler paylaşsalar da, temel amaçları büyük ölçüde farklılık gösterir.

LAM'ler eylem gerçekleştirmek üzere tasarlanmışken, LLM'ler dil işleme ve üretme konusunda üstünlük gösterir. Bir LLM, girdilerinize dayanarak fikirler önerebilir veya metin üretebilirken, bir LAM randevu almak, ürün sipariş etmek veya form doldurmak gibi görevleri otonom olarak gerçekleştirerek bir adım daha ileri gider.

Büyük ajan tabanlı modeller (LAM) abartı mı, gerçek mi?

Bazı şirketler LAM'leri yeni bir mimari olarak tanıtsa da, bunlara atanan işlevler bir süredir LLM ajanları kullanılarak uygulanmaktadır. 3

Ek olarak, LLM ajanları daha önce LAM'lerin yapması gereken görevleri yerine getirmiştir. İki kavram ortak işlevlere sahiptir (şekle bakınız):

  • Bağlam tabanlı analiz
  • Hızlı mühendislik
  • Araçlardan yararlanma
  • Akıl yürütme 4

Şekil: Dil tabanlı yapay zeka ajanı iş akışı

Kaynak: ICLR 5

Ayrıca, LAM'ler (1) komut şablonuna dayalı yapay zeka ajanları ; (2) öğrenilebilir komut yapay zeka ajanları; ve (3) büyük eylem modelleri (LAM'ler) gibi dil tabanlı ajan tasarımları olarak tanımlanabilir; bu da bir LAM'i, verilerden insan eylemlerini yürütmek üzere özel olarak eğitilmiş bir LLM olarak düşünebileceğimizi ifade eder. 6

Gerçek hayattan LAM örnekleri

1. Web sitelerindeki formların veya elektronik tabloların otomatik olarak doldurulması

Bir LAM (Lisanslı Ağ Yöneticisi), bir formdaki gerekli alanları tanıyabilir, gerekli verileri (örneğin adresler, isimler, şifreler ve kredi kartı numaraları) bir veritabanından veya kullanıcı profilinden toplayabilir ve bunları ilgili alanlara girebilir.

Video: LAM ile formların veya elektronik tabloların otomatik olarak doldurulması

7

2. Çevrimiçi işlemlerin tamamlanması

  Bir LAM (Analog Modelleme Sistemi), düğmeler, bağlantılar ve açılır menülerle çalışabilir. Ayrıca metin alanlarına ve arama çubuklarına belirli metinler ekleyebilir. Çevrimiçi pizza siparişi vermek tam olarak bunu gerektirir: metin formlarını doldurmak, düğmelere tıklamak ve menü seçimlerini yapmak.

Video: HyperWriteAI Assistant Studio'nun tarayıcıyı kullanarak çevrimiçi sipariş verme işlemi.

Kaynak: HyperWriteAI 8

LAM'lardaki Teknolojiler

Bir LAM aşağıdaki teknikleri kullanabilir:

  • Bağlantılar: Çeşitli uygulamalara ve API'lere bağlanın.
  • Nöro-sembolik yaklaşım: Nöro-sembolik programlama, LAM'lerin büyük veri kümeleri üzerinde eğitilmiş sinir ağlarını yerleşik sembolik mantıksal akıl yürütme yetenekleriyle birleştirmesine olanak tanıyan bir yöntemdir. Bu, LAM'lerin kalıpları fark etmelerini ve aynı zamanda altta yatan mantığı anlamalarını sağlayarak, onları daha uyarlanabilir ve kullanıcı isteklerinin "nedenine" bağlı olarak anlamlı yanıtlar verebilen bir yapıya kavuşturur.
  • Talimat soyutlaması: Bir arayüz aracılığıyla modelleme için modüler ve hiyerarşik soyutlama sağlayan talimatlar oluşturun.
  • Doğrudan insan modellemesi: Kullanıcı niyetini, alışkanlıklarını ve rutinlerini uygulamalar genelinde belirleyerek, harekete geçmek için bir şablon geliştirmek.
  • Görev mantığı: Görevler arasındaki ilişkileri analiz eder, bağımlılıkları belirler ve en uygun yürütme sırasını tespit eder. Bu, ön koşul görevlerin, bağımlı görevler başlamadan önce tamamlanmasını sağlar. Bu sayede LAM, geçmiş etkileşimlere dayanarak iş akışlarını iyileştirebilir.
  • Sürekli öğrenme: LAM'ler Sadece görev yürütmeyi gerçekleştirmekle kalmaz, aynı zamanda sürekli öğrenme yoluyla zaman içinde performanslarını da geliştirirler. Örneğin, LAM, siparişler, iadeler ve ürün bilgileriyle ilgili müşteri sorularını yönetebilir. Zamanla, sorunları hızlı bir şekilde çözmede daha yetenekli hale gelir, hatta müşteriler iletişime geçmeden önce potansiyel sorunları tahmin edip ele alabilir.

Daha fazla okuma

Cem Dilmegani
Cem Dilmegani
Baş Analist
Cem, 2017'den beri AIMultiple'da baş analist olarak görev yapmaktadır. AIMultiple, her ay Fortune 500 şirketlerinin %55'i de dahil olmak üzere yüz binlerce işletmeye (benzer Web'e göre) bilgi sağlamaktadır. Cem'in çalışmaları, Business Insider, Forbes, Washington Post gibi önde gelen küresel yayınlar, Deloitte, HPE gibi küresel firmalar, Dünya Ekonomik Forumu gibi STK'lar ve Avrupa Komisyonu gibi uluslararası kuruluşlar tarafından alıntılanmıştır. AIMultiple'ı referans gösteren daha fazla saygın şirket ve kaynağı görebilirsiniz. Kariyeri boyunca Cem, teknoloji danışmanı, teknoloji alıcısı ve teknoloji girişimcisi olarak görev yapmıştır. On yıldan fazla bir süre McKinsey & Company ve Altman Solon'da işletmelere teknoloji kararları konusunda danışmanlık yapmıştır. Ayrıca dijitalleşme üzerine bir McKinsey raporu yayınlamıştır. Bir telekom şirketinin CEO'suna bağlı olarak teknoloji stratejisi ve tedarikini yönetmiştir. Ayrıca, 2 yıl içinde sıfırdan 7 haneli yıllık yinelenen gelire ve 9 haneli değerlemeye ulaşan derin teknoloji şirketi Hypatos'un ticari büyümesini yönetmiştir. Cem'in Hypatos'taki çalışmaları TechCrunch ve Business Insider gibi önde gelen teknoloji yayınlarında yer aldı. Cem düzenli olarak uluslararası teknoloji konferanslarında konuşmacı olarak yer almaktadır. Boğaziçi Üniversitesi'nden bilgisayar mühendisliği diplomasına ve Columbia Business School'dan MBA derecesine sahiptir.
Tam Profili Görüntüle

Yorum yapan ilk kişi olun

E-posta adresiniz yayınlanmayacak. Tüm alanlar gereklidir.

0/450