Mobil uygulamaları kullanabilen bir yapay zeka cihazı olan Rabbit'in piyasaya sürülmesinin ardından, büyük eylem modelleri (LAM'ler) terimi popülerlik kazanıyor. Bu modeller, büyük ölçekli modelleri ( LLM'ler ) kullanıcıların uygulamalara tıklamasına veya bir API entegre etmesine gerek kalmadan, birbirinden ayrı, uygulama odaklı dünyayı birbirine bağlayabilen "ajanlar"a dönüştürerek konuşmanın ötesine geçiyor.
LAM'lerin abartısı ile gerçekliği arasındaki çizgi bulanık olsa da kısaca özetlemek gerekirse: LAM, özellikle eylemler gerçekleştirmek (örneğin API istekleri göndermek) üzere eğitilmiş büyük bir dil modelidir (LLM). 1
Büyük aksiyon modeli (LAM) nedir?
Büyük eylem modeli, karmaşık görevleri eylemlere dönüştürerek akıl yürütme ve gerçekleştirme yeteneğine sahip bir yapay zekâdır.
Büyük aksiyon modelleri (LAM) nasıl çalışır?
LAM'ler, uygulamalarla kullanıcı arayüzleri veya daha yaygın olarak API'ler aracılığıyla etkileşim kurar. Örneğin, bir web sitesinin veya uygulamanın resimlerini ve kodunu işleyerek sonraki adımlarına karar verebilir ve eylemler gerçekleştirebilirler.
Bu, LAM'lerin kullanıcı ve uygulama arayüzlerinde gezinmesine olanak tanır. Örneğin, bilgi zaten mevcutsa veya başka bir uygulama aracılığıyla erişilebiliyorsa, kullanıcıya sormak yerine o uygulamadan bilgiyi alır.
LAM'ler içerisinde, bu tür özerklik ve kavrama düzeyleri, üretken yapay zekayı aşağıdaki gibi görevleri yerine getirebilen aktif bir asistana dönüştürür:
- sosyal medya platformlarını yönetmek
- hava durumu bilgisi almak
- rezervasyon yapmak
- finansal işlemlerin işlenmesi
- IoT cihazlarına bağlanarak onlara komut göndermenizi sağlar (örneğin Uber çağırmak).
Kaynak: Salesforce 2
LAM'ler ve LLM'ler – Aralarındaki Farkı Anlamak
LAM'ler ve büyük dil modelleri, insan niyetlerini kavrama yetenekleri gibi bazı benzerlikler paylaşsalar da, temel amaçları büyük ölçüde farklılık gösterir.
LAM'ler eylem gerçekleştirmek üzere tasarlanmışken, LLM'ler dil işleme ve üretme konusunda üstünlük gösterir. Bir LLM, girdilerinize dayanarak fikirler önerebilir veya metin üretebilirken, bir LAM randevu almak, ürün sipariş etmek veya form doldurmak gibi görevleri otonom olarak gerçekleştirerek bir adım daha ileri gider.
Büyük ajan tabanlı modeller (LAM) abartı mı, gerçek mi?
Bazı şirketler LAM'leri yeni bir mimari olarak tanıtsa da, bunlara atanan işlevler bir süredir LLM ajanları kullanılarak uygulanmaktadır. 3
Ek olarak, LLM ajanları daha önce LAM'lerin yapması gereken görevleri yerine getirmiştir. İki kavram ortak işlevlere sahiptir (şekle bakınız):
- Bağlam tabanlı analiz
- Hızlı mühendislik
- Araçlardan yararlanma
- Akıl yürütme 4
Şekil: Dil tabanlı yapay zeka ajanı iş akışı
Kaynak: ICLR 5
Ayrıca, LAM'ler (1) komut şablonuna dayalı yapay zeka ajanları ; (2) öğrenilebilir komut yapay zeka ajanları; ve (3) büyük eylem modelleri (LAM'ler) gibi dil tabanlı ajan tasarımları olarak tanımlanabilir; bu da bir LAM'i, verilerden insan eylemlerini yürütmek üzere özel olarak eğitilmiş bir LLM olarak düşünebileceğimizi ifade eder. 6
Yapay zeka modelleri hakkında daha fazla bilgi için veri odaklı araştırmalarımıza göz atabilirsiniz:
Gerçek hayattan LAM örnekleri
1. Web sitelerindeki formların veya elektronik tabloların otomatik olarak doldurulması
Bir LAM (Lisanslı Ağ Yöneticisi), bir formdaki gerekli alanları tanıyabilir, gerekli verileri (örneğin adresler, isimler, şifreler ve kredi kartı numaraları) bir veritabanından veya kullanıcı profilinden toplayabilir ve bunları ilgili alanlara girebilir.
Video: LAM ile formların veya elektronik tabloların otomatik olarak doldurulması
2. Çevrimiçi işlemlerin tamamlanması
Bir LAM (Analog Modelleme Sistemi), düğmeler, bağlantılar ve açılır menülerle çalışabilir. Ayrıca metin alanlarına ve arama çubuklarına belirli metinler ekleyebilir. Çevrimiçi pizza siparişi vermek tam olarak bunu gerektirir: metin formlarını doldurmak, düğmelere tıklamak ve menü seçimlerini yapmak.
Video: HyperWriteAI Assistant Studio'nun tarayıcıyı kullanarak çevrimiçi sipariş verme işlemi.
Kaynak: HyperWriteAI 8
LAM'lardaki Teknolojiler
Bir LAM aşağıdaki teknikleri kullanabilir:
- Bağlantılar: Çeşitli uygulamalara ve API'lere bağlanın.
- Nöro-sembolik yaklaşım: Nöro-sembolik programlama, LAM'lerin büyük veri kümeleri üzerinde eğitilmiş sinir ağlarını yerleşik sembolik mantıksal akıl yürütme yetenekleriyle birleştirmesine olanak tanıyan bir yöntemdir. Bu, LAM'lerin kalıpları fark etmelerini ve aynı zamanda altta yatan mantığı anlamalarını sağlayarak, onları daha uyarlanabilir ve kullanıcı isteklerinin "nedenine" bağlı olarak anlamlı yanıtlar verebilen bir yapıya kavuşturur.
- Talimat soyutlaması: Bir arayüz aracılığıyla modelleme için modüler ve hiyerarşik soyutlama sağlayan talimatlar oluşturun.
- Doğrudan insan modellemesi: Kullanıcı niyetini, alışkanlıklarını ve rutinlerini uygulamalar genelinde belirleyerek, harekete geçmek için bir şablon geliştirmek.
- Görev mantığı: Görevler arasındaki ilişkileri analiz eder, bağımlılıkları belirler ve en uygun yürütme sırasını tespit eder. Bu, ön koşul görevlerin, bağımlı görevler başlamadan önce tamamlanmasını sağlar. Bu sayede LAM, geçmiş etkileşimlere dayanarak iş akışlarını iyileştirebilir.
- Sürekli öğrenme: LAM'ler Sadece görev yürütmeyi gerçekleştirmekle kalmaz, aynı zamanda sürekli öğrenme yoluyla zaman içinde performanslarını da geliştirirler. Örneğin, LAM, siparişler, iadeler ve ürün bilgileriyle ilgili müşteri sorularını yönetebilir. Zamanla, sorunları hızlı bir şekilde çözmede daha yetenekli hale gelir, hatta müşteriler iletişime geçmeden önce potansiyel sorunları tahmin edip ele alabilir.
Daha fazla okuma
- 20 LLM Güvenlik Aracı ve Açık Kaynaklı Çerçeveyi Karşılaştırın
- LLM'de Karşılaşılabilecek En Büyük 10 Güvenlik Riski Nelerdir?
Yorum yapan ilk kişi olun
E-posta adresiniz yayınlanmayacak. Tüm alanlar gereklidir.