Bize Ulaşın
Sonuç bulunamadı.

En İyi 10 Duygu Yapay Zeka Aracı Test Edildi

Ezgi Arslan, PhD.
Ezgi Arslan, PhD.
güncellendi Oca 22, 2026
Bakınız etik normlar

Büyük dil modelleri ve duygu yapay zekası, seslerden, yüzlerden ve verilerden duyguları algılayabilir ve komutlardan video veya ses üretebilir. İki duygu algılama yazılım aracının ve yedi büyük dil modelinin duygu algılama yeteneklerini 70 yüz görüntüsü kullanarak değerlendirdik. Bu karşılaştırmada , GPT o4 Mini High, görüntülerin %69'unda duyguları doğru bir şekilde tanımlayarak öne çıktı.

Ek olarak, önde gelen on duygu yapay zeka aracını inceliyor ve uygulamalı deneyimlerimizi paylaşıyoruz .

Duygu tanıma konusunda kıyaslama

Loading Chart

Duygu tanıma kıyaslama sonuçları

  • GPT o4 Mini High, görüntülerin %69'unda duyguları doğru bir şekilde tanımlayarak en yüksek doğruluk oranına ulaştı.
  • Bunu sırasıyla GPT 5.2 (%67), GPT 5 Mini (%66) ve GPT o4 Mini (%66) izledi. GPT 5 Nano (%61), analizde kullanılan diğer GPT modellerine kıyasla daha kötü performans gösterdi.
  • Genel olarak, Gemini , Grok ve Claude ailelerindeki modeller daha düşük performans gösterdi; Gemini 3 Flash Preview %63, Claude Opus 4.5 %60, Gemini 3 Pro Preview %59, Grok 4 %54 , Claude Sonnet 4.5 %50 ( Grok 4.1 Fast ile aynı) ve Claude Haiku 4.5 %49 puan aldı.

Duygu yapay zekâ araçları arasında,

  • Imertiv AI %40'lık bir başarı oranına ulaşırken, Hume %36 ile onu takip etti.

Genel olarak, sonuçlar mevcut LLM'lerin , özellikle GPT-4.1 Mini'nin , görüntülerden duyguları orta düzeyde başarıyla tespit edebildiğini ve bu testte çoğu özel duygu yapay zeka aracından daha iyi performans gösterdiğini ortaya koymaktadır.

Kıyaslama değerlendirmesi hakkında daha fazla bilgi için değerlendirme kriterleri bölümünü okuyun.

Duygu tanıma yazılımları ve LLM'ler üzerine kıyaslama metodolojisi

Bu kıyaslama testi , büyük dil modellerinin (LLM'ler) ve duygu algılama yazılımlarının görüntülerdeki duyguları ne kadar iyi tanıdığını ölçmüştür.

Özel duygu araçları, kendi kullanıcı arayüzleri içinde test edildi ve LLM'ler, kullanılabilirliğe bağlı olarak, ilgili API anahtarları veya OpenRouter'un evrensel API anahtarları kullanılarak test edildi.

Veri kümesi

Yüz İfadesi Algılama veri setinin bir bölümünü kullanıyoruz; bu bölüm, farklı insan duygularını gösteren etiketlenmiş bir dizi görüntü içeriyor. 1 Her bir görselde mutluluk, üzüntü, öfke, korku ve şaşkınlık gibi yaygın duygusal durumları temsil eden yüz ifadeleri yer alıyordu.

Dokuz farklı alet test edildi:

  • Yedi büyük dil modeli (LLM): GPT o4 Mini High , GPT o4 Mini , GPT 5 Mini , GPT 5.2 , GPT 5 Nano , Claude Opus 4.5 , Claude Sonnet 4.5 , Claude Haiku 4.5 , Gemini 3 Pro Preview , Gemini 3 Flash Preview , Grok 4 ve Grok 4.1 Fast
  • Duygu yapay zekasına yönelik iki özel araç: Hume ve Imertiv AI .

Her bir araca aynı resim seti verildi ve gösterilen baskın duyguyu belirlemesi istendi. Yanıtlar, doğru duygu etiketleriyle karşılaştırıldı. Başarı oranı, aracın etiketli duyguyu doğru eşleştirdiği resimlerin yüzdesini temsil eder.

Duygusal hesaplama araçlarının karşılaştırılması

Hume İfadesi Ölçümü

Hume Duygu Ölçümü, insan duygularını belirlemeye ve ölçmeye yardımcı olan bir yapay zeka duygu aracıdır. Tek bir uygulama üzerinden çalışır ve dört tür veri kullanır: ses, görüntüler, videolar ve yüz ifadeleri. Bunlar birlikte, insanların duygularını nasıl ifade ettiklerine dair daha derin ve ayrıntılı bir bakış sunar.

Gerçek yaşam deneyimi

Bu duygu tanıma yazılımı her zaman %100 doğru olmayabilir, ancak özellikle konuşma kalıpları aracılığıyla duygusal nüansları etkili bir şekilde yakalar. Bununla birlikte, mükemmel değildir. Bazen, ses patlamalarından temel duyguları algılayamayabilir. Yine de, duygusal sonuçlar genellikle gerçekçi ve incelikli hissettirir.

Hume, sadece "mutlu" veya "üzgün" gibi basit etiketler yerine, duygusal davranışlara ilişkin ayrıntılı ve duyarlı bir bakış açısı isteyen kullanıcılar için en uygunudur. Duygu tanıma yazılımının web uygulaması son derece kullanıcı dostudur.

Başlıca özellikler

  • Yazılım, verilen bir metin için duyguları, duygu durumunu ve toksisiteyi gerçek zamanlı olarak analiz eder.

Şekil 1. Duygular için Hume İfade Ölçümü metin analizi

Şekil 2. Duygu tespiti için Hume İfade Ölçümü metin analizi

Duygu analizi hakkında daha fazla bilgi için duygu analizi makalelerimize göz atabilirsiniz.

  • Bu duygu tanıma yazılımı, videolar, resimler ve ses kayıtlarından da duyguları algılar. Kullanıcılar belgeleri yükleyebilir veya duygu tespiti için kendi kameralarını ve hoparlörlerini kullanmayı tercih edebilirler.

Hume, konuşmaları, görüntüleri ve videoları çeşitli özellikler kullanarak analiz eder:

  • Yüz ifadesi : Sevinç, öfke veya üzüntü gibi yüz ifadelerini anlamak için yüz hareketlerini algılar.
  • Ses patlaması : Bir kişinin sakin, heyecanlı, stresli vb. olup olmadığını, yani nasıl ses çıkardığını ölçer.
  • Konuşma prozodisi : Ses tonu, perde ve ritimdeki değişiklikleri izler. Bu, bir kişinin söylediklerinin duygusal tonunu belirlemeye yardımcı olur.

Şekil 3. Konuşma prozodisi için Hume İfade Ölçümü video analizi

Mangold Gözlem Stüdyosu

Mangold Gözlem Stüdyosu, gelişmiş, sensör tabanlı araştırmalar için tasarlanmış kapsamlı bir platformdur. Video, ses, yüz ifadeleri, fizyolojik sinyaller ve daha birçok veri kaynağını tek bir senkronize sistemde bir araya getirir.

Başlıca özellikler

  • Video ve ekran kaydı : Katılımcıların davranışlarını ve ekran etkinliklerini tam bağlam sağlayacak şekilde kaydeder.
  • Sensör entegrasyonu : EEG, göz takibi, kalp atışı, cilt tepkisi ve kas aktivitesini destekler.
  • Konuşma analizi : Konuşulan kelimeleri otomatik olarak metne dönüştürür.
  • Anketler ve notlar : Katılımcı geri bildirimlerini ekleyin veya oturumlar sırasında önemli anları işaretleyin.
  • Çok modlu tasarım : Sadece tek bir veri türüne (örneğin yüz ifadesine) odaklanan araçların aksine, Mangold 120'den fazla sensör türünü tek bir platformda birleştiriyor.
  • Ölçeklenebilir kurulum : Zaman senkronize edilmiş kayıtlarla, aynı anda sınırsız sayıda katılımcıyı ve cihazı destekler.
  • Tam ağ kontrolü : Tüm cihazlar merkezi bir istasyondan yönetilebilir.
  • Modüler ve özelleştirilebilir : Araştırmacılar kendi kurulumlarını oluşturabilir ve bir API kullanarak harici araçlarla entegre olabilirler.

Visage SDK

Visage SDK, işletmelerin yüzleri gerçek zamanlı olarak izlemesine ve analiz etmesine yardımcı olan bir yüz duygusu tanıma yazılımıdır. İnsanların duygularını, yaşını, cinsiyetini ve kimliğini anlamak için gelişmiş bilgisayar görüşü teknolojisini kullanır.

Başlıca özellikler

  • Çevrimiçi ve çevrimdışı destek : Hem çevrimiçi (bulutta) hem de çevrimdışı (cihazınızda) çalışır, bu nedenle her zaman internet bağlantısına bağımlı değilsiniz.
  • Önce gizlilik : İsim veya fotoğraf gibi kişisel verilerinizin izniniz olmadan saklanmamasını veya işlenmemesini sağlar.
  • Unity entegrasyonu : Oyunlarda yüz filtreleri veya etkileşimli deneyimler oluşturmak için Unity ile entegre olur.

Uygulamalar

  • Sanal deneme : Müşterilerin gözlük, makyaj veya diğer ürünleri sanal olarak denemelerine olanak sağlamak için yüz tanıma özelliğini kullanın.
  • Sürücü izleme : Yol güvenliğini artırmak için uykusuzluk veya dikkat dağınıklığı gibi tehlikeli sürüş davranışlarını tespit eder.
  • Yolcu izleme : Güvenliği ve konforu artırmak için otomobillerde veya toplu taşıma araçlarında yolcuların refahını takip edin.
  • Artırılmış gerçeklik (AR) : Sosyal medya veya uygulamalar için güzelleştirme filtreleri veya gerçekçi yüz maskeleri gibi eğlenceli ve ilgi çekici deneyimler oluşturun.

Imentiv AI

Imentiv AI, kullanıcıların video, ses ve metin içeriklerinde insanların nasıl hissettiğini, konuştuğunu ve davrandığını anlamalarına yardımcı olan bir duygu algılama yazılımıdır. İnsan duygularını ve kişiliğini gerçek zamanlı olarak analiz etmek için yapay zekayı psikolojik uzmanlıkla birleştirir.

Gerçek hayattan deneyim:

Imentiv AI, kullanıcıların video içeriklerinden duyguları analiz etmelerine yardımcı olur. Tam bir video yükleyebilir veya belirli bir kareye odaklanabilirsiniz. Araç, duygusal ipuçlarını anlamak için yüz ifadelerine, ses tonuna ve metne bakar.

Analiz doğru görünüyor ve çok çeşitli duygusal sinyalleri kapsıyor. Platform, temel içgörülere ek olarak psikolojik değerlendirmeler de sunuyor. Bunlar randevu sistemi aracılığıyla planlanabiliyor.

Şekil 4. Imentiv yapay zeka kişilik özelliği analizi

Başlıca özellikler

  • Çok modlu analiz : Video, ses ve metni birlikte analiz eder. Bu, duygusal tepkilerin daha kapsamlı bir resmini sunar.
  • Yüz ve ses takibi : Her video karesinde birden fazla yüzü algılar. Sesleri yüzlerle eşleştirir veya ayrı ayrı analiz eder. Hangi kişinin ne zaman konuştuğunu gösterir.
  • Duygu grafiği : Dinamik dairesel bir grafikte gerçek zamanlı yüz ifadelerini gösterir. Duygu Çarkı, duyguların zaman içinde nasıl değiştiğini net bir şekilde görselleştirir.
  • Kişilik özelliği analizi : Videodaki kişilerin kişilik özelliklerini özetlemek için OCEAN modelini (Açıklık, Vicdanlılık, Dışa Dönüklük, Uyumluluk, Nevrotiklik) kullanır. Sonuçlar basit bir renk kodlu çubuk grafik olarak gösterilir.
  • Psikolog incelemesi : Eğitimli psikologlar, yapay zeka sonuçlarını inceleyerek gizli önyargıları ve duygusal tetikleyicileri tespit eder. Bu, yapay zeka analizine değerli bilgiler katar.

Sağ Akış

RightFlow, insanların bir markayla etkileşimleri sırasında nasıl hissettiklerini anlamak için yüz ifadelerini analiz eden bir duygu yapay zeka aracıdır. İşletmelerin mutluluk, öfke, korku veya şaşkınlık gibi duyguları yakalayarak pazarlama, müşteri hizmetleri ve ürün tasarımını geliştirmelerine yardımcı olur.

Başlıca özellikler

  • Yoğun ilgi gören alan tespiti : İnsanların zaman geçirdiği yerleri ve dikkatlerini çeken şeyleri belirler.
  • Ziyaretçi sayısı : Bir mekan veya ürünle etkileşim kuran kişi sayısını takip eder.
  • Demografik analiz : İzleyici kitlesindeki farklılıkları anlamak için yaş ve cinsiyet verilerini inceler.
  • Dikkat analizi : Müşterilerin neye odaklandığını öğrenmek için baş ve göz hareketlerini ölçer.

Sadece duygu tespiti odaklı araçların aksine, RightFlow duygu verilerini müşteri sayımı, demografik izleme ve fiziksel güvenlik özellikleriyle birleştirir. Gerçek zamanlı, temassız analizin önemli olduğu kamusal alanlar, mağazalar veya etkinlikler için tasarlanmıştır.

MoodMe Yüz Yapay Zeka Duygu Algılama Motoru

MoodMe'nin Yüz Yapay Zeka Motoru, yüz ifadelerini okuyarak duyguları gerçek zamanlı olarak algılayan bir araçtır. İnternet bağlantısı veya bulut işlemeye gerek kalmadan doğrudan kullanıcının cihazında çalışır.

Başlıca özellikler

  • Demografik tespit: Motor, cinsiyet, yaş, etnik köken ve saç tipi gibi bilgileri tahmin edebilir. Bu, uygulamaların kendileriyle etkileşim kuran kişileri daha iyi anlamalarına yardımcı olur.
  • Yüz eşleştirme: MoodMe, yüz tanıma için yerleşik bir araç içerir. Güvenli kimlik doğrulamaları için bir yüzü yerel olarak depolanmış şablonlarla eşleştirebilir.
  • Tarafsız ve kapsayıcı: Yapay zeka, herhangi bir grubu kayırmamak için çeşitli veriler üzerinde eğitilmiştir. Bu, farklı yüz ve ifadelerde daha adil sonuçlar sağlar.
  • Önce gizlilik: Tüm işlemler kullanıcının cihazında gerçekleşir. Yüzler asla saklanmaz veya buluta gönderilmez. Bu, gizliliği korur ve katı veri düzenlemelerine uyar.

MorphCast MyMoodScan

MyMoodScan, MorphCast tarafından geliştirilen, yüz ifadelerini analiz ederek gizli duyguları ortaya çıkaran ücretsiz bir web tabanlı duygu algılama uygulamasıdır. Gerçek zamanlı duygusal geri bildirim almak için bir fotoğraf yükleyebilir veya cihazınızın kamerasını kullanabilirsiniz.

Gerçek hayattan deneyim:

Uygulama eğlenceli ama her zaman doğru değil. Bazen duyguları yanlış etiketliyor; örneğin mutlu yüzler ilgisiz veya özlem dolu olarak, iğrenmiş ifadeler ise şaşırmış olarak gösterilebiliyor. Yine de, insan duygularının karmaşıklığı hakkında düşünmeye başlamanın neşeli bir yolu.

Özetle, MyMoodScan, sonuçlar kesin olmaktan ziyade biraz eğlenceli olsa da, duyguları tespit etmeye yönelik gerçek zamanlı ve sosyal medyaya uygun yaklaşımıyla öne çıkıyor.

Şekil 5. MorphCast MyMoodScan'in bir görüntünün duygusal analizi.

Başlıca özellikler

  • Ücretsiz ve Kullanımı Kolay : Reklam yok, ücret yok, sadece anında duygusal içgörüler.
  • Eğlenceli ve Sosyal : Sosyal medyada duyguları paylaşmak ve sohbet başlatmak için tasarlandı.

Hume Empatik Ses Arayüzü (EVI)

Hume'un Empatik Ses Arayüzü (EVI), konuşmaları daha insansı hale getiren bir konuşmadan konuşmaya yapay zeka sistemidir. Kullanıcıların gerçek zamanlı olarak duygu ve kişilikle yanıt veren sesler oluşturmasına, kopyalamasına ve kontrol etmesine olanak tanır.

Gerçek yaşam deneyimi

Testlerde, EVI ile yapılan konuşmalar gerçekçi ve ilgi çekiciydi. Duygu algılama iyi çalıştı. Kullanıcılar tonu ve ortamı yönlendirebiliyordu, ancak bu özellik her zaman mükemmel çalışmadı.

Özetle, Hume'un Empatik Ses Arayüzü, hızlı tepkiyi, duygusal derinliği ve yüksek kontrolü bir araya getirerek yapay zeka ile yapılan konuşmaları gerçek insan etkileşimine daha yakın hale getiriyor. Konuşma platformunun web arayüzü basit ve sezgisel bir kullanıma sahip.

Şekil 6. Yapay zekâ ile yapılan konuşmanın Hume EVI analizi

Başlıca özellikler

  • Özel ses : Her biri benzersiz özelliklere sahip 100.000'den fazla özel sesi destekler. Hatta sadece bir komut yazarak "sakinleştirici bir İngiliz anne" veya "heyecanlı bir Karayip müzisyeni" gibi sesler bile oluşturabilirsiniz.
  • Ses kopyalama : Kendi sesinizin dijital bir versiyonunu oluşturmak için bir ses örneği yükleyin.
  • Gerçek zamanlı konuşmalar : Yaklaşık 300 milisaniye içinde yanıt verir, bu da bir insan kadar hızlıdır.

Hume Oktavı

Hume Octave, kelimelerin ardındaki anlamı kavrayan ses tabanlı bir dil modelidir. Şirket, bu modelin daha iyi duygu, ritim ve ton içeren konuşmalar oluşturmaya yardımcı olduğunu iddia ediyor.

Gerçek yaşam deneyimi

Octave, genellikle bir metin için doğru sesi buluyordu. Ses tanımlarını iyileştirmeye ve tonları iyi eşleştirmeye yardımcı oluyordu. Bununla birlikte, nihai ses bazen zayıf bir oyunculuk performansı gibi düz veya yapay geliyordu. Yine de, araç farklı konuşma stillerini yakalamada güçlü bir potansiyel gösterdi.

Özetle, Hume Octave sese anlam katıyor. Kullanıcıların hem kelimelere hem de ana uygun, daha gerçekçi ve etkileyici konuşmalar oluşturmasına yardımcı oluyor ve kullanımı çok kolay.

Başlıca özellikler

  • Düşük gecikme süresi : Anında Mod ile yalnızca 200 milisaniyede konuşmaya başlar.
  • Özel sesler : Sıfırdan sesler oluşturun, kendi sesinizi kullanın veya önceden hazırlanmış birçok seçenek arasından seçim yapın.
  • İfade kontrolü : Sesin her repliği nasıl söyleyeceğini şekillendirmek için oyunculuk tarzı talimatları ekleyin.
  • Özgün Sesler : Basit bir yönergeyle, "alaycı bir ortaçağ köylüsü" veya "sakin bir fen bilgisi öğretmeni" gibi sesler oluşturun.

Revoicer

Revoicer, yazılı metni gerçekçi seslendirmelere dönüştüren, duygu tanıma teknolojisine sahip yapay zeka destekli bir metinden sese dönüştürme yazılımıdır. Daha insansı ve daha az yapay duygu içeren ses içerikleri oluşturduğunu iddia ediyor.

Başlıca özellikler

  • Duygusal sesler : Seslendirme sanatçısı neşeli, üzgün, kızgın, arkadaş canlısı, fısıltılı veya heyecanlı gibi çeşitli tonlarda konuşabilir.
  • Geniş dil desteği : İngilizce ve Fransızca, Almanca, Arapça ve Mandarin Çincesi de dahil olmak üzere 40'tan fazla dilde çalışır.
  • Özelleştirme seçenekleri : Kullanıcılar sesin perdesini, hızını ve tonunu değiştirebilir. Ayrıca duraklamalar ekleyebilir veya belirli kelimeleri vurgulayabilirler.
  • Çok sayıda ses : Bu araç, erkek, kadın ve çocuk sesleri de dahil olmak üzere 80'den fazla ses sunuyor. Kullanıcılar ayrıca Amerikan, İngiliz, Avustralya veya Hint aksanı gibi farklı İngilizce aksanları arasından seçim yapabilirler.

Değerlendirme kriterleri

Her bir Duygu Yapay Zeka aracını adil bir şekilde değerlendirmek için, tüm platformlarda aynı kriter setini kullandık. Bunlar şunlardır:

  • Duygu algılama doğruluğu : Aracın, yüz ifadelerinden, sesten veya metinden mutluluk, öfke veya şaşkınlık gibi duyguları ne kadar iyi tanımladığı.
  • Çok modlu yetenekler : Aracın birden fazla girdi türünü (örneğin, video, ses, metin) birlikte veya ayrı ayrı analiz edebilme yeteneği.
  • Kullanım kolaylığı : Kurulum ve günlük kullanım da dahil olmak üzere, arayüzün teknik bilgisi olmayan kullanıcılar için ne kadar sezgisel olduğu.
  • Gerçek zamanlı geri bildirim : Platformun canlı etkileşimler veya kayıtlar sırasında anlık bilgiler sağlayıp sağlayamayacağı.
  • Analiz derinliği : Davranış kalıpları, dikkat takibi ve demografik dağılımlar da dahil olmak üzere duygu analizinin kalitesi ve ayrıntı düzeyi.

Daha fazla okuma

Ezgi Arslan, PhD.
Ezgi Arslan, PhD.
Sektör Analisti
Ezgi, işletme yönetimi alanında finans uzmanlığıyla doktora derecesine sahip olup AIMultiple'da Endüstri Analisti olarak görev yapmaktadır. Sürdürülebilirlik, anket ve duygu analizi, finansta yapay zeka ajan uygulamaları, yanıt motoru optimizasyonu, güvenlik duvarı yönetimi ve tedarik teknolojileri alanlarındaki uzmanlığıyla teknoloji ve iş dünyasının kesiştiği noktada araştırmalar ve içgörüler geliştirmektedir.
Tam Profili Görüntüle

Yorum yapan ilk kişi olun

E-posta adresiniz yayınlanmayacak. Tüm alanlar gereklidir.

0/450