Empfehlungssysteme sind sowohl für Unternehmen als auch für Kunden von Vorteil, da sie Daten nutzen, um das Nutzererlebnis zu personalisieren. Sie tragen dazu bei, den Umsatz zu steigern, die Kundenbindung zu erhöhen und die Kundenabwanderung zu reduzieren, indem sie die Auswahl vereinfachen und die Nutzerbindung stärken.
Wir haben drei Python-Empfehlungsbibliotheken verglichen: LightFM, Cornac BPR und TensorFlow Recommenders. Dabei verwendeten wir denselben impliziten Feedback-Datensatz und identische Vorverarbeitungsschritte.
Wir haben jedes Modell mit denselben Daten trainiert, sie anhand von AUC, Precision@10 und Recall@10 bewertet und ihre Fähigkeit verglichen, relevante Elemente in Top-k-Empfehlungen zu ordnen und abzurufen.
Die besten Python-Bibliotheken für Empfehlungssysteme
Diese Bibliotheken implementieren Algorithmen des maschinellen Lernens, um Trainingsdaten zu verarbeiten und personalisierte Empfehlungen mithilfe kollaborativer oder inhaltsbasierter Filtertechniken zu generieren. Darüber hinaus implementieren sie Modelle des maschinellen Lernens, um Daten zu analysieren und Muster zu erkennen. Dies ermöglicht es der Empfehlungs-Engine, relevante Artikel basierend auf dem Nutzerverhalten und den Präferenzen vorzuschlagen.
Besonderheit | LightFM | Cornac (BPR) | TensorFlow |
|---|---|---|---|
Modelltyp | Hybrid (Kollaborativ + Inhaltsbasiert) | Matrixfaktorisierung (BPR) | Kollaborativ, inhaltsbasiert oder hybrid |
Datentyp | Explizit & Implizit | Implizit | Explizit & Implizit |
Inhaltsunterstützung | Ja (Benutzer-/Artikelmerkmale) | NEIN | Ja (über Feature Towers, Einbettungen usw.). |
Kaltstart | Teilweise verarbeitet (über Inhaltsmerkmale) | NEIN | Ja (wenn Inhaltsmerkmale verwendet werden). |
Auswertung | Präzision@K, AUC, Recall@K | NDCG, Präzision@K, AUC, Präzision@K | Präzision@K, Trefferquote@K, AUC |
Anwendungsfall | Hybridsysteme, Metadatennutzung | Implizites Feedback-Ranking | Universelle, hochgradig anpassbare Empfehlungssysteme |
LightFM vs. Cornac BPR vs. TensorFlow Benchmark-Ergebnisse
TensorFlow-Empfehlungsfunktionen Cornac BPR erzielte die besten Ergebnisse. Seine Deep-Learning-Architektur ermöglicht es, komplexere Nutzer-Artikel-Beziehungen zu erfassen. LightFM, das bei verfügbaren Metadaten gute Ergebnisse liefert, schnitt hier aufgrund der ausschließlichen Verwendung von Verhaltensdaten nicht so gut ab; dennoch übertraf es BPR. Cornac BPR wies die niedrigste Empfehlungsqualität auf und eignet sich daher eher für schnelle Experimente oder kleinere Anwendungen.
Wir haben unsere Benchmarking-Methodik für Empfehlungssysteme verwendet, um LightFM, Cornac BPR und TensorFlow zu testen.
Was ist ein Empfehlungssystem?
Ein Empfehlungssystem ist ein Tool, das Nutzern personalisierte Vorschläge basierend auf ihren Präferenzen, ihrem Verhalten und ihren Interaktionen mit einer Plattform unterbreitet. Diese Systeme analysieren Daten wie Kaufhistorie, Browserverlauf, Nutzerdemografie und Kontextinformationen, um relevante Inhalte bereitzustellen. Im Folgenden werden die gängigsten Arten von Empfehlungssystemen beschrieben:
Techniken des kollaborativen Filterns:
- Basierend auf Interaktionsmustern zwischen Nutzern und Artikeln.
- Beinhaltet nutzerbasiertes kollaboratives Filtern (Suche nach ähnlichen Nutzern) und artikelbasiertes kollaboratives Filtern (Suche nach ähnlichen Artikeln).
- Am besten geeignet für E-Commerce- und Streaming-Dienste.
Inhaltsbasierte Filtertechniken:
- Der Fokus liegt auf den Eigenschaften von Artikeln (Artikelmerkmale) und den bisherigen Interaktionen eines Benutzers (Benutzerpräferenzen).
- Ideal zur Ermittlung der spezifischen Interessen des Zielnutzers.
Hybride Empfehlungssysteme:
- Kombinieren Sie kollaboratives Filtern und inhaltsbasierte Methoden.
- Nutzt Modelle des maschinellen Lernens wie tiefe neuronale Netze und rekurrente neuronale Netze für verbesserte Vorhersagen.
Schlüsselkonzepte von Empfehlungssystemen
Grundlagen der Matrixfaktorisierung
Die Matrixfaktorisierung ist eine Kerntechnik beim kollaborativen Filtern. Sie zerlegt eine große Benutzer-Element-Interaktionsmatrix (z. B. Bewertungen oder Klicks) in kleinere Matrizen, die verborgene Muster oder Beziehungen erfassen, sogenannte latente Merkmale.
Dieser Ansatz hilft, die Komplexität der Daten zu reduzieren und aussagekräftige Erkenntnisse zu gewinnen, wie zum Beispiel die Vorliebe eines Nutzers für bestimmte Genres oder die Attraktivität eines Artikels für eine bestimmte Gruppe.
Implizite Daten verstehen
Implizite Daten bezeichnen indirekte Indikatoren für Nutzerpräferenzen, die sich aus dem Nutzerverhalten und nicht aus explizitem Feedback wie Sternebewertungen ergeben. Beispiele für implizite Daten sind Klickraten, Verweildauer auf einer Seite, Kaufhistorie und Suchmuster.
Diese Art von Daten lässt sich leichter in großem Umfang erfassen und spiegelt oft das tatsächliche Nutzungsverhalten wider. Allerdings können sie ungenau oder mehrdeutig sein, beispielsweise wenn es darum geht, zu interpretieren, ob ein langer Seitenaufruf Interesse oder Ablenkung signalisiert.
Deep Learning bei Empfehlungen
Deep Learning unterstützt Empfehlungssysteme durch die Analyse komplexer und mehrdimensionaler Daten mithilfe neuronaler Netze. Es ist besonders effektiv für sitzungsbasierte Empfehlungen, das Verständnis von Inhalten und kontextbezogene Vorschläge, die Zeit, Ort oder die Stimmung des Nutzers berücksichtigen.
Diese Methoden können große und unstrukturierte Datenmengen wie Texte, Bilder und Videos verarbeiten und dabei komplexe Zusammenhänge zwischen den Merkmalen erkennen.
Hybride Empfehlungsansätze
Hybride Empfehlungssysteme kombinieren verschiedene Techniken wie kollaboratives Filtern, inhaltsbasiertes Filtern und wissensbasierte Ansätze. Diese Integration verbessert die Genauigkeit und begegnet Herausforderungen wie dem Kaltstartproblem (neue Nutzer oder Artikel) und spärlichen Daten.
Tutorial: Aufbau eines Empfehlungssystems mit LightFM
In diesem Tutorial entwickeln wir mit LightFM eine Empfehlungs-Engine, die implizite Daten aus der Interaktion zwischen Nutzern und Produkten nutzt. Diese Trainingsdaten, darunter verschiedene Kundendaten, helfen dem Modell, Nutzerpräferenzen zu erlernen und präzise Vorhersagen zu treffen.
Das von uns entwickelte LightFM-Modell prognostiziert, welche Produkte ein Nutzer voraussichtlich ansehen wird, indem es dessen potenzielle Interaktionen mit noch nicht gesehenen Artikeln abschätzt. Das Modell analysiert Daten, um diese präzisen Vorhersagen zu treffen und so sicherzustellen, dass die Empfehlungen auf das Nutzerverhalten zugeschnitten sind.
Voraussetzungen
Bevor Sie beginnen, stellen Sie sicher, dass Sie die erforderlichen Bibliotheken installiert haben. Falls nicht, können Sie diese über pip installieren:
Für komplexere Empfehlungssysteme können auch Bibliotheken zur Verarbeitung natürlicher Sprache erforderlich sein.
Datensatzübersicht
In diesem Tutorial verwenden wir einen Datensatz aus dem Bereich E-Commerce, der Informationen über die Interaktionen von Nutzern mit Produkten enthält. Der Datensatz umfasst die folgenden Spalten:
- visitorid: Eine eindeutige Kennung für den Besucher (Benutzer).
- itemid: Eine eindeutige Kennung für den Artikel (das Produkt).
- Ereignis: Das Interaktionsereignis; in diesem Fall interessieren uns nur die „View“-Ereignisse.
Der Datensatz kann auch unstrukturierte Daten enthalten, die verarbeitet werden müssen.
Ein Beispiel für einen Eintrag im Datensatz würde folgendermaßen aussehen:
Der Einfachheit halber filtern wir nur die „View“-Ereignisse heraus, bei denen Nutzer mit Produkten interagiert haben. Diese Informationen nutzen wir dann, um das Empfehlungsmodell zu erstellen.
Schritt-für-Schritt-Anleitung zum Empfehlungssystem
1. Daten laden und vorbereiten
Zuerst müssen wir den Datensatz laden und für das Training vorverarbeiten. Die wichtigsten Spalten sind visitorid, itemid und event. Wir filtern außerdem „view“-Ereignisse heraus und wandeln kategoriale Variablen (visitorid und itemid) in numerische Codes um, um den Speicherverbrauch zu optimieren.
Laden Sie den Datensatz:
Nur „Ansicht“-Ereignisse herausfiltern:
Um Speicherplatz zu sparen, können Besucher-ID und Artikel-ID in den Kategorietyp umgewandelt werden:
2. Erstellen Sie die Benutzer-Artikel-Matrix.
Als Nächstes wandeln wir die Spalten visitorid und itemid in numerische Werte um und erstellen eine dünnbesetzte Matrix, die als Eingabe für das LightFM-Modell dient. Wir verwenden SciPy, um eine dünnbesetzte Matrix zu erzeugen, da dies bei großen Datensätzen speichereffizient ist.
Besucher-ID und Artikel-ID in numerische Codes umwandeln:
Definiere die Matrixdimensionen:
4. Teilen Sie die Daten in Trainings- und Testdatensätze auf.
Wir teilen die Stichprobendaten nun mithilfe von `train_test_split` aus scikit-learn in Trainings- und Testdatensätze auf. Dies ermöglicht es uns, die Leistung des Empfehlungsmodells anhand unbekannter Daten zu evaluieren.
Teile die Daten in Trainings- und Testdatensätze auf.
Konvertiere die Trainings- und Testdaten in das Sparse-Format:
5. Trainieren Sie das LightFM-Modell
Nachdem wir die Daten aufbereitet haben, können wir das LightFM-Modell trainieren. Wir verwenden die WARP-Verlustfunktion (Weighted Approximate-Rank Pairwise), die sich für Empfehlungsaufgaben eignet.
Initialisiere das LightFM-Modell mit WARP-Verlust:
Starten Sie das Training des Modells:
Trainingszeit ausdrucken:
6. Das Modell auswerten.
Sobald das Modell trainiert ist, können wir seine Leistung anhand von Kennzahlen wie AUC (Area Under the Curve), Precision@10 und Recall@10 bewerten. Diese Kennzahlen geben uns Aufschluss darüber, wie gut das Modell funktioniert.
Berechnen Sie die AUC anhand der Testdaten:
Präzision@10 und Trefferquote@10 berechnen:
In diesem Tutorial haben wir mit der LightFM-Bibliothek ein einfaches Empfehlungssystem erstellt. Wir haben die einzelnen Schritte durchlaufen: Laden des Datensatzes, Vorverarbeitung der Daten, Training eines Empfehlungsmodells und Bewertung seiner Leistung. Das Modell kann je nach den spezifischen Anforderungen Ihrer Anwendung weiter angepasst und optimiert werden.
Anwendungsbereiche für Empfehlungssysteme
Nahezu jedes Unternehmen kann von einem Empfehlungssystem profitieren. Zwei wichtige Aspekte bestimmen, inwieweit ein Unternehmen von dieser Technologie profitieren kann.
- Die Datenbreite: Ein Unternehmen mit nur wenigen, unterschiedlich verhaltenden Kunden profitiert kaum von einem automatisierten Empfehlungssystem. Menschen lernen aus wenigen Beispielen immer noch deutlich besser als Maschinen. In solchen Fällen nutzen Ihre Mitarbeiter ihre Logik sowie ihr qualitatives und quantitatives Kundenverständnis, um präzise Empfehlungen auszusprechen.
- Die Datentiefe : Ein einzelner Datenpunkt pro Kunde ist für Empfehlungssysteme nicht hilfreich. Umfassende Daten über die Online-Aktivitäten und, wenn möglich, Offline-Käufe der Kunden ermöglichen präzise Empfehlungen.
Hier sind einige der häufigsten Branchen, in denen Empfehlungssysteme eingesetzt werden:
E-Commerce
E-Commerce-Plattformen nutzen Empfehlungssysteme, um das Einkaufserlebnis zu verbessern, indem sie den Nutzern relevante Produkte vorschlagen.
Diese Systeme analysieren frühere Käufe, den Browserverlauf und Präferenzen, um Artikel wie „Kunden, die diesen Artikel gekauft haben, kauften auch“ oder „Häufig zusammen gekauft“ zu empfehlen.
Dieser Prozess verbessert den Umsatz, steigert den durchschnittlichen Bestellwert und erhöht die Kundenzufriedenheit, indem er den Nutzern Zeit und Aufwand erspart.
Beispiel aus der Praxis: Amazon
Amazon.com nutzt auf den meisten Seiten seiner Website und in seinen E-Mail-Kampagnen kollaborative Filterempfehlungen, die auf Artikeln basieren. Laut McKinsey sind 35 % der Amazon-Käufe auf Empfehlungssysteme zurückzuführen. 1
Unterhaltung
In der Unterhaltungsbranche helfen Empfehlungssysteme Nutzern, Filme, Musik, Fernsehsendungen oder Bücher zu entdecken, die ihren Vorlieben entsprechen. Durch die Analyse von Seh- oder Hörgewohnheiten können diese Systeme personalisierte Inhalte bereitstellen, um die Nutzerbindung und die Verweildauer auf der Plattform zu erhöhen.
Beispiel aus der Praxis: Netflix
Netflix nutzt eine Kombination aus kollaborativem Filtern und inhaltsbasiertem Filtern, um Serien und Filme vorzuschlagen, was dazu führt, dass 80 % der angesehenen Inhalte auf Empfehlungen beruhen.
Der Netflix-Preis war ein Wettbewerb, den Netflix im Oktober 2006 ins Leben rief, um sein Filmempfehlungssystem zu verbessern. Das Preisgeld betrug eine Million US-Dollar für das Team oder die Einzelperson, die die Vorhersagegenauigkeit im Vergleich zum bestehenden Empfehlungsalgorithmus von Netflix um mindestens 10 % steigern konnte. 2
Beispiel aus der Praxis: Spotify
Spotify erstellt wöchentlich für jeden Abonnenten eine neue, personalisierte Playlist namens „Discover Weekly“. Diese enthält 30 Songs, die auf den individuellen Musikgeschmack des Nutzers abgestimmt sind. Durch die Übernahme von Echo Nest, einem Startup für Musikanalyse und Datenintelligenz, konnte Spotify eine Musikempfehlungs-Engine entwickeln, die drei verschiedene Empfehlungsmodelle nutzt: 3
- Kollaboratives Filtern: Filtern von Songs durch Vergleich der Hörhistorie eines Nutzers mit der Hörhistorie eines anderen Nutzers.
- Verarbeitung natürlicher Sprache: Das Internet wird nach Informationen über bestimmte Künstler und Lieder durchsucht. Jedem Künstler oder Lied wird eine dynamische Liste der wichtigsten Begriffe zugewiesen, die sich täglich ändert und nach Relevanz gewichtet wird. Anschließend ermittelt das System, ob zwei Musikstücke oder Künstler Ähnlichkeiten aufweisen.
- Analyse der Audiodateien: Der Algorithmus analysiert die Merkmale jeder einzelnen Audiodatei, einschließlich Tempo, Lautstärke, Tonart und Taktart, und gibt entsprechende Empfehlungen ab.
Soziale Medien
Soziale Medien nutzen Empfehlungssysteme, um basierend auf Nutzerinteraktionen, Präferenzen und Verbindungen Freunde, Gruppen, Seiten, Beiträge oder Werbung vorzuschlagen. Diese Vorschläge verbessern die Nutzerinteraktion, fördern die Entdeckung von Inhalten und generieren Werbeeinnahmen.
Beispiel aus der Praxis: Meta
Meta nutzt KI-Systeme, um personalisierte Inhaltsempfehlungen auf Facebook und Instagram bereitzustellen, selbst von Quellen, denen Nutzer nicht folgen. Dieser Ansatz verbessert die Nutzererfahrung durch vielfältigere Inhalte und unterstützt Content-Ersteller dabei, ein breiteres Publikum zu erreichen. Der Empfehlungsprozess umfasst Folgendes:
- Inhaltsverständnis: Nutzung von KI-Modellen zur Analyse und Interpretation verschiedener Inhaltstypen wie Bilder, Texte, Audio und Video, um deren semantische Bedeutung zu verstehen.
- Präferenzen erkennen, abrufen und einordnen: Entwicklung von Systemen, die große Mengen an Inhalten einfach filtern, um diejenigen zu identifizieren und einzuordnen, die für die Interessen des einzelnen Benutzers am relevantesten sind.
Diese KI-gestützte Strategie ermöglicht es Meta, Nutzern ansprechende Inhalte über ihr unmittelbares Netzwerk hinaus zu präsentieren, um eine tiefere Auseinandersetzung mit ihren Interessen zu fördern und die allgemeine Nutzung der Plattform zu verbessern. 4
Gesundheitspflege
Systeme zur Gesundheitsempfehlung schlagen Behandlungsoptionen, Gesundheitsressourcen oder Präventionsmaßnahmen vor, die auf Patientendaten wie Krankengeschichte und Lebensstil zugeschnitten sind. Der Einsatz von KI im Gesundheitswesen verbessert die Versorgungsqualität und senkt die Kosten. Erfahren Sie mehr über generative KI im Gesundheitswesen .
Praxisbeispiel: Ada Healthcare
Ada Health ist eine KI-gestützte Plattform, die Nutzern bei der Gesundheitsvorsorge hilft, indem sie personalisierte medizinische Beratung bietet. Nutzer können ihre Symptome eingeben und erhalten daraufhin Einschätzungen, die mögliche Erkrankungen aufzeigen und geeignete nächste Schritte empfehlen. Das KI-System der Plattform wird kontinuierlich von einem Team medizinischer Experten optimiert, um Genauigkeit und Zuverlässigkeit zu gewährleisten.
Neben Lösungen für Einzelnutzer bietet Ada auch Unternehmenslösungen zur Verbesserung der Gesundheitsversorgung an. Diese Lösungen unterstützen Partner bei fundierten Gesundheitsentscheidungen, der Optimierung von Triage-Prozessen und der Reduzierung vermeidbarer Kosten. 5
Einzelhandel
Im Einzelhandel werden Empfehlungssysteme für personalisierte Einkaufserlebnisse, Produktempfehlungen im Geschäft und Bestandsvorschläge eingesetzt. Diese Systeme helfen Einzelhändlern, die Lagerverwaltung zu optimieren, den Umsatz zu steigern und die Kundenzufriedenheit zu erhöhen.
Praxisbeispiel: Rappi mit Amazon Personalize
Rappi, ein On-Demand-Lieferdienst in Lateinamerika, kooperierte mit Amazon Personalize, um die Kundenbindung zu verbessern und den Umsatz durch die Implementierung eines personalisierten Empfehlungssystems in seiner App zu steigern.
Durch die Nutzung von Amazon Personalize entwickelte Rappi eine Funktion namens „Just For You“ (JFY), die das Nutzerverhalten und die Präferenzen analysiert, um maßgeschneiderte Produktempfehlungen in einem speziellen Bereich der App anzuzeigen.
Diese Personalisierungsstrategie führte zu einer Steigerung der Klickrate um 102 % und zu einem Umsatzplus von 147 % durch personalisierte Empfehlungen. Darüber hinaus verbesserte sich die Kundenbindung, und die Anzahl leistungsschwacher Produkte sank. 6
Finanzwesen und Bankwesen
Finanzinstitute nutzen Empfehlungssysteme, um Nutzern basierend auf ihrem Finanzverhalten und ihren Zielen Anlageoptionen, Kreditkarten oder Versicherungsprodukte vorzuschlagen. Erfahren Sie mehr über die Anwendungsmöglichkeiten von generativer KI im Bankwesen, indem Sie sich die Anwendungsfälle von GenAI ansehen.
Gaming
Gaming-Plattformen nutzen Empfehlungssysteme, um In-Game-Käufe und neue Spiele vorzuschlagen oder Spieler basierend auf ihren Vorlieben, Spielgewohnheiten und sozialen Interaktionen miteinander zu verbinden. Dies verbessert das Spielerlebnis und steigert den Umsatz.
Praxisbeispiel: Blick auf die Google-Cloud
Glance, eine Tochtergesellschaft von InMobi, hat sich mit Google Cloud zusammengetan, um ein personalisiertes Spielempfehlungssystem für ihre mobile Spieleplattform Nostra zu entwickeln, die über 220 Millionen Nutzer über Sperrbildschirme erreicht.
Durch die Analyse von Nutzer- und Spieldaten in Verbindung mit Interaktionsdaten identifizierten sie Muster wie optimale Spielzeiten und Spielpräferenzen. Diese Zusammenarbeit verbesserte das Nutzerengagement deutlich. 7
Diese Bereiche eignen sich besonders gut für Empfehlungssysteme, da sie Branchen umfassen, die große Mengen an Benutzer- und Artikeldaten generieren und somit eine solide Grundlage für präzise Vorhersagen und Erkenntnisse bieten.
Die Nutzer in diesen Bereichen erwarten zunehmend personalisierte Erlebnisse, die auf ihre Präferenzen zugeschnitten sind, wodurch Empfehlungen zu einem entscheidenden Faktor für die Erfüllung der Kundenanforderungen werden.
Darüber hinaus eröffnen Empfehlungssysteme erhebliche Umsatzpotenziale durch Upselling, Cross-Selling und höhere Interaktionsraten. Durch personalisierte Vorschläge verbessern diese Systeme die Kundenbindung, fördern langfristige Loyalität und nachhaltige Nutzerinteraktion.
LLM-basierte Empfehlungssysteme
Herkömmliche Empfehlungssysteme analysieren strukturierte Daten wie Bewertungen und Klicks. LLM-basierte Systeme gehen darüber hinaus, indem sie Anfragen in natürlicher Sprache verstehen, differenzierte Präferenzen interpretieren und ihre Vorschläge erläutern.
Dieser Ansatz bietet gegenüber herkömmlichen Methoden mehrere Vorteile:
- Semantisches Verständnis komplexer Anfragen wie „etwas Aufmunterndes, aber nicht zu Kitschiges“ jenseits der reinen Stichwortübereinstimmung
- Kaltstartlösungen, bei denen neue Benutzer ihre Präferenzen in natürlicher Sprache beschreiben, anstatt auf die Interaktionshistorie angewiesen zu sein.
- Erklärbare Ergebnisse, die darlegen, warum eine Empfehlung ausgesprochen wurde
- Domänenübergreifendes Denken über Kategorien hinweg durch das Verständnis zugrunde liegender Präferenzen
Beispiele aus der Praxis:
- Netflix entwickelte ein grundlegendes Modell für personalisierte Empfehlungen, indem es die Benutzerinteraktionshistorie als Token behandelte und Transformer-basierte Architekturen anwandte.
- Spotify AI DJ kombiniert Hörverlauf mit generativer KI, um personalisierte Kommentare und Musikauswahlen zu erstellen.
- Amazon Rufus ist ein KI-gestützter Einkaufsassistent, der die Produktsuche in natürlicher Sprache ermöglicht.
Einrichten eines Empfehlungssystems
Während die meisten Unternehmen von der Übernahme einer bestehenden Lösung profitieren würden, könnten Unternehmen in Nischenkategorien oder mit sehr großem Umfang mit dem Aufbau einer eigenen Empfehlungsmaschine experimentieren.
1. Verwendung einer Standardlösung
Empfehlungssysteme gehören zu den frühesten und ausgereiftesten Anwendungsfällen von KI.
Zu den Vorteilen dieses Ansatzes gehören die schnelle Umsetzung und die in den meisten Fällen hohe Genauigkeit der Ergebnisse:
- Für den Anfang kann es genügen, einen Codeausschnitt des Anbieters beizufügen.
- Die Lösungen sind in der Regel präzise, da die Anbieter Daten aus Tausenden von Kundentransaktionen in anonymisierter Form nutzen, um ihre Modelle zu verbessern.
Um das richtige System auszuwählen, können Sie historische oder, noch besser, Live-Daten verwenden, um die Effektivität verschiedener Systeme schnell zu testen.
2. Eine eigene Lösung entwickeln
Dies kann sinnvoll sein, wenn:
- Sie befinden sich in einem Nischenbereich, in dem Empfehlungssysteme bisher nicht eingesetzt wurden, oder
- Sie besitzen einen der weltweit größten Marktplätze, auf dem schon geringfügig bessere Empfehlungen einen wichtigen Unterschied für Ihre Geschäftsergebnisse ausmachen können.
Heutige Empfehlungssysteme basieren auf Logik wie: Kunden mit ähnlichem Kauf- und Browserverlauf kaufen zukünftig ähnliche Produkte. Damit ein solches System funktioniert, benötigen Sie entweder eine große Anzahl historischer Transaktionen oder detaillierte Daten zum Nutzerverhalten auf anderen Websites. Falls Sie solche Daten benötigen, können Sie diese auf Datenmarktplätzen suchen.
Mehr Daten und bessere Algorithmen verbessern die Empfehlungen. Sie sollten alle relevanten Daten in Ihrem Unternehmen nutzen und Ihre Kundendaten durch Daten von Drittanbietern erweitern. Wenn ein Stammkunde von Ihnen auf anderen Websites nach roten Sneakern sucht, warum sollten Sie ihm nicht ein passendes Paar auf Ihrer Website präsentieren?
3. Zusammenarbeit mit einem Berater zur Entwicklung eigener Lösungen
Eine nur geringfügig verbesserte Empfehlungs-Engine könnte den Umsatz eines Unternehmens um einige Prozentpunkte steigern, was die Rentabilität eines Unternehmens mit geringen Gewinnmargen erheblich verbessern könnte. Daher kann es sinnvoll sein, in die Entwicklung besserer Empfehlungs-Engines zu investieren, wenn das Unternehmen mit den bestehenden Lösungen auf dem Markt keine zufriedenstellenden Ergebnisse erzielt.
4. Einen Data-Science-Wettbewerb veranstalten, um eine eigene Lösung zu entwickeln
Ein möglicher Ansatz besteht darin, die kollektive Intelligenz zu nutzen, um solche Systeme zu entwickeln. Unternehmen können verschlüsselte historische Daten verwenden, Data-Science-Wettbewerbe veranstalten oder mit Beratern zusammenarbeiten und Modelle erhalten, die hochwirksame Empfehlungen liefern.
Wie wählt man ein Empfehlungssystem aus?
Die Wahl des richtigen Empfehlungssystems hängt von Ihren Geschäftszielen, den verfügbaren Daten und den Ihnen zur Verfügung stehenden technischen Ressourcen ab. Hier einige wichtige Aspekte:
- Modellbewertung Ihrer Daten
- Es ist unerlässlich, Modelle anhand eigener Daten zu testen, um ihre Leistungsfähigkeit im spezifischen Kontext zu überprüfen. Standardisierte Benchmarks spiegeln möglicherweise nicht die Bedürfnisse Ihrer Nutzer, Produkte oder Geschäftsziele wider.
- Datentyp verfügbar
- Explizite Daten (Bewertungen, Rezensionen, Likes) eignen sich gut für kollaboratives Filtern.
- Implizite Daten (Klicks, Verweildauer, Käufe) sprechen für hybride oder Deep-Learning-Ansätze.
- Geschäftsziele
- Wenn Ihr Ziel die Personalisierung in großem Umfang ist, sind Deep Learning oder Hybridsysteme die besten Optionen.
- Für schnelle Experimente können einfachere Modelle, wie zum Beispiel die Matrixfaktorisierung, ausreichen.
- Skalierbarkeitsanforderungen
- Groß angelegte Plattformen (z. B. E-Commerce, Streaming) benötigen oft auf Deep Learning basierende oder Cloud-basierte Lösungen, die Millionen von Benutzern und Artikeln verarbeiten können.
- Domänenwissen & Ressourcen
- Wenn Ihrem Team die Expertise im Bereich maschinelles Lernen fehlt, kann die Nutzung von Anbieterlösungen (z. B. Amazon Personalize, Recommendations AI) die Implementierung beschleunigen.
- Für hochspezialisierte Bereiche kann die Entwicklung einer internen Lösung erforderlich sein.
Tipp: Beginnen Sie mit der Entwicklung eines Prototyps mithilfe von Standardbibliotheken (LightFM, TensorFlow Recommenders) und bewerten Sie die Leistung anhand Ihrer Live-Daten, bevor Sie skalieren.
Kosten der Implementierung von Empfehlungssystemen
Die Implementierung eines Empfehlungssystems ist mit direkten und indirekten Kosten verbunden:
- Entwicklungszeit : Die Erstellung kundenspezifischer Modelle erfordert Datenwissenschaftler, Ingenieure und Infrastrukturteams. Die Entwicklungszeit kann von wenigen Wochen (für Prototypen) bis zu mehreren Monaten (für Produktionssysteme) reichen.
- Infrastrukturkosten : 21833
- Vor Ort : Erfordert GPU-Server, Datenbanken und laufende Wartung.
- Cloudbasiert : Die Kosten skalieren mit der Datengröße und der API-Nutzung (AWS, GCP, Azure).
- Anbietergebühren : Bei SaaS-basierten Lösungen können die Gebühren auf der Grundlage der Anzahl der API-Aufrufe, der Anzahl der Benutzer oder der Menge der verarbeiteten Daten berechnet werden.
- Laufende Kosten : 21833
- Modellnachschulung, -überwachung und -aktualisierung.
- Mögliche Kosten der Integration externer Datenquellen zur Verbesserung der Empfehlungen.
Faustregel: Kleine Unternehmen können mit SaaS-Tools (unter 10.000 US-Dollar pro Jahr) beginnen, während Unternehmen, die eigene Systeme entwickeln, oft Millionen in Infrastruktur und Fachkräfte investieren.
Ethische Implikationen von Empfehlungssystemen
Empfehlungssysteme bieten zwar einen Mehrwert, werfen aber wichtige ethische und soziale Fragen auf:
- Voreingenommenheit und Fairness : Algorithmen können bestehende Voreingenommenheiten verstärken (z. B. indem sie nur populäre Inhalte empfehlen und Vielfalt ignorieren).
- Datenschutzbedenken :
- Das Sammeln und Analysieren von Nutzerdaten wirft Bedenken hinsichtlich Einwilligung und Datenschutz auf.
- Die Einhaltung der DSGVO, des CCPA und anderer Datenschutzgesetze ist von entscheidender Bedeutung.
- Verantwortungsvoller Umgang mit Daten :
- Transparente Richtlinien sollten erklären, wie Benutzerdaten erfasst, verarbeitet und gespeichert werden.
- Techniken zur differenziellen Privatsphäre und Anonymisierung können Risiken mindern.
Benchmark-Methodik für Empfehlungssysteme
In dieser Studie konzentrierten wir uns auf die Entwicklung und Evaluierung von Empfehlungssystemen auf Basis impliziter Feedbackdaten, insbesondere Nutzerinteraktionen mit Produkten. Der in unserer Analyse verwendete Datensatz enthält drei Schlüsselelemente: Besucher-ID, Artikel-ID und Interaktionstypen wie Ansehen , Hinzufügen zum Warenkorb und Kauf . Da Nutzer Artikel nicht explizit bewerteten, sondern durch diese Verhaltensweisen interagierten, betrachteten wir diese Daten als implizites Feedback.
Wir haben drei verschiedene Empfehlungsmodelle getestet, um ihre Effektivität im Umgang mit impliziten Daten zu bewerten:
- LightFM : Ein Hybridmodell, das kollaboratives Filtern und inhaltsbasierte Methoden kombiniert. Wir nutzten die WARP-Verlustfunktion (Weighted Approximate-Rank Pairwise), um das Modell zu trainieren. Der Fokus lag auf der Vorhersage der Wahrscheinlichkeit, mit der ein Nutzer ein Produkt ansieht, indem seine bisherigen Interaktionen mit Artikeln analysiert wurden.
- Cornac BPR (Bayesian Personalized Ranking) : Ein auf kollaborativem Filtern basierendes Modell zur Rangfolge von Elementen anhand von Nutzerinteraktionen. Es nutzt implizites Feedback, um die Präferenzen der Nutzer zu lernen, indem es die Rangfolge relevanter Elemente gegenüber irrelevanten optimiert.
- TensorFlow Recommenders : Ein auf Deep Learning basierendes Framework, das Einbettungen verwendet, um sowohl Nutzer als auch Artikel darzustellen und komplexe Beziehungen zwischen ihnen abzubilden. Das Modell wird anhand impliziter Interaktionen trainiert und dient der Vorhersage der relevantesten Artikel für jeden Nutzer.
Die Modelle wurden trainiert, um die Wahrscheinlichkeit einer Interaktion eines Nutzers mit einem Produkt vorherzusagen, wobei der Fokus insbesondere auf dem Betrachten des Produkts lag. Unser Ziel war es, basierend auf dem bisherigen Verhalten der Nutzer abzuschätzen, mit welchen Produkten sie am ehesten interagieren werden. Nach dem Training evaluierten wir die Modelle anhand von Testdaten, um sicherzustellen, dass sie auch auf unbekannte Interaktionen gut generalisieren können.
Wir bewerteten die Leistungsfähigkeit der Modelle anhand von drei gängigen Metriken in Empfehlungssystemen:
- AUC (Fläche unter der Kurve) : Eine Kennzahl, die bewertet, wie gut das Modell relevante Elemente höher als irrelevante einordnet. Ein AUC-Wert nahe 1 deutet auf eine bessere Ranking-Leistung hin.
- Precision@10 : Misst, wie viele der 10 am häufigsten empfohlenen Elemente tatsächlich relevant sind (d. h. vom Nutzer genutzt wurden). Höhere Werte weisen auf eine höhere Genauigkeit der Empfehlungen hin.
- Recall@10 : Misst, wie viele relevante Elemente (aus den Interaktionen des Nutzers) unter den Top-10-Empfehlungen erscheinen. Diese Kennzahl ist entscheidend, um zu verstehen, wie gut das Modell die Nutzerpräferenzen abbildet.
Durch den Vergleich dieser Kennzahlen in den drei Modellen haben wir das leistungsstärkste Modell ermittelt, das sowohl relevante Elemente korrekt einordnet als auch diese Elemente präzise in den Top-Empfehlungen abruft.
Abschluss
Empfehlungssysteme haben sich als wirksam erwiesen, um die Kundenbindung zu stärken und das Unternehmenswachstum voranzutreiben. Durch die Analyse von Nutzerpräferenzen und -verhalten bieten diese Systeme personalisierte Vorschläge, die zu höheren Umsätzen, verbesserter Kundentreue und geringerer Kundenabwanderung beitragen.
Erkenntnisse aus verschiedenen Branchen zeigen, dass E-Commerce-Plattformen Steigerungen der Konversionsraten und des durchschnittlichen Bestellwerts verzeichnen konnten, während Unterhaltungsplattformen durch personalisierte Inhaltsempfehlungen eine gesteigerte Nutzerbindung feststellen konnten.
Branchen wie E-Commerce, Unterhaltung, soziale Medien, Einzelhandel, Gesundheitswesen und Finanzen profitieren von der Implementierung von Empfehlungssystemen.
Im Gesundheits- und Finanzwesen haben Empfehlungssysteme personalisierte Dienstleistungen ermöglicht und so die Kundenzufriedenheit und die Behandlungsergebnisse verbessert. Diese Ergebnisse belegen die Wirksamkeit von Empfehlungssystemen hinsichtlich der Optimierung der Nutzererfahrung und der Steigerung der Unternehmensleistung in verschiedenen Branchen.
Seien Sie der Erste, der kommentiert
Ihre E-Mail-Adresse wird nicht veröffentlicht. Alle Felder sind erforderlich.