Les systèmes de recommandation profitent aux entreprises comme aux clients en utilisant les données pour personnaliser l'expérience. Ils contribuent à augmenter les ventes, à fidéliser la clientèle et à réduire le taux de désabonnement en simplifiant les choix et en maintenant l'engagement des utilisateurs.
Nous avons comparé trois bibliothèques de recommandation Python : LightFM, Cornac BPR et TensorFlow Recommenders, en utilisant le même ensemble de données à rétroaction implicite et des étapes de prétraitement identiques.
Nous avons entraîné chaque modèle sur les mêmes données, nous les avons évalués à l'aide de l'AUC, de la précision à 10 et du rappel à 10, et nous avons comparé leur capacité à classer et à récupérer les éléments pertinents dans les k meilleures recommandations.
Meilleures bibliothèques Python pour les systèmes de recommandation
Ces bibliothèques mettent en œuvre des algorithmes d'apprentissage automatique pour traiter les données d'entraînement et générer des recommandations personnalisées grâce à des techniques de filtrage collaboratif ou basé sur le contenu. Elles intègrent également des modèles d'apprentissage automatique pour analyser les données et identifier des tendances, permettant ainsi au moteur de recommandation de suggérer des articles pertinents en fonction du comportement et des préférences de l'utilisateur.
Fonctionnalité | LightFM | Cornac (BPR) | TensorFlow |
|---|---|---|---|
Type de modèle | Hybride (collaboratif + basé sur le contenu) | Factorisation matricielle (BPR) | Collaboratif, axé sur le contenu ou hybride |
Type de données | Explicite et implicite | Implicite | Explicite et implicite |
Support du contenu | Oui (Fonctionnalités utilisateur/article) | Non | Oui (via des tours de fonctionnalités, des intégrations, etc.) |
Démarrage à froid | Gestion partielle (via les fonctionnalités de contenu) | Non | Oui (si des fonctionnalités de contenu sont utilisées) |
Évaluation | Précision@K, AUC, Rappel@K | NDCG, Precision@K,AUC,Precision@K | Précision@K, Rappel@K, AUC |
Cas d'utilisation | Systèmes hybrides, utilisation des métadonnées | Classement des retours implicites | Systèmes de recommandation à usage général et hautement personnalisables |
Résultats de la comparaison entre LightFM, Cornac BPR et TensorFlow
Recommandations TensorFlow Cornac BPR a obtenu les meilleurs résultats. Son architecture d'apprentissage profond lui permet de saisir des relations utilisateur-article plus complexes. LightFM, performant lorsque des métadonnées sont disponibles, a obtenu des résultats moins bons ici, car nous n'avons utilisé que des données comportementales ; il a néanmoins surpassé BPR. Cornac BPR a affiché la plus faible qualité de recommandation, ce qui le rend plus adapté aux tests rapides ou aux applications à petite échelle.
Nous avons utilisé notre méthodologie d'évaluation comparative des moteurs de recommandation pour tester LightFM, Cornac BPR et TensorFlow.
Qu'est-ce qu'un système de recommandation ?
Un système de recommandation est un outil conçu pour fournir des suggestions personnalisées aux utilisateurs en fonction de leurs préférences, de leur comportement et de leurs interactions avec une plateforme. Ces systèmes analysent des données telles que l'historique d'achats, l'historique de navigation, les données démographiques des utilisateurs et les informations contextuelles afin de proposer un contenu pertinent. Voici les types de systèmes de recommandation les plus courants :
Techniques de filtrage collaboratif :
- D'après les schémas d'interaction entre les utilisateurs et les articles.
- Inclut le filtrage collaboratif basé sur les utilisateurs (recherche d'utilisateurs similaires) et le filtrage collaboratif basé sur les articles (recherche d'articles similaires).
- Idéal pour le commerce électronique et les services de streaming.
Techniques de filtrage basées sur le contenu :
- Elle se concentre sur les attributs des articles (caractéristiques des articles) et sur les interactions passées de l'utilisateur (préférences de l'utilisateur).
- Idéal pour identifier les intérêts spécifiques de l'utilisateur cible.
Systèmes de recommandation hybrides :
- Combinez le filtrage collaboratif et les méthodes basées sur le contenu.
- Exploite des modèles d'apprentissage automatique tels que les réseaux neuronaux profonds et les réseaux neuronaux récurrents pour des prédictions améliorées.
concepts clés des systèmes de recommandation
Principes de base de la factorisation matricielle
La factorisation matricielle est une technique fondamentale du filtrage collaboratif. Elle décompose une grande matrice d'interactions utilisateur-élément (par exemple, les notes ou les clics) en matrices plus petites qui capturent des modèles ou des relations cachés, appelés caractéristiques latentes.
Cette approche permet de réduire la complexité des données et de dégager des informations pertinentes, comme les préférences d'un utilisateur pour des genres spécifiques ou l'attrait d'un article pour un groupe particulier.
Comprendre les données implicites
Les données implicites désignent les indicateurs indirects des préférences des utilisateurs, obtenus à partir de leurs comportements plutôt que de retours explicites comme les notes. Parmi les exemples de données implicites, on peut citer les taux de clics, le temps passé sur une page, l'historique d'achats et les habitudes de recherche.
Ce type de données est plus facile à collecter à grande échelle et reflète souvent l'engagement réel. Cependant, il peut être bruité ou ambigu, par exemple lorsqu'il est difficile d'interpréter si une longue visite de page indique un intérêt ou une distraction.
L'apprentissage profond dans les recommandations
L'apprentissage profond alimente les systèmes de recommandation en analysant des données complexes et multidimensionnelles grâce à des réseaux neuronaux. Il est particulièrement efficace pour les recommandations basées sur la session, la compréhension du contenu et les suggestions contextuelles qui tiennent compte de l'heure, du lieu ou de l'humeur de l'utilisateur.
Ces méthodes peuvent traiter des données volumineuses et non structurées comme du texte, des images et des vidéos, en apprenant les relations complexes entre les caractéristiques.
Approches de recommandation hybrides
Les systèmes de recommandation hybrides combinent différentes techniques, telles que le filtrage collaboratif, le filtrage basé sur le contenu et les approches basées sur les connaissances. Cette intégration améliore la précision et résout des problèmes comme le démarrage à froid (nouveaux utilisateurs ou articles) et la rareté des données.
Tutoriel : créer un système de recommandation avec LightFM
Dans ce tutoriel, nous allons créer un moteur de recommandation avec LightFM en exploitant les données implicites issues des interactions utilisateur-produit. Ces données d'entraînement, comprenant différents types de données clients, permettent au modèle d'apprendre les préférences des utilisateurs et d'effectuer des prédictions précises.
Le modèle LightFM que nous développons prédit les produits qu'un utilisateur est susceptible de consulter en estimant ses interactions potentielles avec des articles non vus. Ce modèle analyse les données pour effectuer ces prédictions précises, garantissant ainsi des recommandations personnalisées en fonction du comportement de l'utilisateur.
Prérequis
Avant de commencer, assurez-vous d'avoir installé les bibliothèques nécessaires. Si ce n'est pas le cas, vous pouvez les installer via pip :
Pour les systèmes de recommandation plus avancés, des bibliothèques de traitement du langage naturel peuvent également être nécessaires.
Aperçu du jeu de données
Dans ce tutoriel, nous utiliserons un jeu de données de commerce électronique de détail, contenant des informations sur les interactions des utilisateurs avec les produits. Ce jeu de données comprend les colonnes suivantes :
- visitorid : Un identifiant unique pour le visiteur (utilisateur).
- itemid : Un identifiant unique pour l'article (produit).
- événement : L’événement d’interaction ; dans ce cas, seuls les événements « view » nous intéressent.
L'ensemble de données peut également contenir des données non structurées qui doivent être traitées.
Voici un exemple d'entrée dans l'ensemble de données :
Par souci de simplicité, nous allons ne retenir que les événements de « vue » où les utilisateurs ont interagi avec les produits. Nous utiliserons ensuite ces informations pour construire le modèle de recommandation.
Guide étape par étape du système de recommandation
1. Charger et préparer les données
Il faut d'abord charger le jeu de données et le prétraiter pour l'entraînement. Les colonnes essentielles sont visitorid, itemid et event. Nous filtrerons également les événements de type « view » et convertirons les variables catégorielles (visitorid et itemid) en codes numériques afin d'optimiser l'utilisation de la mémoire.
Charger l'ensemble de données :
Filtrer uniquement les événements « view » :
Convertissez visitorid et itemid en type catégorie pour économiser de la mémoire :
2. Créer la matrice utilisateur-article
Ensuite, nous convertirons les colonnes visitorid et itemid en valeurs numériques et construirons une matrice creuse qui servira d'entrée au modèle LightFM. Nous utiliserons scipy pour créer cette matrice, ce qui permet une utilisation efficace de la mémoire pour les grands ensembles de données.
Convertir visitorid et itemid en codes numériques :
Définir les dimensions de la matrice :
4. Divisez les données en ensembles d'entraînement et de test.
Nous allons maintenant diviser les données échantillonnées en ensembles d'entraînement et de test à l'aide de la fonction `train_test_split` de scikit-learn. Cela nous permettra d'évaluer les performances du modèle de recommandation sur des données non vues lors de l'entraînement.
Divisez les données en ensembles d'entraînement et de test.
Convertissez les données d'entraînement et de test au format clairsemé :
5. Entraîner le modèle LightFM
Maintenant que les données sont prêtes, nous pouvons entraîner le modèle LightFM. Nous utiliserons la fonction de perte WARP (Weighted Approximate-Rank Pairwise), qui est efficace pour les tâches de recommandation.
Initialiser le modèle LightFM avec perte WARP :
Commencez l'entraînement du modèle :
Imprimer la durée de l'entraînement :
6. Évaluer le modèle
Une fois le modèle entraîné, nous pouvons évaluer ses performances à l'aide de métriques telles que l'AUC (aire sous la courbe), la précision à 10 et le rappel à 10. Ces métriques nous donnent des indications sur la performance du modèle.
Calculer l'AUC sur les données de test :
Calculer la précision à 10 et le rappel à 10 :
Dans ce tutoriel, nous avons créé un système de recommandation simple à l'aide de la bibliothèque LightFM. Nous avons abordé le processus de chargement et de prétraitement des données, l'entraînement d'un modèle de recommandation et l'évaluation de ses performances. Ce modèle peut être affiné et optimisé en fonction des besoins spécifiques de votre application.
Domaines d'application des systèmes de recommandation
Presque toutes les entreprises peuvent tirer profit d'un système de recommandation. Deux aspects importants déterminent le niveau de bénéfice qu'une entreprise peut retirer de cette technologie.
- L'étendue des données : Une entreprise qui ne compte qu'une poignée de clients aux comportements variés ne tirera que peu d'avantages d'un système de recommandation automatisé. L'humain reste bien plus performant que la machine pour apprendre à partir de quelques exemples. Dans ce cas, vos employés s'appuieront sur leur logique et leur compréhension qualitative et quantitative des clients pour formuler des recommandations pertinentes.
- La richesse des données : Se contenter d’une seule donnée par client est insuffisant pour les systèmes de recommandation. Des données détaillées sur les activités en ligne des clients et, si possible, leurs achats hors ligne permettent de formuler des recommandations pertinentes.
Voici quelques-uns des secteurs d'activité les plus courants où les systèmes de recommandation sont appliqués :
commerce électronique
Les plateformes de commerce électronique exploitent les systèmes de recommandation pour améliorer l'expérience d'achat en suggérant des produits pertinents aux utilisateurs.
Ces systèmes analysent les achats précédents, l'historique de navigation et les préférences afin de recommander des articles tels que « Les clients qui ont acheté cet article ont également acheté » ou « Articles fréquemment achetés ensemble ».
Ce processus améliore les ventes et augmente la valeur moyenne des commandes, tout en renforçant la satisfaction client grâce aux gains de temps et d'efforts réalisés par les utilisateurs.
Exemple concret : Amazon
Amazon.com utilise des recommandations de filtrage collaboratif entre articles sur la plupart des pages de son site web et dans ses campagnes par e-mail. Selon McKinsey, 35 % des achats sur Amazon sont effectués grâce à ces systèmes de recommandation. 1
Divertissement
Dans le secteur du divertissement, les systèmes de recommandation aident les utilisateurs à découvrir des films, de la musique, des séries télévisées ou des livres adaptés à leurs goûts. En analysant leurs habitudes de visionnage ou d'écoute, ces systèmes peuvent proposer un contenu personnalisé afin d'accroître l'engagement des utilisateurs et le temps passé sur la plateforme.
Exemple concret : Netflix
Netflix utilise une combinaison de filtrage collaboratif et de filtrage basé sur le contenu pour suggérer des séries et des films, ce qui explique que 80 % du contenu visionné soit généré par des recommandations.
Le Prix Netflix était un concours lancé par Netflix en octobre 2006 afin d'améliorer son système de recommandation de films. Le défi offrait un prix d'un million de dollars à l'équipe ou à la personne capable d'améliorer d'au moins 10 % la précision des prédictions par rapport à l'algorithme de recommandation existant de Netflix. 2
Exemple concret : Spotify
Chaque semaine, Spotify génère une nouvelle playlist personnalisée pour chaque abonné, intitulée « Découvertes de la semaine », composée de 30 titres basés sur les goûts musicaux uniques de chaque utilisateur. L'acquisition d'Echo Nest, une startup spécialisée dans l'analyse de données et l'intelligence musicale, lui permet de créer un moteur de recommandation musicale utilisant trois types de modèles différents : 3
- Filtrage collaboratif : filtrage des chansons en comparant les données d’écoute historiques des utilisateurs avec celles d’autres utilisateurs.
- Traitement automatique du langage naturel : extraction de données sur Internet concernant des artistes et des chansons spécifiques. Chaque artiste ou chanson se voit attribuer une liste dynamique de termes clés, mise à jour quotidiennement et pondérée selon sa pertinence. Le système détermine ensuite si deux morceaux ou artistes sont similaires.
- Analyse des fichiers audio : L’algorithme analyse les caractéristiques de chaque fichier audio, notamment le tempo, le volume, la tonalité et la signature rythmique, et formule des recommandations en conséquence.
Réseaux sociaux
Les plateformes de médias sociaux utilisent des systèmes de recommandation pour suggérer des amis, des groupes, des pages, des publications ou des publicités en fonction des interactions, des préférences et des connexions des utilisateurs. Ces suggestions enrichissent l'interaction entre les utilisateurs, favorisent la découverte de contenu et génèrent des revenus publicitaires.
Exemple concret : Meta
Meta utilise des systèmes d'IA pour proposer des recommandations de contenu personnalisées sur Facebook et Instagram, même provenant de sources que les utilisateurs ne suivent pas. Cette approche améliore l'expérience utilisateur en présentant des contenus variés et aide les créateurs à toucher un public plus large. Le processus de recommandation comprend :
- Compréhension du contenu : Utilisation de modèles d’IA pour analyser et interpréter différents types de contenu, notamment les images, le texte, l’audio et la vidéo, afin d’en comprendre le sens sémantique.
- Compréhension, récupération et classement des préférences : développer des systèmes qui filtrent facilement de grandes quantités de contenu afin d’identifier et de classer ceux qui sont les plus pertinents pour les intérêts de chaque utilisateur.
Cette stratégie basée sur l'IA permet à Meta de présenter aux utilisateurs un contenu engageant au-delà de leur réseau immédiat afin de favoriser une exploration plus approfondie de leurs intérêts et d'améliorer l'engagement global sur la plateforme. 4
Soins de santé
Les systèmes de recommandation en santé proposent des options de traitement, des ressources de santé ou des mesures préventives personnalisées en fonction des données du patient, comme ses antécédents médicaux et son mode de vie. L'intégration de l'IA dans le secteur de la santé améliore la qualité des soins et réduit les coûts. Découvrez l'IA générative en santé pour en savoir plus.
Exemple concret : Ada Healthcare
Ada Health est une plateforme d'intelligence artificielle conçue pour aider les utilisateurs à gérer leur santé en leur fournissant des conseils médicaux personnalisés. Les utilisateurs peuvent saisir leurs symptômes pour recevoir des évaluations suggérant des pathologies possibles et recommandant les démarches à suivre. Le système d'IA de la plateforme est optimisé en continu par une équipe d'experts médicaux afin de garantir sa précision et sa fiabilité.
Outre ses services aux particuliers, Ada propose des solutions d'entreprise visant à améliorer les résultats en matière de santé. Ces solutions aident les partenaires à éclairer les décisions de santé, à optimiser les processus de triage et à réduire les coûts évitables. 5
Vente au détail
Dans le secteur du commerce de détail, les systèmes de recommandation permettent de personnaliser l'expérience d'achat, de proposer des suggestions en magasin et d'optimiser la gestion des stocks. Ils aident ainsi les détaillants à améliorer leurs ventes et à accroître la satisfaction de leurs clients.
Exemple concret : Rappi avec Amazon Personalize
Rappi, un service de livraison à la demande en Amérique latine, a collaboré avec Amazon Personalize pour améliorer l'engagement client et stimuler les ventes en mettant en œuvre un système de recommandations personnalisées au sein de son application.
En tirant parti d'Amazon Personalize, Rappi a développé une fonctionnalité appelée « Just For You » (JFY), qui analyse le comportement et les préférences des utilisateurs pour fournir des recommandations de produits personnalisées affichées dans une section dédiée de l'application.
Cette stratégie de personnalisation a permis d'augmenter de 102 % le taux de clics et de 147 % le chiffre d'affaires généré par les recommandations personnalisées. Par ailleurs, l'engagement client s'est amélioré et le nombre de produits peu performants a diminué. 6
Finance et banque
Les institutions financières utilisent des systèmes de recommandation pour suggérer des options d'investissement, des cartes de crédit ou des produits d'assurance en fonction du comportement financier et des objectifs de l'utilisateur. Découvrez des cas d'utilisation de l'IA générative dans le secteur bancaire pour en savoir plus sur ses applications en finance et en banque.
Jeux
Les plateformes de jeux utilisent des systèmes de recommandation pour suggérer des achats intégrés, de nouveaux jeux ou mettre en relation les joueurs en fonction de leurs préférences, de leurs habitudes de jeu et de leurs interactions sociales. Cela améliore l'expérience de jeu et génère des revenus.
Exemple concret : Coup d'œil avec le nuage Google
Glance, une filiale d'InMobi, s'est associée à Google Cloud pour construire un système de recommandation de jeux personnalisé pour leur plateforme de jeux mobiles, Nostra, qui engage plus de 220 millions d'utilisateurs via des écrans de verrouillage.
En analysant les données des utilisateurs et des jeux, ainsi que les données d'interaction, ils ont identifié des tendances telles que les périodes d'engagement optimales et les préférences de jeu. Cette collaboration a permis d'améliorer significativement l'engagement des utilisateurs. 7
Ces domaines sont particulièrement adaptés aux systèmes de recommandation car ils concernent des secteurs qui génèrent de grands volumes de données sur les utilisateurs et les produits, offrant ainsi une base solide pour des prédictions et des analyses précises.
Dans ces domaines, les utilisateurs attendent de plus en plus des expériences personnalisées et adaptées à leurs préférences, ce qui fait des recommandations un élément essentiel pour répondre aux exigences des clients.
De plus, les systèmes de recommandation offrent d'importantes opportunités de revenus en stimulant les ventes additionnelles et croisées, et en augmentant les taux d'engagement. En proposant des suggestions personnalisées, ces systèmes améliorent la fidélisation client, favorisant ainsi une loyauté durable et une interaction utilisateur soutenue.
Systèmes de recommandation basés sur le LLM
Les systèmes de recommandation traditionnels analysent des données structurées comme les notes et les clics. Les systèmes basés sur le LLM vont plus loin : ils comprennent les requêtes en langage naturel, interprètent les préférences nuancées et expliquent leurs suggestions.
Cette approche présente plusieurs avantages par rapport aux méthodes traditionnelles :
- Compréhension sémantique de requêtes complexes telles que « quelque chose de réconfortant mais pas trop mièvre » au-delà de la simple correspondance de mots-clés
- Solutions de démarrage à froid où les nouveaux utilisateurs décrivent leurs préférences en langage naturel, sans avoir besoin d'historique d'interaction.
- Des résultats explicables qui expliquent pourquoi une recommandation a été formulée.
- Raisonnement interdomaines entre catégories en comprenant les préférences sous-jacentes
Exemples concrets :
- Netflix a développé un modèle de base pour les recommandations personnalisées, traitant l'historique des interactions des utilisateurs comme des jetons et appliquant des architectures basées sur des transformateurs.
- Spotify AI DJ combine l'historique d'écoute avec l'IA générative pour créer des commentaires et des sélections musicales personnalisés.
- Amazon Rufus est un assistant d'achat génératif basé sur l'IA qui permet la découverte de produits en langage naturel.
Mise en place d'un système de recommandation
Alors que la plupart des entreprises tireraient profit de l'adoption d'une solution existante, celles qui opèrent dans des secteurs de niche ou à très grande échelle pourraient expérimenter la création de leur propre moteur de recommandation.
1. Utiliser une solution prête à l'emploi
Les systèmes de recommandation constituent l'un des cas d'utilisation de l'IA les plus anciens et les plus aboutis.
Les avantages de cette approche incluent une mise en œuvre rapide et des résultats très précis dans la plupart des cas :
- Inclure un extrait de code du fournisseur peut suffire pour commencer.
- Les solutions proposées ont tendance à être précises car les fournisseurs utilisent les données anonymisées de milliers de transactions de leurs clients pour améliorer leurs modèles.
Pour choisir le système adéquat, vous pouvez utiliser des données historiques ou, mieux encore, des données en temps réel afin de tester rapidement l'efficacité des différents systèmes.
2. Créer votre propre solution
Cela peut être judicieux si :
- vous évoluez dans un domaine de niche où les moteurs de recommandation n'étaient pas utilisés auparavant ou
- Vous possédez l'une des plus grandes places de marché au monde, où des recommandations légèrement meilleures peuvent faire une différence importante dans les résultats de votre entreprise.
Les systèmes de recommandation actuels reposent sur le principe suivant : les clients ayant des historiques d'achat et de navigation similaires achèteront des produits similaires à l'avenir. Pour qu'un tel système fonctionne, il faut soit un grand nombre de transactions historiques, soit des données détaillées sur le comportement des utilisateurs sur d'autres sites web. Si vous avez besoin de telles données, vous pouvez les rechercher sur des plateformes de vente de données .
Plus de données et de meilleurs algorithmes permettent d'améliorer les recommandations. Il est essentiel d'exploiter toutes les données pertinentes de votre entreprise et d'enrichir votre base de données clients grâce à des données tierces. Si un client régulier a recherché des baskets rouges sur d'autres sites web, pourquoi ne pas lui proposer une paire idéale lorsqu'il visite le vôtre ?
3. Travailler avec un consultant pour élaborer vos propres solutions
Un moteur de recommandation légèrement plus performant pourrait augmenter les ventes d'une entreprise de quelques points de pourcentage, ce qui pourrait considérablement améliorer sa rentabilité, notamment pour les entreprises à faibles marges. Par conséquent, investir dans le développement de meilleurs moteurs de recommandation peut s'avérer judicieux si l'entreprise n'obtient pas de résultats satisfaisants avec les solutions existantes sur le marché .
4. Organiser un concours de science des données pour créer votre propre solution
Une approche possible consiste à exploiter l'intelligence collective pour concevoir de tels systèmes. Les entreprises peuvent utiliser des données historiques chiffrées, organiser des concours de science des données ou collaborer avec des consultants pour obtenir des modèles fournissant des recommandations très efficaces.
Comment choisir un système de recommandation ?
Le choix du système de recommandation adapté dépend de vos objectifs commerciaux, des données disponibles et des ressources techniques dont vous disposez. Voici quelques points clés à prendre en compte :
- Évaluation du modèle sur vos données
- Il est essentiel de tester les modèles sur vos propres données afin d'évaluer leurs performances dans votre contexte spécifique. Les benchmarks prêts à l'emploi peuvent ne pas correspondre à vos utilisateurs, vos produits ou vos objectifs commerciaux.
- Type de données disponibles
- Les données explicites (notes, avis, mentions « J’aime ») fonctionnent bien avec le filtrage collaboratif.
- Les données implicites (clics, temps passé, achats) favorisent les approches hybrides ou d'apprentissage profond.
- Objectifs commerciaux
- Si votre objectif est la personnalisation à grande échelle , l'apprentissage profond ou les systèmes hybrides sont les meilleures options.
- Pour des expériences rapides , des modèles plus simples, tels que la factorisation matricielle, peuvent suffire.
- Exigences d'évolutivité
- Les plateformes à grande échelle (par exemple, le commerce électronique, le streaming) nécessitent souvent des solutions basées sur l'apprentissage profond ou hébergées dans le cloud, capables de gérer des millions d'utilisateurs et d'articles.
- Connaissances et ressources du domaine
- Si votre équipe manque d'expertise en apprentissage automatique, l'utilisation de solutions de fournisseurs (par exemple, Amazon Personalize, Google Recommendations AI) peut accélérer le déploiement.
- Pour des domaines très spécialisés, la mise en place d'une solution interne peut s'avérer nécessaire.
Conseil : Commencez par prototyper avec des bibliothèques prêtes à l’emploi (LightFM, TensorFlow Recommenders) et évaluez les performances avec vos données réelles avant de passer à l’échelle.
Coût de la mise en œuvre des systèmes de recommandation
La mise en œuvre d'un système de recommandation engendre des coûts directs et indirects :
- Délai de développement : La création de modèles personnalisés nécessite l’intervention de data scientists, d’ingénieurs et d’équipes d’infrastructure. Le développement peut prendre de quelques semaines (pour les prototypes) à plusieurs mois (pour les systèmes de production).
- Coûts d'infrastructure :
- Sur site : Nécessite des serveurs GPU, des bases de données et une maintenance continue.
- Basé sur le cloud : Les coûts évoluent en fonction de la taille des données et de l'utilisation de l'API (AWS, GCP, Azure).
- Frais du fournisseur : Les solutions SaaS peuvent facturer en fonction du nombre d’appels API, du nombre d’utilisateurs ou de la quantité de données traitées.
- Frais récurrents :
- Réentraînement, surveillance et mises à jour des modèles.
- Coûts potentiels de l'intégration de sources de données externes pour améliorer les recommandations.
Règle générale : les petites entreprises peuvent commencer par des outils SaaS (moins de 10 000 $/an), tandis que les entreprises qui développent des systèmes internes investissent souvent des millions dans l'infrastructure et les talents.
Implications éthiques des systèmes de recommandation
Bien que les moteurs de recommandation présentent une utilité, ils soulèvent d'importantes questions éthiques et sociales :
- Biais et équité : Les algorithmes peuvent renforcer les biais existants (par exemple, recommander uniquement du contenu populaire, ignorer la diversité).
- Problèmes de confidentialité :
- La collecte et l'analyse des données des utilisateurs soulèvent des questions de consentement et de protection des données.
- Le respect du RGPD, du CCPA et des autres lois sur la protection des données est crucial.
- Utilisation responsable des données :
- Les politiques transparentes doivent expliquer comment les données des utilisateurs sont collectées, traitées et stockées.
- Les techniques de confidentialité différentielle et d'anonymisation peuvent atténuer les risques.
Méthodologie d'évaluation comparative des moteurs de recommandation
Dans cette étude, nous nous sommes concentrés sur la conception et l'évaluation de systèmes de recommandation basés sur des données de rétroaction implicite, et plus précisément sur les interactions des utilisateurs avec les produits. L'ensemble de données utilisé dans notre analyse comprend trois éléments clés : l'identifiant du visiteur (visitorid), l'identifiant de l'article (itemid) et les types d'interaction tels que la consultation , l'ajout au panier et la transaction . Étant donné que les utilisateurs n'ont pas explicitement évalué les articles, mais ont interagi par le biais de ces comportements, nous avons considéré ces données comme une rétroaction implicite .
Nous avons testé trois modèles de recommandation différents afin d'évaluer leur efficacité dans le traitement des données implicites :
- LightFM : Un modèle hybride combinant filtrage collaboratif et méthodes basées sur le contenu. Nous avons utilisé la fonction de perte WARP (Weighted Approximate-Rank Pairwise) pour entraîner le modèle. L’objectif était de prédire la probabilité qu’un utilisateur consulte un produit en analysant son historique d’interactions avec les articles.
- Cornac BPR (Bayesian Personalized Ranking) : Modèle de filtrage collaboratif conçu pour classer les articles en fonction des interactions des utilisateurs. Il utilise le feedback implicite pour apprendre les préférences des utilisateurs en optimisant le classement des articles pertinents par rapport aux articles non pertinents.
- Système de recommandation TensorFlow : un framework d'apprentissage profond qui utilise des plongements lexicaux pour représenter les utilisateurs et les articles, et capturer les relations complexes qui les unissent. Le modèle est entraîné sur des interactions implicites, avec une tâche de recherche visant à prédire les articles les plus pertinents pour chaque utilisateur.
Les modèles ont été entraînés à prédire la probabilité qu'un utilisateur interagisse avec un produit, en se concentrant plus précisément sur l'événement de consultation comme comportement cible. Notre objectif était d'estimer avec quels produits les utilisateurs sont les plus susceptibles d'interagir, en fonction de leur comportement passé. Après l'entraînement, nous avons évalué les modèles à l'aide de données de test afin de vérifier leur capacité à généraliser à des interactions inédites.
Nous avons évalué les performances des modèles sur la base de trois indicateurs couramment utilisés dans les systèmes de recommandation :
- AUC (Aire sous la courbe) : Mesure qui évalue la capacité du modèle à classer les éléments pertinents avant les éléments non pertinents. Un score AUC proche de 1 indique une meilleure performance de classement.
- Précision à 10 : Mesure la proportion d’éléments pertinents (c’est-à-dire avec lesquels l’utilisateur a interagi) parmi les 10 premières recommandations. Plus la valeur est élevée, meilleure est la précision des recommandations.
- Rappel à 10 : Mesure le nombre d’éléments pertinents (issus des interactions de l’utilisateur) qui apparaissent parmi les 10 premières recommandations. Cette métrique est essentielle pour comprendre dans quelle mesure le modèle reflète les préférences de l’utilisateur.
En comparant ces indicateurs entre les trois modèles, nous avons identifié le modèle le plus performant, tant en termes de classement des éléments pertinents que de récupération précise de ces éléments dans les meilleures recommandations.
Conclusion
Les systèmes de recommandation ont démontré leur efficacité pour renforcer l'engagement client et stimuler la croissance des entreprises. En analysant les préférences et les comportements des utilisateurs, ces systèmes proposent des suggestions personnalisées qui contribuent à augmenter les ventes, à fidéliser la clientèle et à réduire le taux d'attrition.
Des données provenant de divers secteurs indiquent que les plateformes de commerce électronique ont connu une augmentation de leurs taux de conversion et de la valeur moyenne des commandes, tandis que les plateformes de divertissement ont constaté une amélioration de l'engagement des utilisateurs grâce à des recommandations de contenu personnalisées.
Des secteurs comme le commerce électronique, le divertissement, les médias sociaux, la vente au détail, la santé et la finance bénéficient de la mise en œuvre de systèmes de recommandation.
Dans les secteurs de la santé et de la finance, les systèmes de recommandation ont permis de proposer des services plus personnalisés, améliorant ainsi la satisfaction client et les résultats obtenus. Ces résultats démontrent l'efficacité des systèmes de recommandation pour optimiser l'expérience utilisateur et stimuler la performance des entreprises dans divers secteurs.
Soyez le premier à commenter
Votre adresse courriel ne sera pas publiée. Tous les champs sont obligatoires.