Il y a quelques mois, nous découvrions le Data Science Studio (DSS) de Dataiku. Ce fût un véritable coup de foudre pour nos consultants, et cela faisait longtemps que nous n’avions pas été aussi impressionnés par le potentiel d’un outil. DSS est une plateforme complète pour construire et déployer des projets data de toutes sortes, du scoring aux analyses prédictives anti-fraude. Elle trouve donc des applications dans bon nombre de secteurs : santé, grande consommation, transport, média, jeux vidéo, institutions financières, etc. Dans le cadre des projets eCRM sur lesquels Cartelis intervient, DSS peut intervenir à différents niveaux. Nous avons choisi de vous présenter, dans cet article, un cas d’usage relativement simple à déployer, et néanmoins très puissant, le scoring des données Analytics.
Présentation de Dataiku
Dataiku est créé en 2013 par Florian Douetteau, Clément Sténac, Marc Batty et Thomas Cabrol
Florian Douetteau, normalien et actuel CEO de Dataiku, a passé 11 ans chez Exalead, de 2000 jusqu’au rachat par Dassault Systems en 2011. C’est évidemment cette expérience chez le moteur d’indexation et de recherche qui l’incite à monter son propre business. Il s’entoure alors de Clément Sténac (Chief Technical Officer, ex-Exalead), Marc Batty (Chief Customer Officer, ex-Logica) et Thomas Cabrol (Chief Data Scientist, ex-Apple) ; et le quatuor va vite, très vite. En 2013 ils comptent déjà parmi leurs clients BlaBlaCar, Pages Jaunes ou encore Vente Privée et, contrairement à beaucoup de start-ups, Dataiku est déjà rentable. L’objectif assumé des fondateurs est de construire un vrai leader international ; arrive donc la levée de fond (3,5 millions auprès d’Alven Capital et Serena Capital) début d’année 2015, avec en ligne de mire les Etats-Unis, où Florian passe désormais la moitié de son temps. Mégalos ? Non, talentueux et ambitieux : Dataiku prévoit de doubler de taille en 2016.
Lancement de la plateforme DSS en février 2014
Le Data Science Studio à pour but d’aider les entreprises à valoriser leurs données à l’aide de méthodes d’analyse prédictive. Mais plus généralement Dataiku entend démocratiser la science des données en simplifiant grandement leur manipulation. Le nom de la start-up va d’ailleurs en ce sens, avec d’une part « data » synonyme de processus de traitement longs et complexe et d’autre part « haïku » en référence aux poèmes japonais, courts, simples et structurés.
Chaque projet prend la forme d’un workflow, avec en input les datasets de votre société, remplis de données essentielles mais difficilement exploitables, et en output de nouveaux datasets dont vous pouvez désormais extraire un savoir ou une connaissance avec une vraie application business.
Entre les inputs et les outputs, on retrouve tout ce qui fait la force de Dataiku : une interface simple et intuitive, qui permet à tout le monde de réaliser des opérations de traitement et d’enrichissement, historiquement réservées aux data scientists chevronnés. Ce qui d’ordinaire nécessite plusieurs heures de travail et une expertise en R, Python ou SQL est désormais réalisable en quelques clics.
Dataiku est pensé pour les sociétés gérant plus d’un millions de quelque chose : un million de clients, un million de contacts, un million de transactions, un million de capteurs, un million de logs, etc. DSS est donc surtout conçu pour faire des analyses statistiques avancées sur de très grosses quantités de données. Ces études statistiques peuvent être effectuées très rapidement grâce aux nombreux modèles statistiques « pré-configurés » et disponibles sur la plateforme. Ou alors, pour les utilisateurs avancés, ces modèles peuvent être directement codés dans le langage de votre choix.
Zoom sur un Use Case CRM – Le scoring à partir des données analytics
Objectif : du CRM transactionnel au CRM global
Dans la majorité des cas, les CRM sont alimentés uniquement par les données transactionnelles issues du CMS e-commerce : date d’achat, montant, produits achetés, etc. Dans ce cas précis, les données présentes dans le CRM ne permettent pas une connaissance client approfondie. Il est impossible par exemple de connaître le comportement en ligne du client ou encore ses centres d’intérêt et encore moins son comportement avant qu’il n’entre dans la base de données CRM de l’entreprise. La valeur de ces informations saute aux yeux, mais rares encore sont les entreprises qui utilisent le potentiel des données web.
Pour répondre à cet enjeu, une DMP qui centralise à la fois les données transactionnelles et les données de navigation peut être une réponse. Néanmoins, rien ne sert de sortir la machine de guerre pour écraser une mouche, et la plupart des use cases identifiés par les entreprises ne nécessitent pas le déploiement d’une DMP. Un outil comme DSS peut vous permettre de mettre en place rapidement un dispositif de scoring des données Analytics pour enrichir vos données CRM. En revanche pour mettre en place des dispositifs plus complexes, permettant notamment d’opérer sur les plateformes d’ad-exchange via des DSP ou des SSP, le déploiement d’une DMP fait sens. Il est donc primordial de bien définir ses use cases avant de se lancer dans ce type de projet. Pour nous, l’objectif est ici de mettre en place un scoring affinitaire pour N thématiques, afin de personnaliser les échanges ultérieurs avec le client et lui proposer les produits/services qui l’intéressent. Voici comment y parvenir en utilisant DSS.
Récupérer les données Analytics
Google Analytics Premium permet d’exporter l’ensemble des données de navigation sous formes de logs, moyennant 150 000 euros par an. La version gratuite de Google Analytics en revanche limite les exports à 50 000 lignes, 200 000 avec l’API Google Analytics. Pour contourner ce problème, deux solutions s’offrent à vous :
- Vous pouvez utiliser un outil de collecte de données comme Segment.io avec l’intégration webhooks pour envoyer tous les logs sur l’adresse de votre choix. C’est ensuite à vous de stocker les logs dans une base de données adaptée.
- L’autre moyen est d’utiliser un tracker open source comme celui développé par l’équipe de Dataiku elle-même, le WT1. Votre équipe technique aura tout de même du boulot. Elle sera en charge de la récupération et du stockage des logs dans une base de données adaptée.
Contactez Cartelis
pour enfin capitaliser sur vos données clients.
Cartelis vous accompagne dans le cadrage et le déploiement d'une stratégie data et CRM vraiment impactante.
Analyse client, Choix des outils, Pilotage projet et Accompagnement opérationnel.
Prendre contact avec CartelisRetraiter les logs analytics
C’est à cette étape que DSS et toute sa puissance entre en jeu. En quelques heures, il est possible de créer un workflow pour retraiter les logs Analytics. Comme dans tout projet data, on commence par nettoyer les données. Cette phase est particulièrement chronophage en temps normal, mais les fonctionnalités de DSS, notamment la vue par colonnes, permettent d’effectuer ces opérations en un temps record. Une fois les données propres, on peut regrouper toutes les données par visitor ID. On obtient donc la liste des pages visitées pour chaque visiteur / client.
Calculer des scores par visiteur
Maintenant que les données sont prêtes, passons à l’objectif central de notre démarche : la mise en place d’un scoring affinitaire. On commence d’abord par définir les N thématiques pour lesquelles on veut mesurer un score. Cela se traduit par la création d’une colonne dans la table des visiteurs pour chacune des thématiques cibles. On crée ensuite une règle permettant d’ajouter +1, à chaque fois qu’une page de la thématique est visitée. Evidemment, c’est un jeu d’enfant si la thématique apparaît clairement dans l’URL ; sinon, ce sera plus compliqué, mais tout est faisable avec DSS.
Enrichir les données CRM
DSS propose un éditeur de scénarios pour automatiser l’envoi des données. Vous pouvez, entre autres, opter pour un trigger « time-based » ou « dataset change ». En d’autres termes, nous avons développé, en une journée et sans coder une seule ligne, un outil de scoring affinitaire. Merci beaucoup Dataiku !
Laisser un commentaire