Google Data Studio est l’outil de reporting et de Data Visualisation développé par Google. Lancé en 2016, l’outil est déjà devenu une solution de référence pour deux raisons très simples : la gratuité et l’intégration avec les services Google, notamment Google Analytics et Google Ads.
Chez Cartelis, nous sommes de gros utilisateurs de Google Data Studio. Nous apprécions la prise en main très simple ce qui permet une adoption facile chez nos clients, même si disons-le tout de suite Google Data Studio a des limites assez significatives. L’outil n’est pas adapté aux cas d’usage complexes de reporting et de BI.
Justement, quels sont les cas d’usage de Data Studio ? Qu’est-ce que l’on peut faire avec cet outil ? Quel périmètre / richesse fonctionnel ? Quelle profondeur fonctionnelle ? Ce sont les questions nous allons aborder et auxquels nous allons essayer de répondre de la manière la plus complète possible.
Si vous cherchez une solution de BI / reporting et que vous voulez en savoir plus sur Google Data Studio, cet article, inspiré par la très bonne review de Holistics, est l’article que vous devez lire. Découvrez notre test complet et notre avis détaillé.
Sommaire
- Google Data Studio en quelques mots
- Les 4 concepts clés de Google Data Studio : Ensembles de données – connecteurs – sources de données – rapports
- Zoom sur l’éditeur de rapports de Google Data Studio
- La combinaison de données (Data Blending) dans Google Data Studio
- La gestion des droits d’accès et le partage de rapports
- Google Data Studio et les intégrations aux data sources
- Data Studio, un produit intégré dans l’écosystème de la plateforme Cloud de Google
- Combien coûte Google Data Studio ? Quel prix ?
- Conclusion & Bilan – Notre avis sur Google Data Studio
Google Data Studio en quelques mots
Google, ce n’est pas qu’un moteur de recherche. Enfin, je ne vous apprends rien. Vous utilisez sans aucun doute Google Analytics, probablement aussi Google Tag Manager, Google Ads, sans parler de Gmail et autres Google Drive. Dans la vaste famille de produits proposée par la firme de Mountain View, je veux l’outil de Data Vizualisation : j’ai nommé Google Data Studio. Data Studio, GDS pour les intimes, est la solution cloud de Data Visualization de Google. C’est un outil qui vous permet de représenter graphiquement vos données analytics, de créer des tableaux de bord et des reportings à partir de pratiquement n’importe quelles sources de données.
Comme nous le disions dès l’introduction, le principal point fort de Data Studio est sa simplicité d’utilisation. Mais, dans l’univers du logiciel, la simplicité est souvent au détriment de la richesse fonctionnelle. Cela se vérifie ici. Les capacités de Data Studio sont limitées, vous ne pouvez pas tout faire. Dès que vous voulez creuser un peu les fonctions et déployer des cas d’usage qui sortent de l’ordinaire, vous rencontrez des obstacles.
Mais lorsque l’on est novice en Data Vizualisation, que l’on a des utilisations cibles simples (surtout si c’est sur des sources de données issues de Google : BigQuery, GA… mieux gérées par Data Studio), alors GDS est clairement une solution à envisager. Pour être plus précis encore, vous tirerez le meilleur bénéfice de cet outil si :
- Vous utilisez Google pour votre Data Warehousing (nous reviendrons sur ce point dans la section « Data Studio, un produit intégré dans l’écosystème de la plateforme Cloud de Google »).
- Vous avez déjà en place un workflow solide de nettoyage et de transformation des données (un bon ETL).
Si l’on devait définir l’utilisateur cible de Google Data Studio, on pourrait dire que c’est quelqu’un qui manie les chiffres et connaît très bien Excel – qui a en plus éventuellement quelques connaissances en langage informatique (Python, JS) sans pour autant avoir suffisamment de compétences techniques pour travailler sur une infrastructure data, créer des reportings from scratch ou faire des analyses complexes nécessitant quelques acrobaties SQL. En plus court : la cible de Data Studio, ce sont les « business analysts », ces personnes qui ont une compréhension fine des enjeux business, qui parlent le langage du business et un peu le langage data et qui ont besoin d’un outil pour rassembler les données et les présenter dans des rapports à usage interne ou externe (clients).
Les 4 concepts clés de Google Data Studio : Ensembles de données – connecteurs – sources de données – rapports
Pour comprendre le fonctionnement d’un outil, il faut d’abord comprendre le vocabulaire qu’il utilise. En l’occurrence, il y a 4 mots, 4 concepts qu’il faut bien connaître :
- Les ensembles de données – en anglais « Data set« . Un « ensemble de données » définit le système « physique » externe où sont stockées les données à partir desquelles vous voulez créer votre rapport. Par exemple : une vue Google Analytics, un ou plusieurs sous-comptes administrateur Google Ads, un tableau ou une requête Big Query, une feuille de calcul Google Sheets, un fichier CSV chargé dans Google Drive, une base de données MySQL ou PostgreSQL, etc.
- Les connecteurs. Un connecteur est un composant qui permet d’associer Data Studio à vos données sous-jacentes, d’associer vos ensemble de données à vos sources de données Data Studio. Il faut bien comprendre que Data Studio n’importe pas vos données. Les connecteurs permettent seulement à Data Studio d’avoir accès à vos données sous-jacentes. Connecter n’est pas importer. Il existe 3 familles de connecteurs : les connecteurs développés par Google (les connecteurs associés aux autres produits de Google), les connecteurs développés par des partenaires et les connecteurs open source (développés par la « communauté » des utilisateurs de Data Studio, mais malheureusement pas toujours correctement maintenus).
- Les sources de données – en anglais Data source. Une fois que vous avez associé un ensemble de données à Data Studio, vous avez créé une « source de données ». Une source de données permet de personnaliser la manière dont les statistiques et les dimensions liées au data set sont traitées dans votre rapport Data Studio. Les sources de données permettent de partager les données à des tiers sans donner accès aux data set sous-jacents. Pour résumer, une source de données est une couche logique appliquée sur un data set physique – afin que les données de vos data set soient présentées de manière optimale dans vos rapports. Ce qui nous amène au dernier concept.
- Les rapports, qui permettent de présenter visuellement vos données dans un tableau. Les rapports sont construits à partir d’une sélection de sources de données. La représentation visuelle a pour objectif de faciliter l’analyse des données, la découverte d’insights et leur partage. C’est la base même de la Data Vizualisation.
Prenons un exemple concret pour que bien comprendre l’articulation entre ces 4 concepts. Supposons que vous souhaitiez analyser des données transactionnelles enregistrées dans un fichier Excel que vous stockez dans Google Drive. Comment faire ? Vous devez :
- Ouvrir votre compte Google Data Studio et utiliser le connecteur Google Drive pour connecter Google Drive (= le data set, l’ensemble de données) à Data Studio.
- Vous devez ensuite créer une source de données à partir de votre fichier Excel. Vous pouvez par exemple ajouter des formules personnalisées (pour par exemple calculer la marge brute à partir du prix des produits et de leur coût) ou bien supprimer les champs ou données de votre feuille Excel qui sont non-nécessaires pour adapter la source de données aux cas d’usage de votre reporting.
- Vous pouvez enfin créer votre rapport en utilisant différentes présentations graphiques afin de visualiser les données de votre source de données sous différents angles. Une fois que vous avez construit le rapport, vous pouvez le partager en interne (ou en externe, à votre client par exemple).
Parce qu’il n’y a pas que Google dans la vie, découvrez notre Top 20 des outils de Data visualisation.
Zoom sur l’éditeur de rapports de Google Data Studio
Le concept de « rapport » est le concept central de Google Data Studio, celui autour duquel tournent tous les autres. Un rapport Data Studio a beaucoup de ressemblance avec un Google Slides. En revanche, un rapport Google Data Studio ne ressemble pas vraiment à un tableau de bord.
Le concept de « dashboard » ne fait pas partie du vocabulaire de Data Studio. Et ce n’est pas un mal. Au contraire. Si vous utilisez un autre outil de BI / Data Vizualisation, avec des rapports présentés sous la forme de tableaux et de graphiques, avec des mises en forme rigides, vous allez apprécier GDS.
Comme vous pouvez le voir à l’aide de cette petite capture vidéo, l’interface d’édition des rapports est particulièrement intuitive. Elle est construite sur un modèle drag & drop : Vous choisissez la forme graphique (il en existe de toutes sortes), vous la positionner à l’endroit souhaité sur le rapport, vous pouvez la redimensionner, l’aligner avec les autres graphiques. Pour l’amoureux des beaux designs, Data Studio ne laisse pas indifférent. Cette approche d’édition est parfaitement alignée avec les besoins des business analytists habitués à produire des Google Slides bien léchés.
Dans Data Studio, le filtrage des données est fragmenté. Les filtres sont reliés aux sources de données et contrôlent certains champs ou dimensions des sources de données. Autrement dit, quand la valeur du filtre est modifiée, le changement se répercute sur la source de données, ce qui génère de nouvelles requêtes envoyées au data set. Les résultats du filtrage sont stockés en mémoire de cache avant que les graphiques soient mis à jour en fonction.
Voici un schéma du process :
Comme nous l’avons dit plus haut, Data Studio ne stocke pas les données brutes mais les poussent directement à partir de leur source : les data set. Par conséquent, quand un data set est modifié, tous les rapports Data Studio alimentés par les data sets modifiés sont mis à jour. Si vous avez un petit data set, vous pouvez charger les données directement en fichier Excel/CSV : Data Studio en fera une copie pour vous (dans votre Google Drive). S’il y a beaucoup de données en jeu, BigQuery est la solution la mieux adaptée pour charger les données.
Quelques mots sur la modélisation de données, c’est-à-dire la définition des dimensions et des métriques personnalisées. A l’intérieur d’une source de données, vous pouvez ajouter de nouveaux champs et en spécifier le type. Les champs contenus des données de type texte, data, etc. seront catégorisés comme des « Dimensions » tandis que les nombres sont catégorisés comme des « Statistiques ». Chaque Statistique est liée à une méthode d’agrégation par défaut.
Découvrez 30 modèles de rapports Google Data Studio pour les marketeurs.
Les formules utilisées dans Data Studio sont l’équivalent d’une version simplifiée de la syntaxe des requêtes BigQuery standards. Les fonctions proposées permettent de répondre à la plupart des cas d’usage simples, mais dès que vous voulez utiliser des formules plus complexes, répondant à des besoins plus complexes, Data Studio devient très vite complexe à manier.
En gros, vous trouverez ça très simple au départ, mais vous serez très vite confronté à des difficultés. Par ailleurs, les formules ne permettent pas à l’heure actuelle de définir des relations (des jointures) entre les différentes sources de données, ce qui est très limitatif comme nous le verrons tout à l’heure.
La combinaison de données (Data Blending) dans Google Data Studio
Combiner des données en provenance de multiples sources est sans aucun doute l’une des fonctionnalités les plus importantes pour un outil de BI. Data Studio propose une fonctionnalité de Data Blending qui permet aux utilisateurs de combiner différentes sources de données dans une seule. Le fonctionnement est similaire, bien que différent, à celui des jointures SQL. Ce sont des LEFT JOIN. Google vous permet de joindre jusqu’à 5 sources par jointures. A notre avis, cette fonctionnalité est encore sous-développée et ne répond qu’aux cas d’usage basiques.
Examinons trois scénarios de jointure :
- Le combinaison de 2 sources de données.
- Le combinaison de 3 ou plus sources de données avec les mêmes clés de jointure.
- Le combinaison de 3 ou plus sources de données avec des clés de jointure différentes.
Combiner 2 sources de données (un VLOOKUP-like)
Votre objectif : Vous voulez obtenir une liste d’utilisateurs avec le nom de la ville. En clair : joindre la table utilisateurs et la table ville.
Eh bien, c’est très simple de le faire sur Data Studio. C’est apparenté à une opération de jointure SQL classique sur une clé de dimension.
Combiner 3 ou plus sources de données avec les mêmes clés de jointure
Supposons que vous ayez extrait et agrégé 3 data points : pages vues, inscriptions, commandes. Vous voulez les combiner ensemble dans une seule table.
Eh bien, là encore, c’est possible et relativement facile à faire avec Data Studio. Tant que les tables que vous voulez joindre ont les mêmes clés, le Data Blending fonctionne très bien. Du coup, bien que les pages vues (Google Analytics), les inscriptions et les commandes proviennent de 3 sources de données différentes, on peut facilement les combiner dans une seule table.
Combiner 3 ou plus sources de données avec des clés de jointure différentes
Là, les choses se compliquent. Exemple : Vous voulez lister les utilisateurs avec le nom de leur ville et le nom de leur pays (2 niveaux de jointure).
Ici, dans Data Studio, le Data Blending ne fonctionne pas de la même manière qu’une jointure SQL dans la mesure où le mélange suppose la même clé de jointure.
En général, la solution pour résoudre ce problème consiste à blender les utilisateurs et les villes dans une vue, et ensuite blender cette vue avec les pays. Sauf que cette opération n’est pour le moment pas possible sur Google Data Studio.
La combinaison de données s’effectue directement dans l’éditeur de rapport et n’est disponible que pour le rapport pour lequel elle a été créée. Il n’est donc pas possible de partager ou de réutiliser une combinaison. Donc, clairement, le Data Blending n’est pas le point fort de Data Studio.
En résumé :
- Le Data Blending n’a d’intérêt que si vous données sont déjà agrégées et que l’opération de fusion des tables est simple.
- Pour réaliser des jointures plus complexes, vous devez utiliser BigQuery et charger le tableau obtenu dans Data Studio.
Découvrez comment contourner l’échantillonnage des données sur Google Analytics.
Contactez Cartelis
pour enfin capitaliser sur vos données clients.
Cartelis vous accompagne dans le cadrage et le déploiement d'une stratégie data et CRM vraiment impactante.
Analyse client, Choix des outils, Pilotage projet et Accompagnement opérationnel.
Prendre contact avec CartelisLa gestion des droits d’accès et le partage de rapports
Les règles de partage, de gestion des droits d’accès et de propriété des rapports et sources de données de Data Studio sont du même type que celles de Google Drive, la principale différence étant l’absence de structure en dossiers. Lorsque vous créez un rapport ou une source de données sur Data Studio, il ou elle est enregistré(e) en tant que fichier inconnu dans le dossier principal de Google Drive.
Le partage de données d’individus à individus se fait très simplement dans GDS. Par contre, pour partager les rapports ou les sources de données à des groupes, vous devez utiliser Google Groups, ce qui génère ajoute il faut le reconnaître une petite friction dans l’expérience utilisateur. Ce mécanisme de partage est peu adapté pour les grands groupes, qui ont besoin d’une gestion avancée des autorisations d’accès.
Par exemple, lorsqu’un utilisateur de Data Studio quitte l’entreprise, le process de transfert de la propriété des fichiers Data Studio est mal conçu. On a eu vent de cas où le compte Gmail professionnel de l’utilisateur était supprimé avant que cet utilisateur ait transféré les rapports et data sources dont il était propriétaire…Résultat : les sources de données sont désactivées et doivent être reconnectées au data set. C’est chronophage et parfois tout simplement ingérable.
Concernant maintenant le partage des données. Il est possible de partager un rapport comme on partage n’importe quel document dans Google Drive. On peut aussi télécharger le rapport en format PDF.
Google Data Studio et les intégrations aux data sources
Data Studio s’intègre très bien avec les autres produits de l’écosystème Google, en particulier les bases de données (BigQuery, Spanner, Cloud SQL…), Google Analytics, Google Ads, YouTube Analytics, Google Sheets :
- BigQuery : Data Studio peut facilement se connecter aux tables et vues de BigQuery et supporte également les custom SQL. Chaque table, chaque vue, chaque custom SQL fonctionne comme un data set.
- Google Sheets. Chaque feuille de calcul d’un fichier GSheets est considéré comme un data set séparé. Cela signifie que chaque source de données ne se connectera qu’à une seule feuille du spreadsheet. Les données des feuilles de calcul sont présentées sous une forme de tableau pour être utilisées correctement par Data Studio.
- Les applications Google (Google Analytics, Youtube, Google Ads). GDS propose des connecteurs officiels pour Google Analytics, YouTube Analytics, etc. Lorsque vous les connectez, Data Studio reconnaît automatiquement les dimensions et les statistiques disponibles. Data Studio propose d’ailleurs des templates de rapports spécialement adaptés à Google Ads ou Google Analytics. Il y a même un filtre dédié pour contrôler les data sources de GA dans GDS. En revanche, les données obtenues via ces connecteurs officiels sont uniquement des données agrégées (et possiblement échantillonnées).
- Les outils autres que les produits de la stack de Google. Comme nous le disions en début d’article, il existe des centaines de connecteurs développés par des partenaires ou en open-source. Ces connecteurs permettent d’explorer des données publiques (et parfois privées) issues d’autres sites – essentiellement des données relatives aux réseaux sociaux et aux plateformes publicitaires.
Data Studio, un produit intégré dans l’écosystème de la plateforme Cloud de Google
A terme, Google souhaite positionner Data Studio comme l’outil de BI / Data Vizualisation de référence pour les utilisateurs de la Google Cloud Platform. Cela signifie que :
- A l’avenir, Data Studio sera parfaitement intégré à l’écosystème Google Cloud Platform. Aujourd’hui, Data Studio est conçu pour supporter n’importe quelle base de données et n’importe quelles intégrations. L’objectif de Google est clair : rattraper ses principaux concurrents : AWS et Microsoft Azure.
- L’objectif de Google ne sera pas forcément de faire de Data Studio le meilleur outil de BI du marché.
- Si vous n’utilisez pas la stack Google à fond, choisir Data Studio n’est pas forcément la bonne solution (même s’il existe des connecteurs avec RedShift, etc.).
Combien coûte Google Data Studio ? Quel prix ?
A l’instant où ces lignes sont écrites, Google Data Studio est encore 100% gratuit. Mais il y a des chances que la solution devienne payante (ou au moins qu’apparaisse une version premium) dans les années à venir – sur le même modèle que Google Analytics (avec Google Analytics 360).
Conclusion & Bilan – Notre avis sur Google Data Studio
Google Data Studio est un bon outil de Business Intelligence, mais surtout adapté pour les cas d’usage simples et les équipes novices en matière de Data Vizualisation. On atteint vite les limites de l’outil par exemple lorsque les données à retraiter en amont de la production des reportings sont complexes et qu’il faut associer un nombre important de sources de données.
En résumé, Data Studio :
- Est destiné aux utilisateurs « semi-techniciens », aux « business analysts ».
- Propose de nombreux connecteurs et donc de nombreuses intégrations.
- Le design des rapports (GSlides-like) est vraiment efficace. C’est un point fort de Data Studio.
- Les fonctionnalités de Data modeling sont assez faibles et limitées. Certaines opérations sont impossibles à réaliser. Il n’y a pas d’option de zoom. Les options de filtrage sont basiques.
- Les fonctionnalités en matière de combinaison de données ont du potentiel mais restent encore limitées. Il reste difficile de manipuler et de joindre entre elles des données.
- Data Studio est destiné à s’intégrer de mieux en mieux à la Google Cloud Platform, ce qui en fait une solution surtout recommandée si vous utilisez ou voulez utiliser les produits de Google.
Laisser un commentaire