Comment tirer le maximum de valeur d’un sunburst ?

ARTICLE

Les sunburst donnent un air connaisseur et une touche colorée à une présentation, mais réussir à les exploiter, c’est une autre histoire ! On peut d’ailleurs réaliser d’autres modélisations en parallèle des sunburst pour extraire des informations impactantes.

Qu’est-ce qu’un sunburst ?

Avant d’entrer dans le vif du sujet, prenons le temps de le préciser : on ne va malheureusement pas parler de coucher ni de coup de soleil dans cet article, mais bien de l’analyse de donnée ! 

Sunburst : un diagramme circulaire, également appelé diagramme en étoile ou diagramme circulaire à plusieurs niveaux, est utilisé pour visualiser des données hiérarchiques, représentées par des centres concentriques

d'après Wikipedia

Dans le monde de l’analyse numérique, et plus particulièrement dans le domaine de l’optimisation des taux de conversion (CRO), le sunburst est utilisé pour décrire le comportement des utilisateurs, notamment sur un site web, afin de comprendre comment les utilisateurs naviguent d’une page à l’autre.

Le premier anneau central représente les pages qui accueillent en premier lieu l’utilisateur (pages de destinations ou pages d’accueil), puis le second anneau représente la page web où les utilisateurs vont après leur première page, etc.. jusqu’à ce qu’ils quittent finalement votre site web, avec ou sans achat (et c’est bien là l’enjeu !).

Notez que l’utilisation de ce type de graphique n’est pas exclusif de l’optimisation des produits web. On peut par exemple imaginer la même approche pour décrire l’arrivée des utilisateurs sur votre site web via les canaux d’acquisition (et non les pages web).

Les sunburst sont de plus en plus tendance dans l’écosystème de la CRO car ils sont relativement nouveaux, faciles à comprendre, et plutôt visuels. Beaucoup plus que l’affreux « flux de comportements » de Google Analytics (bien qu’il dise exactement la même chose!).

L’horrible et dépassé « Flux de comportement » (behavior flow) de Google Analytics 

Et voilà un sunburst DataMa : on peut lire ici que 0.3% des visiteurs ont vu une page produit, puis quitté temporairement le site, puis sont revenus dans une autre session sur une page produit… jusqu’à finalement quitter définitivement le site depuis une page produit.

Comment obtenir un sunburst ?

Il existe de nombreuses façons d’obtenir un sunburst décrivant votre parcours utilisateur et tout dépend réellement de votre manière de collecter la data.

Certains outils comme Content Square l’intègrent directement dans leur plateforme, mais bien souvent pour un coût important (plus proche des 100k€).

L’objectif maintenant est donc de vous donner les clés pour réaliser un sunburst vous-même, à moindre coût, avec l’outil de suivi analytics que vous utilisez déjà (payez déjà ?). Juste comme ça, les frais standards chez DataMa pour une mission de ce type sont inférieurs à 10k€, et cela débouche sur des enseignements concrets… 

Tout d’abord vous aurez un aperçu de la façon de l’obtenir depuis Google Analytics (car cet outil représente >80% du marché de l’analyse web). Mais pour autant, sachez qu’il est possible de l’obtenir depuis d’autres outils, comme Adobe ou AT Internet. Il vous suffit d’avoir accès au Session ID pour pouvoir traquer le parcours client de manière poussée.

GOOGLE ANALYTICS

La solution Big Query pour les clients de Google 360 

Curieusement j’ai toujours trouvé peu de personnes maîtrisant les requêtes Big Query pour extraire ce qu’elles ne pouvaient pas retirer de l’interface Google Analytics. C’est très probablement parce que l’analyse web est un domaine un peu compliqué pour les data analysts en général, que le SQL n’est pas (à tort) une condition préalable et requise pour être web analyst dans la plupart des entreprises et enfin que les tableaux croisés sont quelque peu effrayants au premier abord. Pourtant c’est assez fascinant de voir tout ce qu’on peut réaliser lorsque l’on commence à jouer avec Big Query en plus des tableaux de Google Analytics. 

Quoiqu’il en soit l’idée est d’écrire une requête qui aboutit à un résultat ressemblant un peu à la capture d’écran ci-dessous, avec une colonne « Parcours Client» qui contient  dans l’ordre chronologique les pages que l’utilisateur a vues (quelque chose comme « Page 1 – Page 2 – Page 3 »), et le nombre d’utilisateurs qui ont fait cela.

Je ne détaillerai pas ici les aspects techniques pour l’obtenir, mais vous devez juste savoir que le BQ Export schema est votre référence, que STRING_AGG est la fonction que vous recherchez et enfin que vous devez faire attention à ce que vous prenez en compte ou non, car vous pouvez facilement vous tromper dans les définitions des clics.

 Voilà ce à quoi doivent ressembler les résultats de votre requête dans Big Query

Google Analytics version gratuite

Petite parenthèse pour les personnes qui ne sont pas sur Google 360 et n’ont pas accès à Big Query : vous pouvez toujours obtenir un sunburst, même si c’est moins détaillé.

Google vous donne accès au parcours de la page d’accueil, de la page de sortie, de la page précédente et enfin celui de la page actuelle. En réalité c’est suffisant pour obtenir au moins un sunburst de 5 étages, à condition de renoncer à une analyse plus que poussée et de maîtriser le langage à exploiter dans l’API correspondante de Google Analytics pour éviter l’échantillonnage (si vous ne le maitrisez pas, je ne peux que vous rediriger vers l’excellent pack GoogleAnaltycisR de Mark Edmonson et son incroyable travail). 

 Voilà une capture d’écran de l’explorateur Dimensions & Metrics pour Google Analytics. Les 4 derniers sont les métriques qui nous intéressent !

La mise en forme 

Le plus difficile est de disposer de l’ensemble des données. La visualisation du diagramme en elle-même est beaucoup plus simple. Il existe de nombreuses autres façons que le sunburst pour visualiser les données que vous avez. La plupart d’entre elles utilisent la technologie D3 JS. Ce qui est assez amusant, c’est qu’un ancien employé de Google a lui-même publié l’article original (que vous pouvez trouver ici) derrière les sunbursts, mais je n’ai encore jamais vu de sunburst dans Google Analytics ni dans Data Studio.

Si vous êtes familier avec Plotly (que ce soit en R ou en Python), ils ont un excellent template que vous pouvez utiliser facilement avec votre langage favori. Chez DataMa on utilise plutôt le package R SunburstR de Kent Russel qui représente parfaitement les parcours séquencés.

 La fonction Sunburst dans le package sunburstR en R

Il est tout à fait possible d’intégrer ce graphique (généré en R/Python/JS) dans votre outil de reporting préféré, tel que Tableau, Power BI ou Data Studio.

Il existe également des moyens de créer un sunburst natif dans Tableau (pour ça, suivez cet incroyable hack ici puis prenez votre temps pour éviter d’avoir plus de 1000 lignes vu le nombre de calculs imbriqués là-dedans) ou cette extension Power BI.

Comment utiliser réellement son sunburst et en tirer profit ?

C’est la seule bonne question ! Car même si les sunburst ont un certain style, ils sont en fait difficiles à lire, à comparer et surtout à rendre actionnables. Donc il faut souvent approfondir un peu la modélisation avant d’utiliser son sunburst dans la vie réelle. Voici 2 use case que nous réalisons régulièrement chez DataMa.

USE CASE 1 : COMPRENDRE LES COMPORTEMENTS DES CLIENTS – INDICE DE SIMILARITÉ

Nous avons développé ce use case juste après le début du confinement en mars 2020. Les traditionnels KPIs des sites internet étaient dangereusement bas ; en particulier les indices de trafic et de conversion des acteurs de l’industrie du tourisme. Ainsi, après quelques semaines de réunions de crise pour parer au plus urgent, la question de nos clients était la suivante : comment savoir quand nos clients (re)commencent à se comporter « normalement » sur mon site web (en opposition au comportement dû au Covid 19) afin que je puisse commencer à réinvestir dans mes campagnes d’acquisition ?

Certains diront qu’il faut simplement analyser la conversion (achat/session) et que c’est un bon indicateur pour savoir si les gens reviennent ou non sur votre site web pour acheter, ou par exemple pour s’informer que la façon de gérer les impacts du Covid. Mais cela n’est pas forcément suffisant, et ce pour deux raisons :

  • la conversion repose sur les achats et ils étaient particulièrement faibles à cette époque, de sorte qu’une augmentation ou diminution du nombre de transactions ne pourrait pas être statistiquement significative : la conversion est ici volatile pour être pertinente !
  • il existe un certain délai (en moyenne 1 ou 2 semaines) entre la 1è visite d’un utilisateur sur un site web et le moment où il achète (en particulier dans le secteur du voyage). Il peut donc y avoir un décalage entre le moment où l’utilisateur se comporte normalement et le moment où la conversion remonte.

Enfin une 3è option serait de se contenter de regarder le volume du trafic. Mais si c’est votre indicateur pour réenclencher vos canaux d’acquisition, alors vous avez le nez dans un cercle vicieux : pas d’investissement => pas de trafic, pas de trafic => pas d’investissement…

On en est donc arrivé à se demander : pourquoi ne pas mesurer à quel point les parcours des utilisateurs sont similaires entre deux périodes ?

L’idée est ici de comparer les volumes de chaque parcours (chaque rayon du sunburst) entre deux périodes pour aboutir à un indice compris entre 0% et 100%, 100% signifiant que la répartition du trafic est exactement la même et 0% signifiant qu’il n’y a absolument aucun parcours similaire.

Le concept d’indice de similarité

L’avantage c’est que vous pouvez suivre cet indice dans le temps (chaque semaine vs. la même semaine l’année dernière, pour compenser l’effet de saisonnalité par exemple) et l’utiliser pour relancer vos investissements au meilleur moment, avant la concurrence. L’expérience a montré que l’indice de similarité a une évolution plus stable dans le temps que la conversion, et qu’il pouvait être extrêmement intéressant de comprendre à quel moment les utilisateurs ont commencé à se comporter « normalement ».

Voici un exemple de l’indice de similarité dans Tableau

Durant la période du Covid 19, nous avons observé une différence significative dans le parcours des clients (type et ordre des pages web vues par nos visiteurs) avec l’aide de DataMa Solution.

L’indice de similarité est fortement corrélé à l’évolution de la crise : choc, déni, doute, acceptation, adaptation.

Fanjuan Shi

Directeur Analytique & Data Science, chez Pierre et Vacances Center Parcs

USE CASE 2 : ATTRIBUTION DE VALEUR – DATAMA JOURNEY

Une autre manière d’utiliser concrètement un sunburst est de créer un modèle d’attribution de valeur pour allouer une valeur précise à chaque page de votre site web en fonction de la conversion issue de ce parcours.  

Par exemple si vous disposez d’un parcours qui a une bonne conversion « Page d’accueil – Recherche – Page produit – Achat » et qui vous rapporte 100€, vous pouvez alors utiliser un modèle d’attribution constante pour allouer 25€ à chaque page. Ainsi votre page d’accueil vous « rapporte » 25€, la page recherche 25€, la page produit 25€ et la page de paiement 25€.

Une fois que ce modèle est mis en place, vous pouvez maintenant attribuer la « valeur perdue » aux parcours qui convertissent peu. Par exemple, en reprenant le parcours évoqué ci-dessus, si vous avez un parcours client « Recherche – Produit » qui ne convertit pas, vous pouvez dire qu’il a perdu une valeur potentielle de 50€ (25+25) à cause de la page produit (qui devient également la page de sortie). La page produit est donc responsable d’un apport d’une valeur de 25€ mais aussi d’une perte virtuelle d’une valeur de 50€.  

La répartition et le traitement des volumes peuvent s’avérer un peu délicats, c’est pourquoi nous avons mis au point un outil automatisé DataMa Journey qui vous aide dans cette tâche (vous pouvez le tester ici).

Enfin une utilisation intéressante de cette approche en CRO consiste à organiser votre roadmap d’A/B tests en donnant la priorité aux tests sur les pages selon qu’elles vous fassent gagner ou perdre de la valeur. Cette méthode s’est avérée extrêmement utile pour aider les équipes produit à gérer les données, en plus des autres informations provenant des commentaires des clients ou de l’observation de la concurrence. Nous avons récemment organisé un webinar à ce sujet que je vous encourage à regarder ici !

Exemple d’une matrice de priorisation des A/B tests dans l’outil DataMa Journey

 

 

Guillaume de Bénazé

Fondateur & CTO @DataMa, Decision Scientist

Pendant 10 ans j’ai acquis une expertise CRO en tant Analytics Manager chez Expedia et consultant chez Bain & Company.  Maintenant chez DataMa je crée et développe des algorithmes qui optimisent l’analyse CRO, la parcours client et la performance digitale.

email: guillaume@datama.fr 

Subscribe To Our Newsletter

Join our mailing list to receive the latest news and updates from our team.

You have Successfully Subscribed!