Alla scoperta delle intuizioni: cosa si può imparare attraverso un prediction tree?

Da Arnaud Cecconi - 17 Luglio 2019 | 826 0

Facciamo un esempio con questo albero delle previsioni generato su un sito di e-commerce:

Come interpretarlo ?

Il rosso rappresenta una forte probabilità di acquisto (più scuro è il rosso, maggiore è la probabilità).

Il blu rappresenta una forte probabilità di nessun acquisto (più scuro è il blu, minori sono le possibilità che un utente acquisti).

Il primo punto a sinistra rappresenta il 100% della popolazione, una prima suddivisione avviene con la variabile total_order_amount.

Da un lato, abbiamo coloro i cui acquisti totali (per tutta la loro storia d’acquisto) ammontano a meno di 25 euro, e che hanno poche probabilità di effettuare un acquisto (blu scuro); dall’altro lato, coloro i cui acquisti totali ammontano a più di 25 euro sono leggermente più propensi a fare un acquisto (azzurro chiaro).

Tra questi ultimi, quelli che si trovavano da poco nell’imbuto sono suscettibili di fare un acquisto (cerchio rosso chiaro) e tra questi, quelli la cui ultima visita è stata effettuata meno di 28 giorni fa hanno ancora più probabilità di fare un acquisto (cerchio rosso molto scuro).

E tra coloro la cui prima visita è stata effettuata più di 28 giorni fa, possiamo vedere che le persone che di recente hanno visto meno di 22 pagine difficilmente possono acquistare, tranne quando il loro totale delle pagine viste è inferiore a 55 e se di recente hanno visto più di 4 pagine.

Tuttavia, coloro che hanno visto un totale di oltre 55 pagine e che recentemente hanno visto meno di 8 pagine non faranno un acquisto.

Ecc. ecc., seguendo i vari nodi

Le lezioni da trarre:

  • La variabile più prevedibile è l’importo totale dell’ordine e deve essere presa in considerazione quando si creano i segmenti.
  • La recente presenza di acquisti nel tunnel cambia drasticamente la probabilità (ciò non sorprende, da qui l’importanza di recuperare i carrelli abbandonati).
  • Il numero di pagine viste è un indicatore della probabilità di acquisto e dipende dalla data dell’ultima visita (possiamo dedurre che esiste una sorta di rapporto che può determinare se qualcuno ha un intento di acquisto in base alla data della sua prima visita, il numero totale di pagine viste da allora e il numero di pagine viste recenti).
    È quindi necessario creare un segmento per ogni nodo rosso all’estrema destra dello schermo per trovare tutti i visitatori con un intento (o fare ulteriori ricerche sul rapporto per creare una nuova variabile di punteggio per facilitare ciò in seguito).
  • Le altre variabili prevedibili da tenere a mente sono recent_view_product e recent_view_category. Si può vedere che più in alto sono, meno possibilità c’è di un acquisto, senza dubbio perché questi sono visitatori che stanno solo navigando senza sapere davvero quello che vogliono, a differenza di quelli che guardano pochi prodotti e categorie e che sono più propensi ad acquistare rapidamente.