Negli ultimi anni, l’attività di analisi delle informazioni e dei dati ha assunto un ruolo sempre più rilevante in ambito aziendale e così anche la data visualisation è diventata centrale per qualsiasi impresa che voglia adottare un approccio data driven oriented, o in altre parole basare le proprie strategie sui dati.
In questo articolo ci contreremo su uno dei molti aspetti che riguardano la data visualisation: i colori.
L’uso corretto dei colori è probabilmente una delle componenti più importante e spesso sottovalutate della visualizzazione dei dati. Un uso strategico dei colori può fare la differenza tra una buona e una cattiva visualizzazione dei dati.
Nella data visualization l’uso del colore non dovrebbe essere inteso solo come una mera scelta estetica, ma piuttosto come uno strumento per comunicare informazioni quantitative.
Infatti, la scelta del colore dovrebbe essere sempre fatta in considerazione di un determinato obiettivo comunicativo, che sia questo attirare l’attenzione, sottolineare un dato o differenziare due o più categorie.
Per questo motivo, anche se si è tentati di realizzare grafici con un grande appeal visivo, in alcuni casi potrebbe essere più opportuno attenersi a tipi di grafici che, anche se di base, si adattano meglio al nostro sistema cognitivo.
Perché l'uso corretto del colore è così importante nella visualizzazione dei dati
Uno degli obiettivi principali della data visualization è quello di comunicare rapidamente e in modo efficace le informazioni e di facilitarne il ricordo.
Una scelta strategica dei colori aiuterà a capire più facilmente il significato delle informazioni che si vuole trasmettere e i dettagli più importanti. Al contrario, un uso scorretto del colore rischierà di distogliere l’attenzione dai punti chiave e di rendere le informazioni poco chiare.
La figura 1 mostra un esempio di quanto detto. Immaginate che vi fosse chiesto di individuare il numero 3 a partire dalla prima tabella e poi di ripetere lo stesso esercizio utilizzando la seconda.
Figura 1. Contate il numero di 3
Come si può notare, nella seconda tabella il rosso e il grassetto permettono di individuare il numero di 3 molto velocemente, ancora prima di cominciare a leggere la prima riga di numeri.
Colori sequenziali, divergenti e categorici:
Prima di discutere nel dettaglio come utilizzare i colori nella data visualization, è importante distinguere tra colori sequenziali, divergenti e categorici.
Si definiscono schemi di colore sequenziali singoli colori, la cui intensità passa da una tonalità molto chiara a una più scura.
Per schemi di colore divergenti si intende una o più coppie di colori sequenziali sfumati verso il centro, spesso di colore neutro. Tipicamente, questi colori sono usati per mostrare dati che si discostano da una quantità media.
Si definiscono schemi di colori categorici insiemi di colori distinti che non sono caratterizzati da nessun ordine definito.
Figura 2: esempi di schemi di colore divergenti, sequenziali e categorici.
Utilizzare i colori sequenziali o divergenti per mostrare dati correlati
La scelta di colori sequenziali risulta particolarmente efficace nel caso in cui si voglia presentare dati correlati. In questo caso, i colori saranno assegnati ai dati in un continuum basato sul criterio dell’intensità del colore.
È possibile adoperare un singolo colore, variandone la tonalità per indicare un intervallo di valori. In questo caso, l’intensità del colore varierà in base alle dimensioni del dato: maggiore è il dato, più intenso sarà il colore.
Figura 3. Livello del rischio di perdere la casa per Stato negli Stati Uniti.
La mappa rappresentata nella figura 3, ad esempio, sfrutta le differenze di ombreggiatura del rosso all'interno di aree predefinite per indicare i valori in quelle aree.
Talvolta invece può essere utile sfruttare schemi di colori divergenti come ulteriore elemento di differenziazione. Ad esempio, risulta particolarmente efficace contrapporre alle due estremità colori caldi come il giallo o il rosso a colori freddi come il blu o il verde (Figura 4).
Figura 4. Il potere d'acquisto di 100 dollari per contea negli USA.
Usare colori contrastanti per confrontare variabili categoriche
Al contrario, quando si vuole confrontare o contrapporre due metriche non correlate, scegliere colori a contrasto tra loro permette di mostrare più facilmente l’opposizione tra le due.
Solitamente l’uso del colore a contrasto viene applicato nel caso di variabili categoriche, e cioè di variabili che assumono etichette distinte senza un ordine intrinseco. In questo caso, ad ogni valore sarà assegnato un colore distinto.
Nella figura 5, ad esempio, il viola, il blu, l’azzurro e il verde sono stati utilizzati per distinguere le diverse generazioni una dall’altra.
Figure 5. Indebitamento delle famiglie per generazione negli Usa.
A volte i colori possono essere associati ad altri elementi visivi, come nella figura 6, in cui la dimensione della bolla indica la grandezza del dato, mentre il rosso e il rosa sono stati usati per distinguere i Paesi dalle Aziende.
Figura 6. Confronto della capitalizzazione di mercato di alcuni Paesi rispetto ad alcune tech company.
È possibile infine pensare di sfruttare associazioni semantiche tra alcuni concetti e colori, ad esempio tra il rosso e il pericolo, tra il giallo e l’oro o tra il verde e il denaro. Nella figura 7, ad esempio, i colori blu e rosso sono stati utilizzati per differenziare i dati relativi al partito democratico da quello repubblicano.
Figura 7. Confronto tra i costi del partito democratico e repubblicano per le elezioni presidenziali tra il 2000 e il 2020.
Utilizzate i colori per sottolineare informazioni importanti
I colori possono essere usati anche evidenziare meglio un dato rispetto ad altri. È possibile usare colori più accesi o colori diversi per far risaltare dati che si ritiene importante far emergere, che siano questi una linea o punto di un grafico o una parola in un testo.
Ad esempio, nella figura 8, partendo da una base di colore arancione, il giallo è stato usato per mostrare il Paese che assume il valore più alto (le Filippine), mentre il bianco per indicare la media globale.
Figure 8. Media delle ore trascorse al giorno su Internet in diversi Paesi.
Utilizzare il colore per sottolineare dati atipici
Nella data visualization i colori aiutano non solo a identificare rapidamente le principali tendenze ma anche anomalie e dati atipici, come nella figura 9, in cui il rosso è stato usato per far risaltare i valori negativi.
Figura 9. Performance delle 10 migliori società classificate per GDX Index.
Alcune buone pratiche per una buona visualizzazione dei dati
Concludiamo questo articolo elencando tre regole che consigliamo di seguire quando realizziamo una dashboard o un grafico:
Non utilizzare troppi colori contemporaneamente. Generalmente, si consiglia di non inserire più di sei colori per cruscotto o grafico;
Non scegliere colori non facilmente distinguibili e scegliere uno sfondo appropriato ai colori scelti;
Mantenere coerenza dei colori tra grafici che si che contengono informazioni riferite allo stesso gruppo. Quando tra un grafico e l’altro i colori cambiano il loro significato, le informazioni diventano più difficili da capire
Fonti:
http://www.gnuplotting.org/color-maps-from-colorbrewer/
https://www.visualcapitalist.com/mapped-the-risk-of-eviction-and-foreclosure-in-u-s-states/
https://www.visualcapitalist.com/visualizing-u-s-household-debt-by-generation/
Comments