I dati sono uno strumento fondamentale per capire il mondo e prendere decisioni informate. Tuttavia, l’interpretazione corretta di tali dati può risultare complessa. Due fenomeni possono presentarsi nel tempo in modo tale da far sembrare uno la causa dell’altro, tuttavia potrebbe trattarsi di una semplice coincidenza o dell’esistenza di un terzo evento che influenza entrambi. Distinguere tra coincidenze e veri rapporti di causa-effetto è cruciale in ambiti come la sanità, la politica e l’economia, dove le decisioni si basano sull’interpretazione dei dati. Questo articolo esplora il significato della correlazione tra fenomeni, le correlazioni spurie e l’importanza di non confondere la correlazione con la causalità.
Fenomeni che sembrano legati tra loro, ma non lo sono
Indice Articolo
Un esempio illustrativo è il grafico che indica se la riduzione del consumo di gelati porta a una diminuzione dei divorzi in Alabama. Evidentemente, la quantità di gelato consumata negli Stati Uniti non ha alcuna influenza sul numero di divorzi in Alabama, ma un’analisi superficiale dei dati potrebbe far pensar ad un legame.
Grafico che mostra l’andamento nel tempo del consumo di gelato (in nero) e numero di divorzi in Alabama (in rosso). I due grafici sono simili, ma chiaramente i due eventi non sono uno causa dell’altro. Credit: Chart by Tyler Vigen, tylervigen.com, CC BY 4.0
Dal 1999 al 2020, il consumo di gelato negli Stati Uniti e il numero di divorzi in Alabama hanno mostrato un trend decrescente. Questo comportamento simile potrebbe far pensare che una riduzione del consumo di gelato possa associarsi a una diminuzione dei divorzi. Tuttavia, è fondamentale considerare che tale correlazione potrebbe derivare da una terza variabile che non è stata presa in considerazione.
Due variabili sono correlate quando cambiano insieme
Due variabili si definiscono correlate quando la variazione di una è accompagnata dalla variazione dell’altra. La correlazione esprime questa tendenza e può essere rappresentata attraverso un coefficiente compreso tra -1 e 1:
- 1: correlazione positiva, con un aumento di una variabile corrisponde anche un aumento dell’altra.
- -1: correlazione negativa, con un aumento di una variabile corrisponde una diminuzione dell’altra.
- 0: nessuna correlazione, le due variabili procedono in modo indipendente.
Ad esempio, il numero di ciabatte da mare vendute e il numero di persone attaccate da una medusa aumentano durante l’estate e diminuiscono in inverno, evidenziando una correlazione. Tale somiglianza può portare a pensare erroneamente a un nesso causale tra i fenomeni, ma è importante non cadere in questa trappola mentale.
Correlato non vuole per forza dire causativo
Una correlazione forte non implica necessariamente una relazione causale. Nell’esempio delle ciabatte e delle punture di medusa, entrambi i fenomeni sono correlati senza che l’uno causi l’altro. L’acquisto di ciabatte non aumenta il rischio di un attacco di medusa, né viceversa. Per stabilire un rapporto di causalità, è necessario adottare tecniche di inferenza causale, utili per isolare il vero nesso tra cause ed effetti.
Quando si fanno analisi su coincidenze del tipo gelati-divorzi o ciabatte-punture, ci si trova di fronte a correlazioni spurie.
Cosa sono le correlazioni spurie
Una correlazione spuria si verifica quando due o più variabili appaiono correlate senza un vero legame causale. Questa situazione può derivare da una coincidenza o dall’esistenza di un fattore confondente. L’esempio dei divorzi e dei gelati mette in luce questa problematica, mostrando una correlazione elevata (0.967) senza legame causale. Altri esempi curiosi, come il numero di birrifici negli Stati Uniti rispetto all’energia solare generata in Perù (correlazione = 0.978) o il numero di lauree triennali in psicologia rispetto al numero di giardinieri in Utah (correlazione = 0.990), evidenziano come spesso queste correlazioni siano il frutto del caso.
Nell’analisi delle punture di medusa e della vendita di ciabatte, la correlazione è determinata da un fattore confondente, l’andare al mare, che connette entrambe le variabili. Se una persona va al mare, avrà bisogno di infradito e l’esposizione all’acqua incrementa il rischio di attacchi da parte delle meduse. Questo illustrando come variabili esterne possano influenzare eventi senza una relazione di causalità diretta.
Comprendere e saper distinguere tra correlazione e causalità è cruciale per la presa di decisioni informate in settori vitali come la medicina, la politica e l’economia.