Cos’è un istogramma e chi è Karl Pearson
Un istogramma è un tipo di rappresentazione grafica utilizzato per visualizzare la distribuzione di frequenza di dati relativi a una variabile. Questo strumento viene impiegato nelle statistiche per mostrare quante variabili di uno specifico tipo si verificano all’interno di intervalli specifici chiamati “bins”. Si distingue da un semplice grafico a barre poiché rappresenta un insieme di dati continui, piuttosto che discreti.
Karl Pearson, matematico e statistico britannico, è l’inventore di questo metodo di grande impatto e facile interpretazione. Nel 1891, Pearson coniò il termine “istogramma” per indicare il suo utilizzo come “diagramma storico”, spiegando anche come potesse essere impiegato nello studio della storia per tracciare periodi di tempo storici.
Utilità e costruzione di un istogramma
Questo tipo di rappresentazione permette di valutare la distribuzione dei dati, individuare valori anomali e comprendere gli indici di dispersione. Nella costruzione di un istogramma, vengono tracciate due linee perpendicolari sul grafico, in cui l’asse delle ordinate indica la frequenza. Gli intervalli vengono adattati ai dati disponibili, preferibilmente con dimensioni uguali per facilitare la lettura.
Nell’istogramma, l’altezza di ogni rettangolo rappresenta la frequenza dei dati, poiché l’area del rettangolo corrisponde alla frequenza stessa. Un’errata interpretazione dell’altezza delle barre come indicazione della frequenza è comune quando gli istogrammi presentano barre equidistanti, poiché in questi casi l’altezza del rettangolo riflette effettivamente la frequenza.
Esempio pratico
Ad esempio, consideriamo un insieme di dati relativi al pagamento di un lavoratore per ogni ora lavorata. Attraverso la costruzione di un istogramma, possiamo visualizzare in modo chiaro la distribuzione di questi dati. Supponendo di avere dati con un intervallo di base di 26, potremmo ottenere un’immagine chiara della distribuzione dei pagamenti per ora di lavoro.
Nell’esempio sopra riportato, possiamo osservare come vengono suddivisi i lavoratori in base al pagamento per ora di lavoro. Questa rappresentazione grafica fornisce una panoramica immediata della distribuzione dei dati, permettendo di identificare trend o valori eccezionali in modo efficiente.