Què és un histograma? És el mateix que un diagrama de barres?

Sembla que no tots tenim clar quina és la resposta. I si un comença a consultar llibres de secundària, d’universitat, Internet… acabam d’embullar-nos, perquè cadascú diu la seva.

A continuació pos els gràfics que crec són correctes:

Diagrama de barres: idoni per representar gràficament les dades d’una variable quantitativa discreta (o qualitativa). Les modalitats de la variable es representen a l’eix X i s’aixeca una barra d’altura igual a la freqüència de cada modalitat.

L’elecció de l’eix X per les modalitats i l’eix Y per les freqüències és arbitrària i no és estrany veure diagrames amb les modalitats a l’eix Y.

Histograma: s’utilitza per representar gràficament les dades d’una variable contínua (o quantitativa discreta amb moltes modalitats), que han estat agrupades en (intervals de) classes. A un eix (X) representam les classes, tenint en compte l’amplitud dels intervals, i a l’altre eix (Y) aixecam un rectangle d’àrea igual a la freqüència de la classe.

Una de les utilitats de l’histograma és poder veure de quina manera es distribueixen les dades (distribució de la variable). I com ja hem dit, als histogrames, a diferència dels diagrames de barres, no és l’altura el que determina la freqüència de cada classe, sinó l’àrea del rectangle. I això ho fan malament a molts de llibres de secundària. Si tots els intervals tenen la mateixa amplitud no hi ha problema, però si no és així i agafam una definició d’histograma que digui que hem d’aixecar un rectangle d’altura igual a la freqüència, llavors això no és un histograma (és una mena de diagrama de barres per a variables quantitatives contínues) i no ens serveix per veure la distribució de la variable.

No sé on radiquen les causes de la confusió però cal que almanco les institucions educatives, els docents i els llibres de text ho tinguin clar i deixin de confondre la gent. Vos anim a que pegueu una ullada als llibres de text que estau emprant a classe.

Per altra banda, “histogrames” com aquest, fet pel programa Excel (Anàlisi de dades), no ajuden molt a esclarir el tema:


Aquest és el resultat si demanam a Excel que faci un gràfic de barres (columnes) de les mateixes dades ja agrupades en intervals:


Quina és la diferència?

Aquesta definició ja m’agrada una mica més.