Diu 14 Oct 2007
Què és un histograma? És el mateix que un diagrama de barres?
Sembla que no tots tenim clar quina és la resposta. I si un comença a consultar llibres de secundària, d’universitat, Internet… acabam d’embullar-nos, perquè cadascú diu la seva.
A continuació pos els gràfics que crec són correctes:
Diagrama de barres: idoni per representar gràficament les dades d’una variable quantitativa discreta (o qualitativa). Les modalitats de la variable es representen a l’eix X i s’aixeca una barra d’altura igual a la freqüència de cada modalitat.
L’elecció de l’eix X per les modalitats i l’eix Y per les freqüències és arbitrària i no és estrany veure diagrames amb les modalitats a l’eix Y.
Histograma: s’utilitza per representar gràficament les dades d’una variable contínua (o quantitativa discreta amb moltes modalitats), que han estat agrupades en (intervals de) classes. A un eix (X) representam les classes, tenint en compte l’amplitud dels intervals, i a l’altre eix (Y) aixecam un rectangle d’àrea igual a la freqüència de la classe.
Una de les utilitats de l’histograma és poder veure de quina manera es distribueixen les dades (distribució de la variable). I com ja hem dit, als histogrames, a diferència dels diagrames de barres, no és l’altura el que determina la freqüència de cada classe, sinó l’àrea del rectangle. I això ho fan malament a molts de llibres de secundària. Si tots els intervals tenen la mateixa amplitud no hi ha problema, però si no és així i agafam una definició d’histograma que digui que hem d’aixecar un rectangle d’altura igual a la freqüència, llavors això no és un histograma (és una mena de diagrama de barres per a variables quantitatives contínues) i no ens serveix per veure la distribució de la variable.
No sé on radiquen les causes de la confusió però cal que almanco les institucions educatives, els docents i els llibres de text ho tinguin clar i deixin de confondre la gent. Vos anim a que pegueu una ullada als llibres de text que estau emprant a classe.
Per altra banda, “histogrames” com aquest, fet pel programa Excel (Anàlisi de dades), no ajuden molt a esclarir el tema:

Aquest és el resultat si demanam a Excel que faci un gràfic de barres (columnes) de les mateixes dades ja agrupades en intervals:

Quina és la diferència?
Aquesta definició ja m’agrada una mica més.
14 Octubre 2007 a les 7:11
Eco, la diferència és aquesta: altura vs àrea. Encara que com molt bé dius no tothom ho té clar.