La distribució normal a processos de convocatòria periòdica
Aquí teniu la distribució per edats dels docents de les Illes Balears. Per exemple, la dels Professors d’Ensenyament Secundari al Centres Públics a l’Illa de Mallorca és:
Anys Persones 20-24 5 25-29 285 30-34 650 35-39 588 40-44 529 45-49 397 50-54 290 55-59 184 60-64 75 Més de 64 9
Aquesta és una dada interessant: per una part, interessa als docents, ja que permet vislumbrar contra qui “competim” i quantes places és probable que surtin a concurs de trasllats/oposició l’any que ve (places que ocupen els majors de 64 anys); i per una altra perquè pareix que les dades es reparteixen segons una corba normal.
Realment és així? Si la resposta és afirmativa, quins paràmetres
fan que
estigui el més aprop possible a les dades?. Aquestes preguntes són fàcilment responibles.
El que probablement no és tan fàcil de respondre és per què dades que sorgeixen d’un procés periòdic s’acaben modelant en forma de corba normal (si és que al final és així). Vull dir, idealitzant-ho tot molt: al principi dels temps
ningú era professor. Els primers professors degueren ser les primeres persones que acabaren la carrera i que varen aprovar les primeres oposicions. Per tant, la distribució d’edats era de
professors entre 20-24 anys i la resta 0. Després de
anys, es tornen a convocar unes altres oposicions (per la nova fornada de llicenciats més la gent que no va aprovar les primeres). La gent que aprova aquestes oposicicions és o bé de 20-24 (els novell) o bé de 20-24 + k anys (els que no varen aprovar). Per tant, després de k anys, tenim una distribució composta per aquesta gent que aprova les oposicions més la gent que va aprovar les oposicions anteriors, de 20-24 + k (que n’hi ha X)…..
Si suposem que cada cop surten les mateixes places, que transcorren els mateixos anys entre oposició i oposició, i que la gent que aprova cada oposició està distribuïda igualitàriament entre la gent recent llicenciada, la gent que ha suspès unes oposicions, la gent que n’ha suspeses dues, etc. (ho sigui, el fet que un aprovi és independent dels anys que duu estudiant), aleshores algú pot provar que surt una normal al llarg del temps?
Hola Xavi. M’agraden molt les qüestions que planteges. Si tingués temps me posaria a fer coses però ara mateix estic bastant enfeinat. Bé, per si de cas qualcú s’anima a fer la primera part (comprovar si les dades segueixen una distribució normal o no) i no ha sentit mai parlar d’aquestes coses podeu pegar una ullada al que s’anomenen tests de normalitat. Per exemple a: http://en.wikipedia.org/wiki/Normality_test
Per altra banda, m’agradaria destacar positivament el matís que fas: no es el mateix saber que una cosa és certa (o falsa) que saber per què és certa (o falsa). Molts de pics no ens aturam a pensar aquestes coses i tenen la seva importància, sobretot si volem entendre les coses a un altre nivell.
Salutacions,
13 Maig 2008, 1:32 pmFélix.
M’afalaguen els teus cumplits
Sobre l’entrada, no pretenia que la gent es posàs a calcular, simplement volia veure si qualcú sabia _per què_ aquest procés desembocava (possiblement) en una corba normal.
És que realment la normal apareix per tot…. per alguna cosa s’ho deu dir….
13 Maig 2008, 3:39 pmXavi
Hola
El procés que descrius no té per què conduir a una normal, de fet duria a una distribució de probabilitat possiblement creixent. Hi ha d’haver dos factors més en compte: retirades del sistema més probables com més vells (no només surten tots els que passen d’una edat, sinó a més un percentatge de cada franja d’edat, i aquest percentatge creix amb l’edat) i entrada al sistema MENYS probables com més vells. Si no, estaries dient que si a una normal (la distribucio d’ara) la corrs un lloc a la dreta, li sumes una constant a cada lloc i li restes un percentatge constant a cada lloc, i talles a partir de 65, torna a donar normal….. i no (mira la teva taula i fes aixo que et dic, i ho veuras).
D’altra banda, si la poblacio de profes d’institut reflexa la distribució de la poblacio en general, aleshores sí que hauria de sortir normal. Però això és condició suficient, no necessària.
Justament aquest dies que m’agafes donant-me un “banyo” intesiu de probabilitats i estadística….
14 Maig 2008, 5:50 pmD’acord Xesc, les teves consideracions sempre són brillants. Tens raó que el procés tal com el descric no dóna una normal.
Sobre les teves consideracions en quant al procés real: les retirades segur que han de ser més probables quan més vells. En primer lloc, no basta que siguin equiprobables si considerem que l’entrada del sistema és menys probable quan més vell (o sigui només una condició no equiprobabilitat)?
Si la sortida fos equiprobable i l’entrada també quin sistema obtindríem?
Són preguntes interessants.
En general, en un sistema periòdic quines són les condicions necessàries i suficients per obtenir una normal quan n tendeix a infinit?
Per fixar la notació
O_i: ooposició i-èssima
A l’oposició O_i hi ha X_i places lliures
t_i = temps entre Oposició O_{i+1} i O_i
p(O_i, e) = probabilitat d’aprovar l’oposició O_i amb l’edat e
J(e) = probabilitat de jubilar-se a l’edat e
T_i = taula de les distribucions d’edats de la gent que ha aprovat a l’oposició i
i podem suposar que e efectivament està a [21, 64) (totes les probabilitats fora d’aquest rang són fàcilment calculables)
Ara només falta el teorema.
Tu dius que T_i –> Normal + “epsilon (t_i són iguals, etc)” ==> J(e) creixent, p(O_i, x) decreixent amb x
Ara toca pensar!!!!!
14 Maig 2008, 7:50 pmHola. Home, jo entenc que és una simplificació del problema real i que ja va bé intentar respondre les qüestions amb les condicions que planteja en Xavi, que en cap moment diu que forçosament hagi de sortir la distribució normal. Una vegada resolt podem pensar en modificar el problema depurant el model o restringint condicions. Posats a depurar, jo per exemple canviaria les condicions d’entrada del primer pic que s’omplen les places perquè no consider que la primera vegada s’omplís només amb persones que feia poc que acabaren. Fins i tot consider factible que puguem modelitzar la situació emprant equacions diferencials mirant-ho com una població amb una fita superior de creixement (nombre total de places) on moren (es jubilen) i neixen individus (aproven oposicions) [tampoc l’he pensat molt i segurament estic dient una burrada, evidentment no crec que ens servís per contestar la pregunta de la distribució de la població, però d’altres com l’estabilitat del sistema pot ser interessant]. De totes maneres ja dic que com a punt de partida em sembla un bon problema. I després ja es modificarà per crear d’altres que ens interessin, o per refinar el model… és una estratègia molt emprada, no?
15 Maig 2008, 5:08 pmSalutacions,
Félix.
Ei, Félix, problema interdisciplinar a la vista!
M’agrada això de les equacions diferencials: un altre enfoc. També podríem fer-ho amb equacions amb diferències.
Sobre la depuració que dius de la gent aprovada al principi… és una altra cosa a tenir en compte.
Però bé, més o menys, ja està establert el marc teòric: una població que creix o decreix periòdicament amb dos events: jubilar-se o aprovar oposicions, que depenen de l’edat dels individus.
Estaria bé saber quines condicions són necessàries per tenir normalitat. I ja no et dic suficients….
Fer-ho en general crec que és un problema difícil. Assumir certes condicions (creixements o decreixements de certes funcions com fa en Xesc) potser que doni els fruits.
Li hauríem de demanar a d’en Jaume Sunyer [http://dmi.uib.es/~jsuner/] i companyia [http://dmi.uib.es/~marc/]….
15 Maig 2008, 7:23 pm