Regressió lineal matemàtica
Tenc un problema matemàtic (!): tothom sap que donats
punts:
, podem trobar
una recta que minimitza els quadrats de les distàncies de les
: l’anomenada recta de regressió (per mínims quadrats) de
sobre
.
El problema que té aquesta recta és que, encara que les dades siguin creixents i que tothom esperi tenir valors esperats majors que els valors que es tenen, de vegades passa que
amb
; el que molts de cops no té sentit si
representa mesures creixents.
Per evitar això, me deman si existeix (estic segur que sí, el problema és trobar-la
) una recta de regressió creixent si les dades són creixents, és a dir,
tal que
si
i que, òbviament, minimitzi 
Hola Xavi,
(per què no imposar que si
aleshores
per a tot
?), també pots estar donant massa importància a una observació errònia: pensa en (1,1), (2,2), (3,3), (4,4), (5,5), (6,6) (8,7).
la veritat és que no crec que aquesta recta de regresió creixent teva sigui sempre una bona solució. A banda de donar massa importància a
Però en tot cas, pots trobar (o almenys aproximar) el que cerques de la manera següent. Cerques
tal que
per a tot
, és a dir,
per a tot
. Això és equivalent a
, és a dir,
per a quqalque $\latex c$.
Així doncs, el que cercam és
i
tals que si
,
sigui mínim. Levat del fet que aquí la
surt elevada al quadrat, és un problema d’optimització que si no es pot resoldre, es podrà aproximar.
14 Octubre 2007, 12:27 amel valor de
Quin desastre! Què malament que queda el latex als comentaris! En fi… En tot cas, veig que he fet un error, que volieu, en aquestes hores! He suposat que a>0 (no more latex), suposo que si les dades son creixent la recta serà creixent. En el pitjor dels casos, substitueix a per a^2 i segur que tindrà pendent positiva.
14 Octubre 2007, 1:19 amGràcies, Xesc, pels comentaris.
Miraré si trob els valors de a i c.
La setmana passada vaig intentar trobat una solució al problema i me va sortir que no tenia solució, encara que no record quines assumpcions vaig fer, i ara mateix no ho tenc a mà.
Ho cercaré a veure què vaig fer i ho comentaré, i compararé amb la teva proposta.
I sí, som conscient de què donc molta importància al darrer valor, però realment per moltes dades (per exemple la despesa en investigació, població a una zona geogràfica, etc. depenen molt fortament del darrer valor i sempre creixen)
Ja diré coses…
Gràcies de nou
14 Octubre 2007, 6:55 amXesc, et diré que a mi m’ha sortit que no existeix aquesta recta. Bé, de fet, la recta
(impòs que
trobava la condició
per
massa forta). Me surt que a ha és negatiu el que clarament no va, ja que hem dit que els y_i són creixents.
Si vols la demostració la tenc.
Gràcies.
15 Octubre 2007, 11:26 am