Determinantkoefficient

Kvadratet af korrelationskoefficienten (r2, om end ofte symboliseret som R2) har en særlig fortolkning.

Kendt som determinantkoefficienten, er r2 den andel af den samlede variation af y, der kan forklares med variationen af x.

Hvad betyder dette? Det er klart, at som y ændres, ændres x også; det vil sige, som x bevæger sig væk fra sit eget gennemsnit, bevæger y sig væk fra sit eget gennemsnit. Hvis r2 er 1,0, så forklarer variationen af x 100% af variationen af y og alle datapunkter ligger på regressionslinjen. Men hvis r2 for eksempel er 0,86, så forklarer variationen af x kun 86% var variationen af y og datapunkterne falder ikke alle nøjagtigt på regressionslinjen. De resterende 14% af variationen af y tegner kendte eller ukendte faktorer sig for; med andre ord, flytter faktorer andre end variationen af x den faktiske y-værdi væk fra regressionslinjen.

Dette fører til en anden tolkning af r2. Hvis der ikke var nogen korrelation overhovedet, ville forudsigelse af y-værdien ud fra x-værdien ikke være bedre end blot at citere gennemsnittet af y-værdierne. Hvis korrelationen var perfekt, ville der derimod følge tre konklusioner: (1) r2 ville være lig med 1, (2) variationen af x ville forklare alle variationerne af y og (3) brug af regressionslinjen til forudsigelse af y-værdier ud fra x-værdier, ville have 100% mindre fejl, end blot at citerer gennemsnittet af y-værdierne. Derfor kan r2 betragtes som den forholdsmæssige nedsættelse af fejl, der fremkommer af at bruge regressionslinjen til at forudsige y-værdier fremfor at bruge gennemsnittet. En r2 på 0,81 betyder ikke blot at variationen af x står for 81% af variationen i står for 81% af variationen af y, men også at fejlen i forudsigelser af y-værdier ud fra regressionslinjen er 81% mindre end det ville være at forudsige y-værdier ud fra gennemsnittet.

Back to Top