“Centrare” le variabili: cosa significa e a cosa serve

Una procedura spesso poco considerata da chi analizza dati sperimentali è la centratura delle variabili.
Di cosa si tratta? Perchè può essere molto importante?

Prendiamo un banalissimo esperimento:
a 10 soggetti viene rilevato il reddito annuo e si vuole valutare se questo reddito è correlato:
con l’età;
con il sesso (diciamo 0 per i maschi, 1 per le femmine) e;
con il livello di educazione (diciamo: 0 per educazione “normale”, 1 per educazione “alta”).

Nel momento in cui noi andiamo a costruire un classico modello di regressione lineare otteniamo:

un’intercetta;
un coefficiente per l’età;
un coefficiente per il livello di educazione
un coefficiente per il sesso.

Diciamo che ora tu voglia interpretare l’intercetta. L’intercetta altro non è che il reddito medio quando il valore di tutte le variabili è 0.

Nel nostro caso l’intercetta rappresenterebbe il reddito medio dei maschi (sesso=0), di educazione normale (educazione=0) e….di zero anni!
Capisci bene che in questo modo il valore dell’intercetta risulta “non interpretabile” perché a zero anni è impossibile avere un reddito.

Per avere perciò un valore interpretabile puoi analizzare i dati utilizzando non direttamente l’età ma la variabile “centrata” ottenuta sottraendo l’età media ad ogni valore di età. Non è detto che tu debba sottrarre per forza la media; puoi “centrare” su qualsiasi altro valore, ma usare la media è forse il criterio più diffuso.

Mettiamo per assurdo che tu abbia 10 soggetti, e i valori di età fossero:
27, 35, 37, 37, 40, 45, 46, 52, 55 e 62 anni.
L’età media è 43,6 anni.
Invece di usare queti valori di età, nel tuo modello di regressione sottrarrai la media ad ognuno di loro:
-16,6, -8,6, -6,6, -6,6, -3,6, 1,4, 2,4, 8,4, 11,4 e 18,4.

In questo modo i coefficienti non cambieranno ma la nuova intercetta sarà interpretabile come il reddito medio dei maschi di educazione normale e di età media.

Questo è solo un esempio dell’utilizzo della centratura delle variabili sulla loro media, ma spero tu possa aver intuito le potenzialità di questa strategia.

Un caro saluto.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *