Una procedura spesso poco considerata da chi analizza dati sperimentali è la centratura delle variabili.
Di cosa si tratta? Perchè può essere molto importante?
Prendiamo un banalissimo esperimento:
a 10 soggetti viene rilevato il reddito annuo e si vuole valutare se questo reddito è correlato:
con l’età;
con il sesso (diciamo 0 per i maschi, 1 per le femmine) e;
con il livello di educazione (diciamo: 0 per educazione “normale”, 1 per educazione “alta”).
Nel momento in cui noi andiamo a costruire un classico modello di regressione lineare otteniamo:
un’intercetta;
un coefficiente per l’età;
un coefficiente per il livello di educazione
un coefficiente per il sesso.
Diciamo che ora tu voglia interpretare l’intercetta. L’intercetta altro non è che il reddito medio quando il valore di tutte le variabili è 0.
Nel nostro caso l’intercetta rappresenterebbe il reddito medio dei maschi (sesso=0), di educazione normale (educazione=0) e….di zero anni!
Capisci bene che in questo modo il valore dell’intercetta risulta “non interpretabile” perché a zero anni è impossibile avere un reddito.
Per avere perciò un valore interpretabile puoi analizzare i dati utilizzando non direttamente l’età ma la variabile “centrata” ottenuta sottraendo l’età media ad ogni valore di età. Non è detto che tu debba sottrarre per forza la media; puoi “centrare” su qualsiasi altro valore, ma usare la media è forse il criterio più diffuso.
Mettiamo per assurdo che tu abbia 10 soggetti, e i valori di età fossero:
27, 35, 37, 37, 40, 45, 46, 52, 55 e 62 anni.
L’età media è 43,6 anni.
Invece di usare queti valori di età, nel tuo modello di regressione sottrarrai la media ad ognuno di loro:
-16,6, -8,6, -6,6, -6,6, -3,6, 1,4, 2,4, 8,4, 11,4 e 18,4.
In questo modo i coefficienti non cambieranno ma la nuova intercetta sarà interpretabile come il reddito medio dei maschi di educazione normale e di età media.
Questo è solo un esempio dell’utilizzo della centratura delle variabili sulla loro media, ma spero tu possa aver intuito le potenzialità di questa strategia.
Un caro saluto.