Quando analizziamo dei dati, una delle regole intoccabili che ci vengono insegnate è che non bisogna interpretare gli effetti principali quando la loro interazione è statisticamente significativa.
In realtà questa regoletta è, in alcuni casi, una sconveniente semplificazione. Per quanto mi riguarda, infatti, è vero il contrario: quando dall’analisi dei tuoi dati emerge un’interazione significativa è assolutamente necessario descrivere e dare un’interpretazione di quanto ci dicono gli effetti principali.
Vediamo due esempi. Nel primo esempio la regoletta risulta essere corretta. Nel secondo esempio invece no.
Esempio #1: effetti principali non interpretabili
Analizziamo il valore di pressione media in relazione all’età in due gruppi: soggetti che si alimentano in modo ipercalorico e soggetti che si alimentano in modo normocalorico.
Il tuo endpoint è la pressione arteriosa.
I due effetti principali sono l’età e il tipo di alimentazione (normo o ipercalorica).
Otterrai un andamento di questo tipo:
Diciamo che tu ottenga che sono significativi sia gli effetti principali che l’interazione.
Ha senso in questo caso interpretare gli effetti principali?
No.
La pressione arteriosa, cioè, salirà solo per una delle due categorie (alimentazione ipercalorica) mentre per le persone che si alimentano in modo normocalorico rimarrà stabile per tutta la vita (o aumenterà leggermente).
In questo caso l’effetto principale “età” potrà risultarti significativo perché il tuo test considererà l’effetto medio del tempo su entrambi i gruppi, e il contributo in questo caso del gruppo “dieta ipercalorica” rende significativo il test.
Per questo motivo non è interpretabile l’effetto principale “età”. L’età incide sul valore di pressione in uno dei due gruppi e non in entrambi.
Lo stesso vale per l’effetto principale “tipo di dieta”: esso potrà risultare significativo ma solo dopo una certa età (fino a circa quarant’anni, infatti, i due gruppi hanno una pressione del sangue uguale, grazie ai meccanismi di compenso della gioventù).
Il tipo di dieta, cioè, determina la pressione sanguigna ma solo dopo una certa età.
In questo caso si può interpretare solo l’interazione: il valore, cioè, di uno degli effetti principali va interpretato alla luce del valore dell’ altro effetto principale. Stop.
Esempio #2: effetti principali interpretabili
Nell’esempio che segue è diverso.
In questo esperimento abbiamo 2 gruppi: uno di individui affetti da ipercolesterolemia familiare ed un gruppo, invece, di individui senza la malattia.
L’endpoint dello studio è la colesterolemia monitorata per il corso di tutta la vita.
I risultati che otteniamo sono gli stessi del primo esempio: sono significativi sia gli effetti principali (età e gruppo iperolesterolemia/sani) sia la loro interazione.
Questo grafico però ci dice chiaramente che l’effetto principale presenza/assenza della malattia è presente lungo il corso di tutto lo studio, indipendentemente dall’età.
Già dalla nascita il fatto di essere affetti o non essere affetti da ipercolesterolemia familiare determina in modo significativo il valore di colesterolo nel sangue. Poi, l’effetto dell’interazione tra la presenza della malattia con l’età può far aumentare questa differenza (soprattutto se la malattia non viene trattata).
Questo è uno scenario in cui l’effetto principale ci da un informazione ben precisa e che va interpretata e comunicata nel momento in cui pubblichiamo i risultati dello studio.
Per riassumere, quello che dovrebbe rimanere nella testa del ricercatore che interpreta i dati, è che in Statistica Medica ciò che conta è il significato che hanno i dati. Affidarsi a delle “regole prestabilite” può essere comodo e a volte decisamente utile, ma questa non vuol dire che siamo esentati dal dover osservare e interpretare la realtà clinica che ci descrivono i dati.
Ciao!
Gianfranco Di Gennaro