Quando sviluppi un modello di regressione lineare, per informare correttamente la rivista o comunque il lettore che prenderà in mano il tuo articolo, devi fornire una serie di informazioni che indichino almeno:
la dimensione dell’effetto che vuoi stimare;
la sua significatività statistica;
Quanto, in termini percentuali, il modello che proponi spiega il fenomeno che sei andato ad osservare
Qualche frase più in su ho usato il termine “almeno” perché in realtà sono da suggerire anche una serie di altre informazione tra cui, molto importante è la distribuzione degli errori di stima del tuo modello.
Ma rimaniamo proprio sull’ABC della questione, facendo finta che il tuo reviewer non sia particolarmente esigente.
La dimensione dell’effetto che vuoi stimare e il suo Intervallo di Confidenza
In un modello di regressione multipla il coefficiente di regressione del tuo intervento è quello che ti serve e che devi riportare.
Mettiamo che il tuo outcome (la tua “Y”, o “variabile dipendente” se preferisci) sia la “pressione intracranica” dei tuoi pazienti, misurata in millimetri di mercurio.
Il tuo intervento invece è l’uso del farmaco “x” rispetto al controllo “z”.
Mettiamo che la tua analisi ti dia come coefficiente 2.3 (e un suo intervallo di confidenza ovviamente). La stima dell’effetto, in questo caso la puoi scrivere in questo modo:
“2.3 millimetri di mercurio è la differenza media tra i tuoi pazienti trattati con il farmaco “x” rispetto a quelli trattati con il farmaco “z”.
Ora diciamo che il tuo trattamento sia indicato “in continuo”, come ad esempio la quantità di farmaco somministrato, misurato in milligrammi.
Allora la stima del tuo effetto andrebbe riportata così:
“per ogni milligrammo di farmaco in più, hai un aumento di 2.3 millimetri di mercurio di aumento della pressione intracranica nei tuoi pazienti”.
Ovviamente, come anticipato nel titolo del paragrafo, oltre ai coefficienti di regressione, ricordati di riportare anche i loro Intervalli di Confidenza (senza di essi, le tue stime significherebbero…niente!).
La significatività statistica del tuo effetto
Non c’è bisogno che te lo presenti: devi riportare il p-value associato al tuo coefficiente di regressione. Attenzione: molte volte il p-value, e in particolare il limite di significatività di 0.05, viene visto come il limite tra il grande successo da festeggiare in pizzeria e lo sconforto più totale. La verità è che il p-value è un valore che va sempre interpretato, alla luce ad esempio della tua dimensione campionaria e della stima dell’effetto stessa, di cui ti ho parlato sopra.
Tuttavia la faccenda del p-value la affronterò in altri post. Tu, intanto ricordati di riportarlo. So che è difficile dimenticarsene, ma io in uno dei mie primi lavori…ci sono riuscito.
Quanto in termini percentuali il tuo modello spiega il fenomeno osservato durante il tuo esperimento
I modelli statistici non ti dicono nessuna verità, non ti illudere. Tuttavia servono a spiegare (quando ci riescono) i dati che hai osservato durante la tua sperimentazione. L’importante è capire “quanto” spiegano i tuoi dati. Nel caso dei modelli di regressione lineare questa informazione è data da un valore chiamato “coefficiente di determinazione”, che probabilmente tu conoscerai come R-quadro.
Cosa rappresenti esattamente R-squared lo vediamo in un altro momento; ti basti sapere che può assumere un valore da 0 a 1. Ad esempio un R-quadro di 0.4 vuol ire che ti spiega il 40% dei dati. Un R-qaudro di 0.83, l’83% dei dati e così via. Capisci molto bene che più è alto l’Rquadro meglio è, anche se non sempre un Rquadro alto è indicativo di una buona regressione. È vero, però, anche il contrario: un R-quadro più bassino, ad esempio 0.3 non è necessariamente da buttare via. In alcune discipline gli Rquadri sono quasi sempre bassi, ad esempio in ambito psicometrico. Capisci bene che, in tal caso, allora uno studio con Rquadro ridotto può essere informativo e confrontato con altri risultati della letteratura.
Un caro saluto.
Gianfranco
Ti serve aiuto? Contattaci. Noi di StatsImprove abbattiamo notevolmente i costi dei servizi di supporto per darne accesso, oltre che alle aziende, anche a gruppi di ricerca universitaria e studenti (dottorandi, specializzandi, laureandi).
Contattaci con un click: