Errori statistici #2: non verificare le assunzioni dei test utilizzati

Questo post fa parte di una serie di articoli dedicata agli errori statistici più frequenti che come reviewer, ma anche solo come lettore, mi capita di leggere nella letteratura scientifica.

In questo post #2 della rassegna vorrei evidenziare l’importanza delle assunzioni dei test utilizzati e come esse non vengano molte volte testate.

Quando utilizzi un test statistico per analizzare i tuoi dati devi giustificare l’uso di quel test, anche se si tratta solo di un banalissimo confronto tra medie. So che è una cattiveria per il ricercatore che la statistica la conosce poco o che si affida magari al collega che ne sa un po’ di più.

Ma fidati che sarà ancora più cattivo il reviewer che prenderà in mano il vostro lavoro. Ed è comunque ancora più cattivo da parte tua se pubblichi dati analizzati con test sbagliati.

Una seppur ridotta survey condotta all’Università di Groningen, Paesi Bassi, ha mostrato come in anche meno del 50% dei casi i ricercatori vadano a testare tra i loro dati le assunzioni dei test che utilizzano. Nella stragrande maggioranza dei casi è la mancanza di conoscenza di queste assunzioni. Capisci però bene che tutto questo è abbastanza allarmante.

Per evitare di fornire risultati affetti da bias e pertanto inutili o peggio ancora dannosi, quando stai per effettuare un test statistico ricordati di cercare quelle che sono le sue assunzioni, di verificarle e di riportare nel tuo articolo scientifico o tesi che sia cosa hai fatto per verificarle.

Attenzione: molto spesso la verifica di queste assunzioni non è sempre semplice e molto spesso serve un ragionamento ed un approfondimento che va oltre una semplice regoletta da applicare.

Prendiamo per esempio una delle assunzioni più basic che un ricercatore debba conoscere quando analizza dei dati: l’omoschedasticità in una analisi della varianza (ANOVA), cioè la stabilità della varianza dei residui in tutti i gruppi.

Per verificare questa assunzione esistono dei bellissimi test. Tuttavia questi stessi test hanno delle loro assunzioni. Ad esempio il Levene test per valutare l’omoschedasticità non è adeguato quando si ha a che fare con variabili distribuite in modo non normale (in tal caso è meglio usare il Bartlett test).

Inoltre bisogna aggiungere che il vincolo dell’omoschedasticità diventa meno stretto quando i gruppi che stai confrontando hanno  la stessa numerosità.

Insomma,  il concetto che vorrei trasmetterti con questo breve post è: ricordati che ogni test utilizzato deve essere adeguato al contesto. E per accertarsene non bisogna solo affidarsi a qualche p value estratto in fretta e furia dal tuo pc, ma serve un ragionamento, un’analisi profonda del contesto stesso. E ricordati, ovviamente, di riportare questo ragionamento alle persone a cui stai presentando i dati.

[one_half]
Ti serve aiuto? Contattaci e ti forniremo una soluzione.
La nostra struttura di network di professionisti ci permette di abbattere notevolmente i costi dei servizi di supporto e darne accesso, oltre che alle aziende, anche a gruppi di ricerca universitaria e studenti.
[contact-form-7 id=”140″ title=”Modulo di contatto 1″]
[/one_half]

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *