Randomness e Randomised controlled trials
Riflessioni sull'uso dei RCT nelle scienze sociali
Per chi si occupa di esperimenti, l’uso di RCT (Randomised controlled trials) è divenuto lo standard. Rimane il meccanismo più efficace per permetterci una inferenza causale. Infatti, la randomizzazione dovrebbe raggiungere questo obiettivo: un bilanciamento di altre influenze causali che potrebbero influire sul risultato. Supponiamo che il trattamento funzioni solo per le donne, ma noi ricercatori non lo sappiamo. La randomizzazione aiuta a garantire che un numero di donne pari a quello dei controlli sia sottoposto al trattamento. Supponiamo che il trattamento funzioni due volte meglio per i partecipanti con il tipo genetico ABCD. La randomizzazione dovrebbe bilanciare anche questa differenza (anche se noi ricercatori non facciamo test genetici e siamo completamente ignari di questa influenza). Forse il trattamento funziona meglio se il farmaco viene assunto dopo i pasti. La randomizzazione (e il cecità) dovrebbero bilanciare anche questo aspetto.
Ma il punto è che la randomizzazione bilancia queste influenze solo in base alle aspettative. Naturalmente, potrebbe accadere che, casualmente, un numero sostanzialmente maggiore di donne sia in trattamento rispetto al controllo. È solo improbabile se il numero di partecipanti N è abbastanza grande. Se avessimo un N di 200 in ciascun gruppo, le probabilità sono eccellenti che il numero di donne sia simile tra i gruppi, anche se ovviamente rimane una minuscola possibilità (6 x 10^-61 assumendo il 50% di donne) che 200 donne siano assegnate casualmente al trattamento e nessuna al controllo.
E c'è un'altra cosa: le persone (o qualsiasi altra unità sperimentale) hanno un numero infinito di proprietà. Per esempio: la lunghezza dei capelli (cfr. Rubin 1974), la secchezza della pelle, il cognome della maestra d'asilo, i giorni in cui non hanno mangiato un burrito, la vicinanza di Marte nel giorno del loro quarto compleanno....
Se si combinano queste due cose, ne consegue che: Per qualsiasi N finito, ci saranno infinite proprietà che non sono bilanciate tra i gruppi dopo la randomizzazione, solo per caso. Se una di queste proprietà è una proprietà che deve essere bilanciata per poter concludere con certezza che il trattamento ha avuto un effetto, allora non possiamo concludere con certezza che il trattamento ha avuto un effetto.