«L’irragionevole efficacia della matematica nelle scienze naturali»

riassunto
arte e mestiere
statistica
Buzzetti R
Un articolo pubblicato su JAMA ripropone la vecchia questione del rapporto di odio amore tra medici e statistica. A un test sottoposto a specializzandi statunitensi in medicina interna la proporzione di risposte corrette supera di poco il 40 per cento. E’ assodata la reale importanza della statistica nel background culturale dei medici per la comprensione sia degli articoli scientifici sia degli eventi clinici quotidiani. Quindi matematica e statistica dovrebbero entrare nel bagaglio di tutti i medici, privilegiando i concetti di base: la distinzione tra variabili qualitative, ordinali, quantitative; il concetto di media, mediana, quantili, deviazione standard; le basi dell’inferenza; gli elementi per leggere criticamente metodi e risultati degli studi. In poche parole, la statistica descrittiva.
parole chiave: 
statistica
Occhio Clinico 2008; 2: 26
<blockquote> <p><i><b>Roberto Buzzetti</b><br /> statistica medica<br /> rimini</i></p></blockquote> <p class="sommario">Il titolo del saggio di EugeneWigner, premio Nobel per la fisica nel 1964, rimanda alla necessità di imparare a leggere la realtà attraverso i numeri. La matematica, «serva padrona» dell’epidemiologia e della statistica rivelerà così i suoi strettissimi legami con la biologia.</p><p class="caso"><b> IL CASO | Tutta colpa del liceo classico</b><br /><br />Sono abbonato da molti anni al New England Journal of Medicine e al British Medical Journal; a sentire gli informatori del farmaco che parlano un po’ con tutti i colleghi della mia ASL, dovrei reputarmi una perla rara e andarne fiero. Io, in realtà, un po’ baro: quando leggo gli abstract o, peggio, un articolo per intero, salto a piè pari la parte dei metodi statistici, per planare sulle conclusioni, espresse concettualmente.<br /> Naturalmente ho il sospetto che fare così infici molto il valore della conoscenza acquisita, ma, purtroppo, né il liceo, né l’università mi hanno dato le basi per comprendere molti dei dati numerici che incontro nella lettura e la faticosa routine e la pigrizia che di conseguenza satura il mio tempo libero non mi hanno permesso di colmare il buco da autodidatta. La scarsa conoscenza statistica ed epidemiologica è una lacuna tutta italiana? Come sono messi all’estero?</p>Un articolo pubblicato su JAMA nel settembre scorso, ripropone la vecchia questione del rapporto di odio amore tra medici e statistica.<br /> Sottoposti a un test di valutazione delle conoscenze nell’ambito dei metodi statistici e dell’interpretazione degli studi clinici, 277 specializzandi statunitensi in medicina interna hanno fornito una performance che a qualcuno potrà apparire sorprendentemente scarsa, ma a chi scrive, invece, ampiamente prevedibile: la proporzione di risposte corrette supera di poco il 40 per cento (41,4 percento).<p class="AMbox"><b>BOX 1 | Fraintendere è peggio che non intendere</b><br /><br />Il concetto dimedia è noto a tutti,ma non sempre lo è quello dimedia ponderata. Lo si scopre con la seguente domanda trabocchetto: un gruppodi 20 soggetti ha una glicemia media pari a 90 mg/100 mL e un altro gruppo di 40 pazienti ha unamedia di 72mg/100mL.Qual è lamedia generale?Molti colleghi rispondono: 81 (90+72)/2, dimenticando che pesando le rispettive numerosità, lamedia non può che essere pari a 78/(90x20 + 72x40)/60. Quando poi le distribuzioni sonomolto lontane dalla gaussiana, lamedia ha scarso significato: molto meglio la mediana e i quantili. Ancor meno senso ha in questi casi la deviazione standard.Occorre diffidare delle deviazioni standard molto superiori alla media, chiaro indice di asimmetria o comunque di scarsa gaussianità. «L’incremento medio del FEV1 nel gruppo dei trattati è stato pari a 0,12 litri (DS 0,43)».<br /> Per quanto riguarda l’uso dei vari test statistici (test t di Student, testMann- Whitney, test esattodi Fisher) senza verificadel rispettodegli assuntidi base (numerositàinsufficiente, campioninondistribuiti inmodogaussiano), sarebbe sicuramenteopportunofornire le nozioni statistiche perdistinguerlo ai futuri medici,ma a quelli conmolti anni di professione già alle spalle dovrebbe poterbastare lafiducianei referee statistici ingaggiatidalle rivistepiùprestigiose. BOX 1 Il titolo del saggio di EugeneWigner, premio Nobel per la fisica nel 1964, rimanda alla necessità di imparare a leggere la realtà attraverso i numeri. La matematica, «serva padrona» dell’epidemiologia e della statistica rivelerà così i suoi strettissimi legami con la biologia.</p><p>Dunque un 4 in statistica ai medici americani? A quanto pare sì e non valgono amitigare il severo giudizio i particolari forniti nell’articolo: vanno un po’ meglio quelli con background di biostatistica (decisamente meglio, per fortuna, il personale universitario dirigente); leggermente meglio i maschi rispetto alle femmine. L’elemento di maggiore variabilità è dato dal tema specifico affrontato dalle singole domande. In due domande soltanto (su 16), quelle sul concetto di rischio relativo e di cecità, i partecipanti raggiungono una proporzione di risposte corrette superiore all’80 per cento. Sfiorano la sufficienza su temi come la specificità, il t test e il p value. Per il resto, i punteggi sono piuttosto preoccupanti (con tassi di risposte corrette intorno al 10 per cento) per argomenti quali i modelli di Cox, le analisi secondo Kaplan- Meyer (forse argomenti specialistici) e l’interpretazione degli intervalli di confidenza (proprio il core delle conoscenze statistiche!). A fronte di questi risultati non brillanti, il 70 per cento circa dei rispondenti dichiara di leggere regolarmente le migliori riviste mediche. Il pensiero corre inevitabile ai colleghi italiani: come se la caverebbero se sottoposti ad analogo test?<br /> L’incertezza della risposta porta ad alcune considerazioni: tra queste, innanzitutto quella sulla reale importanza della statistica nel background culturale dei medici, soprattutto per la comprensione degli articoli scientifici, ma anche degli eventi clinici quotidiani. Sarebbe ora di dare una risposta sincera alla domanda se la statistica e l’epidemiologia clinica debbano far parte del bagaglio culturale del medico pratico. Se essa è positiva (come dichiarano tutti), queste materie non potranno più essere insegnate in modo più o meno facoltativo, riservandole «a poche menti brillanti» e concedendo alla maggioranza degli studenti di dichiararsi «negata» per i numeri o addirittura fiera di anteporre alla loro freddezza la superiorità della pratica clinica e del rapporto con i pazienti.</p><p class="AMbox"><b>BOX 2 | Intervalli di confidenza e numerosità del campione</b><br /><br />E’ data troppa fiducia ai risultati positivi, legati a un basso valore di p: meglio gli intervalli di confidenza. E’ ben diverso leggere che «la terapia ha ridotto l’incidenza di ricadute cliniche del 10 per cento (p&lt;0,05)» piuttosto che «la terapia ha ridotto l’incidenza di ricadute cliniche del 10 per cento (IC 95%da 1 a 17)». Nel secondo caso il lettore può giudicare direttamente l’insieme dei valori compatibili con i risultati ottenuti e dunque riflettere sulla rilevanza clinica degli estremi dell’intervallo. Per converso, si archiviano frettolosamente risultati come negativi. «L’adozione della nuova tecnica operatoria ha ridotto il tasso di complicanze infettive del 25 per cento (RRR= riduzione relativa del rischio pari a 0,25; IC 95% da -0,09 a 0,43)». In un esempio come questo non è raro leggere nelle conclusioni «la nuova tecnica non presenta vantaggi statisticamente significativi rispetto alla tecnica standard». Sarebbe più corretto commentare «con il numero di pazienti arruolati lo studio non ha potuto dimostrare la significatività della differenza osservata tra le due tecniche; uno studio conmaggiore numerosità e dunque maggiore potenza potrebbe forse chiarire la reale entità di tale differenza».</p>Certamente non si potrà continuare a insegnare la statistica e l’epidemiologia clinica come un ennesimo novero di nozioni da sovrapporre alle altre mille che affollano (o affossano) la mente dei medici: queste materie sono da insegnare come si insegna un metodo, partendo dalle situazioni cliniche di ogni giorno per trovare quanto di più e di diverso esse possano dare nella risoluzione o nell’inquadramento dei problemi. Esse sono un utile approccio quantitativo, un supporto alle decisioni cliniche, un tentativo di mitigare o di controllare l’incertezza. Da questo punto di vista, vanno privilegiati i concetti di base: la distinzione tra variabili qualitative, ordinali, quantitative; il concetto di media, mediana, quantili, deviazione standard; le basi dell’inferenza; gli elementi per leggere criticamente metodi e risultati degli studi. In poche parole, la statistica descrittiva (vedi i box da 1 a 3). Per dirla con le parole dello studio di JAMA, «se i medici non riescono a valutare l’appropriatezza delle analisi statistiche e a comprenderne accuratamente i risultati, il rischio è un’interpretazione scorretta e di conseguenza l’erronea applicazione delle ricerche cliniche».<p class="AMbox"><b>BOX 3 | L&#39;assoluto e il relativo</b><br /><br />Attenzione alla presentazione dei risultati in termini relativi piuttosto che assoluti o in termini assoluti piuttosto che relativi.Un esempio della prima tendenza: con una statina somministrata in prevenzione secondaria (pregresso evento cardiovascolaremaggiore), si è verificata unamortalità in 5 anni dell’8 per cento; nei pazienti trattati con placebo lamortalità è stata pari al 12 per cento. La riduzione relativa del rischio è del 33 per cento circa. La riduzione assoluta del rischio (la differenza tra 12 e 8), però è pari a 4 per cento e il numero di pazienti da trattare per evitare un evento (NNT) è 25.<br /> Esempio opposto: dalla revisione della letteratura sullo screening mammografico, emerge che ogni 2.000 donne che lo effettuano per 10 anni, una sola avrà la vita prolungata grazie a esso. Al di là della considerazione che per ogni milione di donne in età da screening si eviterebbero 500 morti per cancro mammario, la riduzionedel rischiodimorte per tale patologia prodottadallo screening èdel 15 per cento circa, percentuale di non poco conto. La corretta interpretazione dei risultati deve valutare se essi rispondano sia alla domanda «quanti casi?» sia a quella «quale incremento o riduzione percentuale?».</p><br /><table style="border: 0pt solid #b3c6d5; background-color: #d5e0e8" border="0" cellpadding="6" cellspacing="0"> <tbody><tr style="background-color: #b3c6d5"><td><font color="#ffffff"><b>ECCO QUATTRO DEI QUESITI SOTTOSPOSTI AGLI SPECILIZZANDI IN MEDICINA INTERNA<br />Per ognuna delle seguenti domande, indicare la risposta più; corretta (le soluzioni sulsito di OC: www.occhioclinico.it)</b></font></td></tr><tr> <td><font color="#993300"><b>1)</b></font> In uno studio clinico randomizzato controllato con placebo sull’uso di acido acetil salicilico e dipiridamolo per prevenire la restenosi arteriosa dopo angioplastica coronarica, ebbe restenosi il 38 per cento dei partecipanti in terapia, contro il 39 per cento dei partecipanti che ricevettero placebo. Riportando i risultati, gli autori stabilirono P &gt; 0,05. Ciò significa: <ul><li>A) la probabilità è maggiore di 1 su 20che ladifferenzavenga ritrovata se lo studio verrà ripetuto</li><li>B) probabilità è minore di 1 su 20 che la differenza sia dovuta al caso </li><li>C) probabilità è maggiore di 1 su 20 che la differenza sia dovuta al caso</li><li>D) c’è un 95 per cento di probabilità che lo studio sia corretto</li></ul><hr color="#b3c6d5" size="1" width="100%" /> <p><b><font color="#993300">2)</font></b> Uno studio in doppio cieco si propone di:</p><ul><li> A) garantire la comparabilità dei pazienti trattati rispetto ai non trattati</li><li> B) contenere gli effetti della variabilità legata al campionamento</li><li> C) evitare bias legati agli osservatori e quelli legati ai soggetti osservati</li><li> D) evitare bias legati agli osservatori e la variabilità legata al campionamento</li></ul> <hr color="#b3c6d5" size="1" width="100%" /><p><b><font color="#993300">3)</font></b> Con l’obiettivo di comprendere se il digiuno sia associato con la dengue, sono stati raccolti i dati di 40 pazienti affetti da tale condizione. Questi pazienti sono stati abbinati per sesso, età ed etnia con 40 pazienti senza dengue. Sono state revisionate le cartelle cliniche ospedaliere di tutti questi pazienti per vedere se avevano avuto periodi di digiuno prima della malattia. Questo tipo di studio si chiama:</p><ul><li> A) trasversale</li><li> B) studio di coorte contemporaneo</li><li> C) caso-controllo</li><li> D) studio di coorte retrospettivo</li><li> E) studio randomizzato e controllato</li></ul> <hr color="#b3c6d5" size="1" width="100%" /> <p><b><font color="#993300">4)</font></b> I ricercatori hannodisegnato uno studio per confrontare le morti cardiovascolari seguenti a un nuovo farmaco e il placebo.Hanno stabilito di avere bisognodi 200pazienti in ciascun gruppo per trovare una differenza del 15 per cento negli end point cardiaci, stante una potenza del 90 per cento e un livello di significatività di 0,01. Quale cambiamento imporrebbe ai ricercatoridi aumentare ladimensionedel lorocampione?</p><ul><li> A) ricercare una differenza del 20 per cento </li><li>B) specificare una potenza dell’80 per cento </li><li>C) usare un livello di significatività di 0,05 </li><li>D) cercare una differenza del 10 per cento</li></ul></td> </tr></tbody></table>

Segnala questa notizia su PartecipaSalute Segnala questo articolo su PartecipaSalute

Vuoi accedere a tutti i contenuti del sito e inviare commenti?
Se sei un utente registrato esegui ora il login oppure registrati gratuitamente»