Pubblicato: lunedì 5 ottobre 2020
Perché i dati di “oggi” sull’epidemia non sono davvero... di oggi

In breve:

• Ogni giorno, politici e quotidiani commentano le variazioni dei dati sui tamponi fatti, sui nuovi contagi e sui decessi. Ma i numeri giornalieri del bollettino della Protezione civile vanno letti con cautela.

• Alcune regioni comunicano infatti i dati dei tamponi prelevati nelle 24 ore precedenti; altre quelli dei tamponi analizzati.

• I dati dei nuovi contagiati fanno riferimento alla data in cui è stata notificata la positività al virus, e non a quando è stato effettuato il test per rilevarla.

• Anche i numeri sui decessi soffrono di notevoli ritardi tra il momento in cui vengono registrati dai Comuni e il momento in cui vengono notificati.


Ormai da più di sette mesi, ogni giorno la Protezione civile comunica i dati raccolti dal Ministero della Salute sull’andamento dell’epidemia di Covid-19. Questi numeri sono presentati come dati relativi al singolo giorno e vengono poi regolarmente commentati guardando alle variazioni rispetto alle giornate precedenti.

In realtà i dati dei bollettini della Protezione civile vanno maneggiati con molta cautela: spesso i singoli numeri giornalieri – sui nuovi contagi, sui decessi e sui tamponi – non si riferiscono alle ultime 24 ore, ma a periodi di tempo più lunghi e variabili.

Vediamo nel dettaglio il perché.

Di quando sono i tamponi

Partiamo dai dati sui tamponi giornalieri, visto che ormai da settimane sia i politici che i quotidiani commentano le variazioni dei nuovi contagiati proprio in rapporto al numero di test effettuato. Per esempio, quando c’è un aumento dei casi si tende a sottolineare che sono stati fatti più tamponi del giorno prima, e viceversa, quando i casi calano, si cerca di evidenziare che sono stati eseguiti meno test.

Ma le cose più articolate di quello che può sembrare a prima vista.

I dati sui tamponi che vengono comunicati quotidianamente dalla Protezione civile, infatti, non hanno per forza attinenza con i dati sui nuovi contagiati. Diverse regioni comunicano il numero dei tamponi che sono stati prelevati, e non analizzati, nelle ultime 24 ore. Nel conteggio giornaliero del numero dei tamponi fatti, dunque, c’è una parte – ad oggi non quantificabile – di tamponi ancora in attesa di analisi.

Ricordiamo poi che i dati sui tamponi tengono conto anche dei test diagnostici, fatti a persone che si sa già che erano positive, per verificare se sono guarite o meno (i cosiddetti tamponi di controllo).

Abbiamo contattato le autorità sanitarie delle regioni italiane per avere chiarimenti ed è emerso che le regioni Piemonte, Veneto, Sicilia, Emilia-Romagna e la Provincia autonoma di Bolzano comunicano i dati giornalieri sui tamponi prelevati. Le regioni Valle d’Aosta, Sardegna, Molise, Campania e la Provincia autonoma di Trento non hanno risposto alla richiesta. Le restanti regioni, invece, comunicano il numero di tamponi realmente analizzati.

Nel corso del tempo, inoltre, alcune regioni hanno cambiato il tipo di dati comunicato quotidianamente. La Lombardia ora dà i dati giornalieri sui tamponi analizzati, ma per diversi mesi ha comunicato i dati giornalieri sui tamponi prelevati.

Una delle conseguenze di questa disomogeneità dei dati è che a livello nazionale non si può calcolare con precisione il tasso di positività, ossia il numero di nuovi contagiati in rapporto al numero dei nuovi tamponi (un parametro molto utile per valutare l’andamento dell’epidemia), dal momento che alcune delle variazioni giornaliere possono essere semplicemente frutto di tamponi non ancora analizzati.

Di quando sono i contagi

Veniamo adesso ai numeri sui nuovi positivi al coronavirus Sars-CoV-2 comunicati ogni giorno dalla Protezione civile, facendo prima una breve osservazione.

I dati sui nuovi casi possono essere comunicati in due modi: per data di prelievo o per data di notifica. La data di prelievo corrisponde a quando il tampone, poi rivelatosi positivo, è stato eseguito, mentre la data di notifica a quando viene comunicata la positività del test.

Facciamo un esempio concreto: una persona ha fatto un tampone il 1° ottobre e in seguito alle analisi si è scoperto che era positiva il 3 ottobre. In base al criterio della “data di prelievo”, viene contato come nuovo positivo alla data del 1° ottobre; in base al criterio della “data di notifica”, finisce tra i nuovi positivi del 3 ottobre.

A seconda del metodo di raccolta, dunque, il modo in cui vanno interpretati i dati sui nuovi casi cambia. Nei bollettini giornalieri della Protezione civile, l’Italia adotta il criterio della “data di notifica” – dunque i nuovi contagi giornalieri fanno riferimento ai casi notificati quel giorno – mentre, per citare un grande Paese europeo, la Spagna adotta il primo, quello della “data di prelievo”.

Analizzando i numeri più in profondità, è però possibile conoscere anche i dati sui nuovi contagi per “data di prelievo” in Italia. L’Istituto superiore di sanità (Iss) – l’ente che si occupa del controllo dell’epidemia e di tutti i dati associati – pubblica sul proprio sito i nuovi casi anche in base a quando i tamponi rivelatisi positivi sono stati prelevati. Ogni giorno OnData – un’associazione che si occupa della diffusione di open data – estrae questi dati dalla dashboard dell’Iss e li rende disponibili.

La curva ottenuta dai dati dell’Iss sui nuovi contagi per “data di prelievo” si può così confrontare con quella della Protezione civile sui nuovi contagi per “data di notifica”. In questo modo si può vedere quale sia lo scostamento tra l’andamento delle due curve.

Per armonizzare i dati abbiamo calcolato una media mobile a sette giorni – un particolare tipo di media che permette di limare la variabilità dei singoli dati giornalieri – sui dati aggiornati al 27 settembre. I numeri successivi a quella data, ad oggi, non sono infatti ancora consolidati, proprio a causa dei ritardi sulla comunicazione dei dati che intercorrono tra prelievo e notifica (Grafico 1).

Dal confronto delle due curve, si nota che negli ultimi giorni di agosto i casi nella curva di prelievo sono saliti sensibilmente prima della curva di notifica, suggerendo che in quei giorni il ritardo tra prelievo e notifica fosse tra i tre e i quattro giorni.

Secondo alcune stime, la quota dei nuovi contagiati che viene notificata entro due giorni da quando è stato eseguito il tampone è pari a circa il 40 per cento. I ritardi variano poi molto da regione a regione, concentrandosi in particolar modo nel Centro e Sud Italia, ma anche all’interno di singole regioni.

Il caso della Lombardia

Un esempio in questo caso è la Lombardia, che ha una piattaforma su cui quotidianamente carica i dati per il giorno in cui i tamponi rivelatisi positivi sono giunti al laboratorio (questa data è probabilmente molto vicina a quella di prelievo). Guardando la data in cui sono caricati i nuovi contagiati –anche in questo caso OnData estrae i numeri quotidianamente – si può dunque capire a quando risalgono.

Confrontando per esempio i dati del 2 ottobre con quelli del 1° ottobre, emerge che 89 casi risalgono al 1° ottobre, 155 al 30 settembre, 62 al 29 settembre e gli altri ai giorni ancora precedenti. Vi è comunque un’ampia varianza giornaliera: alcuni giorni i ritardi sono consistenti, altri minimi.

Sempre in Lombardia, l’Agenzia per la tutela della salute (Ats) Insubria – che si occupa delle aree di Varese e Como – spiega sul proprio sito che «generalmente l’esito del tampone viene caricato dal laboratorio di riferimento sul portale dopo circa 4 giorni feriali dall’effettuazione».

Il fattore “weekend” e quello dei diversi orari

Osservando la curva epidemica dell’Iss si nota anche che durante il sabato e la domenica vi siano sempre dei sostanziali cali nel numero dei nuovi contagi, frutto del minor numero di tamponi che vengono fatti nei fine settimana. Questo fattore – insieme con quello dei ritardi nella comunicazione dei dati – fa sì che il lunedì vi sia di fatto sempre un calo dei nuovi casi rispetto alla domenica.

Bisogna anche considerare che, nonostante il bollettino della Protezione civile venga pubblicato intorno alle ore 17, in realtà i dati risalgono a prima. Ad esempio, il Veneto comunica i dati alle ore 8 del mattino e le Marche alle ore 9. La Campania invece inserisce nel bollettino i dati delle ore 23.59 del giorno precedente.

Di quando sono i morti

Infine, come i dati sui nuovi contagi, anche quelli sui decessi legati alla Covid-19 soffrono di notevoli ritardi tra il momento in cui vengono registrati e il momento in cui vengono notificati. In questo caso l’Iss non rende direttamente disponibili i dati per data di registrazione, ma li pubblica solo sotto forma di immagine nei suoi bollettini settimanali (Grafico 2).

Grafico 2. La curva dei decessi in Italia legati alla Covid-19 – Fonte: Iss

I ritardi, come detto, possono essere molto considerevoli. Per esempio al 31 marzo le regioni avevano notificato alla Protezione civile 12.428 decessi, ma il report congiunto sulla mortalità in Italia di Istat e Iss pubblicato il 4 maggio rilevava che per quel giorno erano in realtà stati già registrati 13.710 decessi.

Uno dei motivi di questi rallentamenti nella comunicazione delle morti è che le anagrafi dei singoli Comuni sono lente a registrare i decessi. Il 2 maggio la Lombardia ha per esempio segnalato 282 decessi arretrati, frutto dei controlli fatti da parte dei comuni.

Ma un esempio ancora più concreto di questi ritardi viene dalla Regione Piemonte, che quotidianamente nei comunicati stampa precisa che i decessi notificati non sono stati registrati quel giorno. Il 5 agosto la regione ha notificato due decessi, precisando che non erano però avvenuti quel giorno (Immagine 1).

Un altro esempio di questi ritardi viene dalla regione Emilia-Romagna. Il 15 agosto la Ausl di Parma ha notificato 154 decessi avvenuti tra marzo, aprile e maggio, che fino a quel momento non erano stati comunicati.

In conclusione

Quando si fa riferimento ai dati quotidiani della Protezione civile sull’epidemia di nuovo coronavirus, bisogna sempre ricordare che si tratta di numeri comunicati per data di notifica e non di prelievo; che si riferiscono a periodi temporali diversi a seconda della regione; e che è possibile che vi siano significativi ritardi.

In alcune occasioni, può essere dunque ingannevole commentare le singole variazioni giornaliere di nuovi casi, decessi e tamponi.

Due primi accorgimenti per evitare errori o considerazioni fuorvianti sono quello di utilizzare le medie mobili, per armonizzare meglio i dati, e quello di evitare di concentrarsi eccessivamente su statistiche che in realtà possono essere semplicemente il frutto di ritardi di comunicazione.

di Lorenzo Ruffino

Logo
Logo
Logo
Logo