Pubblicato: lunedì 23 novembre 2020
Photo: Ansa
Quali sono i limiti dell’indice Rt per decidere se chiudere o riaprire le regioni

In breve:

• L’indice Rt è un indicatore fondamentale per capire l’andamento dell’epidemia e per stabilire quali regioni finiscono in area rossa, arancione o gialla.

• Il calcolo di Rt è molto complesso e si basa solo sui contagi sintomatici, per evitare distorsioni nelle previsioni. Quando il valore di Rt è superiore a 1, significa che l’epidemia continua a crescere, ma questa stima è sempre compresa in un intervallo: più ampio è questo intervallo, più incertezza c’è sul reale valore di Rt.

• Nello stabilire le aree con i diversi colori, il problema non è tanto l’indice Rt, quanto la completezza dei dati, che spesso sono comunicati con grande ritardo dalle regioni, e i valori scelti dal governo. Questo può comportare un aumento dell’incertezza di Rt, con il rischio di allentare senza una valida giustificazione le restrizioni introdotte in alcune zone del Paese.

***

Dall’inizio dell’emergenza sanitaria c’è un indicatore che periodicamente ritorna al centro del dibattito pubblico e politico: è il cosiddetto “numero di riproduzione” del nuovo coronavirus, meglio noto con il nome di “indice Rt”.

Questo parametro è uno degli elementi chiave su cui si basano le decisioni del governo di suddividere le regioni italiane in area rossa, arancione o gialla, a seconda del livello di criticità dell’epidemia.

Proprio dalle regioni, negli scorsi giorni, è arrivata la richiesta di ripensare il sistema di monitoraggio che decide quali restrizioni introdurre, e quali allentare. Uno dei motivi sarebbe la minor affidabilità dell’indice Rt, una polemica già nata a fine maggio scorso, durante la ripartenza del Paese dopo il lockdown.

Ma davvero oggi l’indice Rt non è più attendibile come nei mesi scorsi? Prima di rispondere a questa domanda, vediamo nel dettaglio come funziona questo indicatore, un passaggio essenziale per poi comprenderne i potenziali limiti.

– Come leggere l’indice Rt: l’errore di Gallera

Cos’è Rt e cosa cambia da R0

L’indice Rt – da leggersi “erre con ti” – è il “numero di riproduzione effettivo” di un virus: rappresenta il numero medio di infezioni secondarie prodotte da ciascun individuo infetto nella popolazione. In parole semplici, questo indicatore stima quanti nuovi contagi vengono generati da chi è già stato contagiato.

Come abbiamo spiegato in passato, l’indice Rt non è altro che una versione aggiornata con il passare del tempo dell’indice R0 (ossia il “numero di riproduzione di base”), che viene calcolato quando tutta la popolazione è ancora suscettibile, all’inizio di un’epidemia insomma. Dopo un certo lasso di tempo, da R0 si passa all’indice Rt – la “t” indica il tempo in cui viene rilevata la trasmissibilità del virus – il cui valore è influenzato da vari fattori, come le misure di controllo introdotte per contenere il contagio.

Se Rt è superiore a 1, vuol dire che ogni persona infetta sta infettando più di un’altra persona e quindi che l’epidemia è in crescita. Se Rt è inferiore a 1, vuol dire invece che l’epidemia è contenibile in quanto a ogni tempo di generazione – ossia quello che passa tra un’infezione e un’altra – il numero di persone che si contagia è minore. Più Rt è elevato e più velocemente cresce il contagio (Figura 1).

Figura 1. I parametri chiave che regolano la trasmissione di RT – Fonte: Iss, Fbk

Ad oggi esistono varie stime del valore dell’indice R0 del nuovo coronavirus: in generale vanno da 1,4 a 3,8. Con l’introduzione di misure di contenimento e la modifica dei comportamenti delle persone, questo numero può ridursi e viene calcolato con Rt.

Prima di capire più nel dettaglio come si ottiene questo indicatore, vediamo brevemente perché è un numero così importante.

Rt e il futuro

Conoscere il “numero di riproduzione effettivo” di un virus è fondamentale in quanto permette, almeno nel breve termine, di fare previsioni sull’andamento futuro del contagio, e delle sue conseguenze, per esempio, sul sistema sanitario.

Il 20 novembre, durante una conferenza stampa del Ministero della Salute, l’epidemiologo matematico Stefano Merler della Fondazione Bruno Kessler (Fbk) – un ente di ricerca di interesse pubblico, che da tempo collabora con l’Istituto superiore di sanità (Iss) – ha mostrato alcune proiezioni sull’andamento delle terapie intensive basate sull’indice Rt aggiornato al 13 ottobre.

La Figura 2 mostra come le proiezioni siano state particolarmente affidabili in quanto i dati reali, registrati nei giorni successivi, sono stati molto vicini alla proiezione e comunque all’interno del margine di errore. In Lombardia i dati reali a un certo punto escono dall’intervallo di errore perché Rt è diminuito sensibilmente (Figura 2).

Figura 2. Proiezioni sull’andamento delle terapie intensive sulla base di Rt del 13 ottobre – Fonte: Iss, Fbk

– Leggi anche: Lo scenario dei «150 mila» in terapia intensiva: dove sbaglia Renzi

Come si calcola Rt

Non esiste un metodo univoco per calcolare l’indice Rt. Uno dei modelli più utilizzati a livello internazionale è quello proposto da Anne Cori, matematica e statistica all’Imperial College di Londra, e colleghi in una ricerca pubblicata nel 2013.

Si tratta di un modello bayesiano – un particolare tipo di inferenza statistica, su cui non ci addentreremo – che fornisce un valore mediano di Rt con un intervallo di credibilità pari al 95 per cento. In pratica questo modello ci dice che Rt ha una probabilità pari a 95 su 100 di trovarsi all’interno di un determinato intervallo, un po’ come funziona anche per i sondaggi elettorali, che ci danno una stima con un margine di errore.

In Italia Rt è calcolato ogni settimana dalla Fondazione Bruno Kessler e pubblicato nei bollettini settimanali del Ministero della Salute e dell’Iss. Per calcolare Rt, la Fbk non utilizza tutti i casi di positività al coronavirus riscontrati nel nostro Paese, ma solo quelli che presentano sintomi.

La decisione di escludere gli asintomatici è dovuta al fatto che la loro individuazione dipende in gran parte dalle politiche regionali di screening e contact tracing, mentre i casi sintomatici sono rilevati in modo più o meno costante. La stabilità dei criteri di individuazione delle infezioni è quindi fondamentale per avere un calcolo il più affidabile possibile.

La scelta di concentrarsi solo sui sintomatici non è così problematica come si potrebbe pensare a prima vista. La proporzione tra sintomatici e asintomatici è infatti tendenzialmente costante nel tempo. Ma anche se non lo fosse e le infezioni fossero diffuse solo tra gli asintomatici – scenario comunque improbabile – da un punto di vista della salute pubblica non ci sarebbero grossi problemi, in quanto non ci sarebbe una forte pressione sugli ospedali dovuta a pazienti con sintomi.

Concentrarsi sui casi sintomatici permette inoltre di avvicinarsi il più possibile alla descrizione della reale curva epidemica, mentre includere anche gli asintomatici potrebbe comportare potenziali distorsioni. Considerando la data dell’inizio dei sintomi dei casi sintomatici, appunto, è infatti possibile ipotizzare quando la persona si sia infettata conoscendo il tempo di incubazione medio.

Rt può anche essere calcolato su altri indicatori, come il numero dei pazienti ospedalizzati. Come per i sintomatici, si tratta di un indicatore che non è influenzato troppo dalle strategie di testing. Nella conferenza stampa del 20 novembre, l’epidemiologo Merler ha mostrato un grafico che paragona Rt calcolato sui sintomatici con Rt calcolato sugli ospedalizzati. Come si vede dalla Figura 3, hanno entrambi un andamento molto simile.

L’unica vera differenza la si ha quando il contagio è spostato sulle classi di età più giovani, che non richiedono l’ospedalizzazione.

Figura 3. L’andamento dell’indice Rt in Italia – Fonte: Iss, Fbk

Non tutte le regioni danno dati completi

Come è evidente, dal momento che Rt si basa sui casi sintomatici, un’indicazione essenziale per calcolare questo indicatore viene dalla data di inizio sintomi. Le regioni infatti caricano settimanalmente sul portale dell’Iss i nuovi contagi diagnosticati con una serie di informazioni, tra cui la data di inizio dei sintomi. Il flusso di dati che arriva all’Iss è molto più completo di quello che porta poi al bollettino diffuso ogni giorno dalla Protezione Civile.

Il monitoraggio settimanale svolto dall’Iss – che viene poi usato dal governo per stabilire le divisioni delle regioni in base alla loro criticità – ha stabilito che la data di inizio sintomi deve essere disponibile per almeno il 60 per cento dei pazienti sintomatici. Sotto questa soglia, altrimenti, Rt non si può calcolare.

Secondo il monitoraggio più aggiornato, tra il 9 e il 15 novembre, Calabria e Umbria erano al di sotto questa soglia, mentre Liguria, Lombardia e Sardegna di poco sopra. Al 100 per cento c’era solo l’Emilia-Romagna, mentre Campania, Friuli-Venezia Giulia, Lazio, Marche, Molise, Piemonte, Puglia, Toscana e Provincia autonoma di Trento superavano il 90 per cento.

Il problema del consolidamento dei dati

In passato abbiamo scritto diverse volte dei ritardi nella comunicazione dei dati legati all’epidemia: anche il calcolo di Rt è influenzato da questo problema.

Per ottenere le stime di questo indicatore, la Fondazione Bruno Kessler esclude i dati degli ultimi otto giorni in quanto non sono ancora sufficientemente consolidati, e dunque precisi. Per esempio, l’indice calcolato il 18 novembre scorso tiene conto dei dati che vanno dal 28 ottobre al 10 novembre.

Ma le regioni non sono molto veloci a registrare i dati e a comunicarli alle autorità nazionali, fenomeno che causa una discrepanza evidente se si osserva la dashboard dell’Iss in cui sono disponibili i casi di positività distribuiti per data di inizio sintomi.

Grazie al lavoro di OnData, un’associazione che si occupa della diffusione della cultura degli open data, è possibile confrontare i dati dello stesso periodo in momenti diversi. Osservando per esempio il periodo tra il 23 ottobre e il 6 novembre, si vede che che al 6 novembre risultavano 86 mila casi, al 13 novembre 167 mila e al 20 novembre 216 mila. All’ultima data utilizzata si vede che neanche i dati di quasi un mese prima sono ancora definitivi in quanto in quella settimana sono stati aggiunti 946 casi sul 23 ottobre e salgono muovendosi avanti nel tempo. In tre settimane su questa data i casi sono cresciuti del 30 per cento (Grafico 1).

Se si calcola Rt in momenti diversi, si può vedere che tenderà progressivamente ad alzarsi con il continuo consolidamento dei dati. C’è quindi il rischio che il calcolo della Fbk porti ad avere un Rt sottostimato. Come abbiamo detto, l’indice Rt calcolato al 18 novembre si basa su dati che arrivano fino al 10 novembre, ma dall’esempio visto sopra sappiamo che, in realtà, anche i dati relativi a un mese prima sono da considerarsi ancora provvisori.

In questo ambito, uno dei problemi più gravi è che la qualità dei dati peggiora con il crescere dell’epidemia. «I dati raccolti in emergenza possono essere incompleti e contenere errori», ma «senza dolo», come ha spiegato Merler in un’intervista al Corriere della Sera il 19 novembre. Con un personale limitato, ormai da tempo le aziende sanitarie locali hanno sempre più difficoltà a stare dietro a tutti i casi, a raccogliere le informazioni essenziali dei pazienti e a comunicarle tempestivamente all’Iss.

Nonostante questo sia un problema non da poco, non è mai stato affrontato nel dettaglio durante le conferenze stampa dall’Iss.

– Leggi anche: Conte non dice la verità: il tracciamento dei contagi non funziona «bene»

I limiti di Rt per la scelta delle aree rosse

Prima di concludere, vediamo perché nelle ultime settimane l’indice Rt è tornato al centro del dibattito pubblico.

Il governo italiano ha scelto di affidare a Rt un ruolo chiave nel decidere a quali restrizioni debba andare incontro una regione. Dopo aver svolto un’analisi del rischio su 21 indicatori e aver stabilito che è “alto” o “molto alto”, è infatti Rt a decidere se si finisce in area rossa, arancione o gialla.

Questo sistema non è esente da limiti. Innanzitutto, è chiaro che Rt è basato su informazioni “vecchie”. Al 18 novembre si guardava ai primi giorni del mese per calcolarlo, ma la situazione nel frattempo potrebbe essere mutata. In secondo luogo, il governo ha scelto di non guardare all’Rt mediano, cioè al singolo valore di Rt, ma al suo intervallo. Per decidere la collocazione nelle varie zone è l’estremo inferiore di Rt che conta: deve essere oltre 1,25 per essere in zona arancione e oltre 1,5 per essere in zona rossa.

A parità di rischio, calcolato come abbiamo visto su 21 indicatori, è quindi possibile che una regione passi da un’area a un’altra non perché Rt si sia davvero ridotto, ma semplicemente perché è aumentata la sua incertezza.

Facciamo un esempio concreto. Una regione ha Rt con un valore pari a 1,45, compreso in un intervallo tra 1,30 e 1,60, e viene considerata area arancione. La settimana successiva Rt mediano resta invariato, ma l’intervallo in cui è compreso si allarga tra 1,2 e 1,8: la regione in questione potrebbe dunque passare a zona gialla.

A regolare l’intervallo di credibilità dell’indice Rt è la quantità dei casi: più casi ci sono, meno grande sarà l’intervallo. A far crescere l’incertezza della stima potrebbe quindi non essere il minor numero di casi registrati, ma semplicemente il minor numero di casi per cui si conosce la data di inizio sintomi (quelli su cui si basa il calcolo di Rt, come abbiamo visto prima).

In generale, dunque, l’incertezza generata da una minore capacità di raccolta dati potrebbe contribuire a far diminuire le restrizioni adottate per contrastare la diffusione del virus in una determinata regione.

In conclusione

L’indice Rt, di per sé, non è un problema, come alcuni critici o alcune regioni hanno sostenuto negli ultimi giorni. Questo indicatore è fondamentale perché ci dice come sta evolvendo il contagio da coronavirus nel nostro Paese e ci permette di fare delle previsioni sul futuro.

Il problema principale è la qualità dei dati. Se i dati sottostanti al calcolo di Rt diventano meno affidabili con il tempo, anche Rt di conseguenza perderà attendibilità; per esempio, se i dati arrivano tardi e quelli più recenti sono incompleti, si avrà un Rt sottostimato. Inoltre, è ragionevole attendersi che al crescere dell’epidemia, ossia proprio quando Rt diventa ancora più fondamentale, la qualità dei dati peggiori.

Un secondo problema è come si utilizza l’indice Rt. Come abbiamo visto, la scelta di usarlo come parametro fondamentale per la suddivisione dell’Italia in fasce non è esente da limiti.

Il rischio maggiore è che l’aumento dell’incertezza possa portare a una riduzione ingiustificata delle restrizioni introdotte in alcune regioni.

di Lorenzo Ruffino

Logo
Logo
Logo
Logo