Negli ultimi giorni il sindaco di Bergamo Giorgio Gori (Partito democratico) ha duramente criticato su Twitter la Regione Lombardia per la gestione e la comunicazione dei dati sull’epidemia di Covid-19. Nello specifico, Gori si è concentrato sulla questione dei dati a livello provinciale e sulla loro accessibilità.

«Regione Lombardia smentisce, ma io mi permetto di confermare», ha scritto l’11 giugno il sindaco di Bergamo su Twitter. «I dati sui decessi per province sono stati accessibili fino al 26 aprile, collegati ad una mappa sviluppata con il software ArcGis. Dopo l’inchiesta di Infodata sulle Rsa, del 24 aprile, è stato fatto sparire tutto».

Il 10 giugno Gori aveva già criticato la scarsa trasparenza della Regione anche per altri aspetti. Il tema della trasparenza delle informazioni è stato messo in rilievo negli ultimi mesi da diverse testate giornalistiche, come Il Post, da alcuni giornalisti, come Isaia Invernizzi dell’Eco di Bergamo, o da esperti del settore, come la Fondazione Gimbe, un’organizzazione indipendente che ha lo scopo di promuovere e realizzare attività di formazione e ricerca in ambito sanitario.

Secondo quanto detto da Gori il 10 giugno, per esempio, in Lombardia non vengono più comunicati i dati sui guariti e neppure i dati dei positivi alla Covid-19 divisi per comuni. In merito a queste critiche, la Regione Lombardia aveva risposto a Gori dicendo che «la diffusione dei dati relativi al Coronavirus da parte di Regione Lombardia verso le autorità sanitarie e verso i mezzi di informazione non è cambiata e continua a essere la stessa». Di qui, la replica del sindaco di Bergamo del giorno seguente.

Concentriamoci allora sull’ultima questione emersa in ordine temporale: è vero, come ha replicato il sindaco di Bergamo alla Regione Lombardia l’11 giugno, che i dati sui decessi per province all’inizio erano disponibili fino al 26 aprile, per poi essere rimossi? Abbiamo verificato.

I numeri della piattaforma della Regione Lombardia

Nei primi giorni di marzo, con l’inizio dell’epidemia di coronavirus in Italia, la Regione Lombardia ha reso pubblica una mappa, tuttora accessibile online, dove vengono aggiornati quotidianamente due tipi di dati: quello sul totale dei positivi al Covid-19 nella regione e nelle singole province, e quello sui deceduti a livello regionale, ma non provinciale.

La mappa creata dalla Regione Lombardia si basa su ArcGis, un sistema informativo che consente la creazione di mappe online, e che è usato per monitorare l’epidemia, tra gli altri, anche dalla Protezione civile italiana e dalla Johns Hopkins University.

Tuttora, inoltre, la Regione Lombardia pubblica sul proprio sito dati regionali più dettagliati rispetto a quelli presenti nella mappa online. Non sono comunque comprese informazioni su quanti sono i morti divisi per provincia o quanti sono i guariti giornalieri. I numeri su quest’ultimi vengono infatti sommati a quelli sui dimessi dagli ospedali (che però non sono necessariamente tutti guariti).

Queste due mancanze sono state sottolineate su Twitter, oltre che da Gori, anche da altri esperti, come il presidente della Fondazione Gimbe Nino Cartabellotta, che nelle scorse settimane si è scontrato con la Regione Lombardia per l’affidabilità dei dati lombardi.

Ricapitolando: dalla sua creazione ad oggi, la mappa della Regione Lombardia ha reso pubblico un dato molto generale sui decessi: quello a livello regionale. Durante le settimane più dure dell’epidemia, per avere dati locali più precisi sui decessi si è fatto ricorso a una varietà di altre fonti, come inchieste giornalistiche locali o i primi dati sull’eccesso di mortalità registrato in una parte dei comuni italiani.

Perché Gori allora sostiene che fino a fine aprile le cose stavano diversamente, con la presenza sulla mappa delle Regione Lombardia di statistiche sui decessi divisi per province? I dati messi a disposizione sui morti da Covid-19 prima erano più trasparenti, mentre da quasi due mesi lo sono di meno?

La risposta sta in un possibile “errore” della Regione Lombardia, che per diverse settimane ha lasciato accessibili al pubblico – anche se nascosti – alcuni dati che con ogni probabilità non dovevano esserlo.

Ma qualcuno se ne è accorto: e dopo di allora le cose sono cambiate.

L’inchiesta di Infodata sulle Rsa

Il 24 aprile Infodata del Sole 24 Ore ha pubblicato un’inchiesta – quella citata da Gori su Twitter – intitolata “Covid-19, cosa sta succedendo nelle case di riposo lombarde?”, che faceva seguito a un primo pezzo più generale uscito il 18 aprile.

L’inchiesta del 24 aprile cercava di capire una cosa precisa: se all’epoca in Lombardia ci fossero dei focolai di coronavirus all’interno di alcune residenze sanitarie assistenziali (Rsa), come si ipotizzava ormai da diversi giorni.

Per farlo, Infodata aveva messo in relazione il numero di contagiati nella fascia di popolazione più anziana nei comuni della Lombardia e le località con Rsa sul loro territorio, mostrando che effettivamente c’erano diversi focolai nelle case di riposo lombarde (confermati anche da alcuni articoli di stampa locale).

Ma come aveva fatto Infodata ad avere i dati sui contagiati, divisi per comuni ed età, se come abbiamo visto la mappa – citata da Gori – e il sito della Regione Lombardia davano solo dati generici?

«All’epoca abbiamo scoperto che tra le query della piattaforma, cioè interrogando la mappa della Regione Lombardia, era possibile estrarre i dati non aggregati relativi ai tamponi», ha spiegato a Pagella Politica Riccardo Saporiti, autore dell’inchiesta di Infodata del 24 aprile scorso. «Questi dati li estraeva Samuele Astuti, un consigliere regionale del Partito democratico. E già a metà marzo li estraeva anche onData, associazione che si occupa di diffusione della cultura degli Open Data».

Dunque, dietro la piattaforma, c’erano dati che la Regione Lombardia non rendeva immediatamente disponibili, ma che, seppure nascosti, era possibile scaricare. E si trattava di dati potenzialmente molto sensibili.

«Questi dati erano “microdati”, ossia non erano aggregati: ogni riga corrispondeva a un paziente, su cui sapevi il genere, l’età, il comune di residenza, e l’esito, ossia se erano ancora vivi o se erano deceduti», ha spiegato Saporiti. «Quando l’Istat pubblica i microdati, o anche quando lo fa il Ministero dell’Economia, omettono quei dati che possono consentire di risalire all’identità della persona».

Quindi, oltre alle informazioni sensibili, dai singoli dati dei contagiati era possibile capire anche quanti erano i decessi, non solo divisi per province – come sostiene Gori – ma addirittura anche per singoli comuni.

I dati “nascosti” della Regione Lombardia, scaricabili interrogando la mappa ed estraendone il contenuto, non avevano però l’accortezza di preservare la privacy delle persone a cui si riferivano, perché evidentemente non erano pensati per la pubblicazione.

«Se si volevano utilizzare e renderli pubblici, era quindi necessario gestirli rispettando la privacy delle persone», ha sottolineato Saporiti. «Noi di Infodata abbiamo aggregato i dati a livello provinciale, così non era possibile risalire all’identità dei contagiati e non li abbiamo resi scaricabili. Avevi una fotografia del fenomeno, ma non violavi il segreto statistico».

Dunque Regione Lombardia, nel periodo a cui stiamo facendo riferimento, aveva reso pubblici pochi dati generali (su positivi e morti), ma involontariamente aveva dato la possibilità di scaricare dati molto dettagliati – anche a livello comunale, divisi per età – che sono stati rimossi in breve tempo proprio dopo la pubblicazione dell’inchiesta di Infodata.

La rimozione dei dati

Come ha confermato Saporiti a Pagella Politica (e come hanno riportato nelle scorse settimane altre fonti), due giorni dopo l’uscita dell’articolo di Infodata del 24 aprile non è più stato possibile scaricare i “microdati” dalla piattaforma ArcGis della Regione Lombardia.

«Non sappiamo se la necessità di avere maggiore cautela abbia portato la Regione Lombardia a rimuovere i dati dalla piattaforma dopo la nostra inchiesta del 24 aprile», ha detto Saporiti a Pagella Politica. «È importante però che questi dati siano resi pubblici, ma è anche importante che siano gestiti con criterio. Io ho presentato diverse richieste Foia [le richieste di accesso civico generalizzato, ndr] per avere questi dati dalle istituzioni lombarde, anche per dare un segnale contro la mancata trasparenza. Ma ad oggi non ho ricevuto alcuna risposta».

Abbiamo contattato l’assessorato al Welfare della Regione Lombardia per avere un commento, ma siamo ancora in attesa di una risposta.

Sottolineiamo infine che le piattaforme di monitoraggio della Covid-19 di altre regioni, come quella della Regione Umbria, danno dati molto più trasparenti sui deceduti da coronavirus (e sull’epidemia in generale), addirittura divisi per singolo comune. Quindi un altro modo di diffondere i numeri, senza violare la privacy delle persone, sembra essere possibile.

In Lombardia i dati locali del contagio per singoli comuni sono al momento reperibili solo attraverso fonti stampa (qui un esempio), che raccolgono periodicamente numeri dalle singole prefetture o dai singoli sindaci.

In conclusione

Ricapitoliamo. Secondo Giorgio Gori (Pd), nella Regione Lombardia «i dati sui decessi per province sono stati accessibili fino al 26 aprile, collegati ad una mappa sviluppata con il software ArcGis. Dopo l’inchiesta di Infodata sulle Rsa, del 24 aprile, è stato fatto sparire tutto».

Il 10 giugno – il giorno prima della sua accusa – il sindaco di Bergamo aveva già criticato la scarsa trasparenza sui dati dell’epidemia da coronavirus della Regione Lombardia, che si era difesa dicendo che la sua diffusione dei dati è sempre rimasta la «stessa».

Ma che cosa è successo veramente con i dati per i deceduti divisi per province?

Per un certo periodo, sulla sua piattaforma dedicata alla Covid-19 la Regione Lombardia – senza volerlo – ha pubblicato diversi dati molto dettagliati sui contagiati da coronavirus nella regione, e di conseguenza sui deceduti (come ha ricordato Gori). Da un lato, questi dati hanno consentito ai giornalisti (e non solo) di fare delle elaborazioni statistiche sull’avanzamento dell’epidemia; dall’altro lato, si prestavano però a possibili violazioni della privacy delle persone contagiate e poi decedute.

Quando la Regione Lombardia se n’è resa conto – probabilmente in seguito anche ai citati articoli di Infodata – ha rimosso questi dati, togliendo sia il rischio di violazione della privacy sia la possibilità di avere un quadro più trasparente dell’epidemia. Quindi possiamo dire che Gori dica una cosa sostanzialmente vera quando parla della rimozione dei dati sui decessi.

In ogni caso, questa decisione della Regione Lombardia non era l’unica possibile, anzi. Ad oggi molti chiedono all’amministrazione di Attilio Fontana (Lega) di fare maggiore chiarezza con i dati sull’andamento dell’epidemia nella regione, dove attualmente, tra le altre cose, non vengono divisi i dati tra i guariti e i dimessi. Stavolta, possibilmente, senza divulgare i dati sensibili delle persone coinvolte.