Linee Guida per il riutilizzo e l’apertura dei dati pubblici regionali (Open Data)
#OpenDataPuglia Processo partecipativo
5 - Appendice
5 - APPENDICE
5.1 Acronimi e definizioni
5.2 Quadri normativi di sintesi
5.2.1 Quadro Europeo
- DIRETTIVA 2003/98/CE DEL PARLAMENTO EUROPEO E DEL CONSIGLIO del 17 novembre 2003 relativa al riutilizzo dell'informazione del settore pubblico;
- DIRETTIVA 2007/2/CE DEL PARLAMENTO EUROPEO E DEL CONSIGLIO del 14 marzo 2007 che istituisce un'Infrastruttura per l'informazione territoriale nella Comunità europea (Inspire);
- DIRETTIVA 2013/37/UE DEL PARLAMENTO EUROPEO E DEL CONSIGLIO del 26 giugno 2013 che modifica la direttiva 2003/98/CE relativa al riutilizzo dell’informazione del settore pubblico (Testo rilevante ai fini del SEE);
- GRUPPO PER LA TUTELA DELLE PERSONE CON RIGUARDO AL TRATTAMENTO DEI DATI PERSONALI istituito ai sensi della direttiva 95/46/CE del Parlamento europeo e del Consiglio del 24 ottobre 1995 – Parere 05/2014 sulle tecniche di anonimizzazione, adottato il 10 aprile 2014;
- DIRETTIVA (UE) 2019/1024 DEL PARLAMENTO EUROPEO E DEL CONSIGLIO del 20 giugno 2019 relativa all'apertura dei dati e al riutilizzo dell'informazione del settore pubblico (rifusione);
- COM(2020) 66 final del 19.02.2020 “Strategia europea per i dati”;
- Regolamento di Esecuzione (UE) 2023/138 della Commissione del 21 dicembre 2022, "che stabilisce un elenco di specifiche serie di dati di elevato valore e le relative modalità di pubblicazione e riutilizzo”.
5.2.2 Quadro nazionale
- Legge 7 agosto 1990, n. 241 “Nuove norme in materia di procedimento amministrativo e di diritto di accesso ai documenti amministrativi”;
- D.Lgs. n. 82/2005 "Codice dell’Amministrazione Digitale";
- D. Lgs. del 24 gennaio 2006, n. 36 “Attuazione della direttiva 2003/98/CE relativa al riutilizzo di documenti nel settore pubblico”
- Legge n. 15/2009;
- D.Lgs. n. 150/2009;
- D.Lgs. n. 32/2010 (attuazione direttiva INSPIRE 2007/2/CE);
- D.L. n. 5/2012, conv. dalla legge n. 35/2012;
- D.L. n. 83/2012, conv. dalla legge n. 134/2012;
- D.L. n. 179/2012, conv. dalla legge n. 221/2012;
- Legge n. 190/2012;
- D.Lgs. n. 33/2013 recante “Riordino della disciplina riguardante gli obblighi di pubblicità, trasparenza e diffusione di informazioni da parte delle pubbliche amministrazioni”
- Deliberazione n. 243 del 15 maggio 2014 del Garante per la protezione dei dati personali “Linee guida in materia di trattamento di dati personali, contenuti anche in atti e documenti amministrativi, effettuato per finalità di pubblicità e trasparenza sul web da soggetti pubblici e da altri enti obbligati”
- D. Lgs. del 18 maggio 2015, n. 102;
- D. Lgs. n.97/2016, che prevede modifiche al c.d. “Decreto Trasparenza”, d.lgs. 33/2013;
- “Linee guida nazionali per la valorizzazione del patrimonio informativo pubblico” (2017) dell’Agenzia per l’Italia Digitale (AGID);
- D. Lgs. 13 dicembre 2017, n. 217;
- D. Lgs.n. 200/2021;
- Determinazione AgID n. 547/2021 recante “Linee Guida sull’interoperabilità tecnica delle Pubbliche Amministrazioni” e “Linee Guida Tecnologie e standard per la sicurezza dell’interoperabilità tramite API dei sistemi informatici”;
- Linee Guida AGID 2022 sull’apertura dei dati e il riutilizzo dell’informazione del settore pubblico, previste dall’art. 12 del D. Lgs n. 36/2006 (come modificato dal D. Lgs n. 200/2021) che recepisce la Direttiva europea UE 2019/1024 (cosiddetta Direttiva Open Data);
- Piano Triennale per l’Informatica nella Pubblica Amministrazione 2022-2024, dell’Agenzia per l’Italia Digitale (AgID), approvato con Decreto del PDC del 22.12.2022;
- Linee guida “recanti regole tecniche per l’apertura dei dati e il riutilizzo dell’informazione del settore pubblico” ai sensi dell’art. 71 del D. Lgs. 82/2005 recante Codice dell’Amministrazione Digitale (Determinazione AgID n. 183/2023).
5.2.3 Quadro regionale
- L. R. n. 20/2012 - Norme sul software libero, accessibilità di dati e documenti e hardware documentato;
- D.G.R. n. 2183/2012 - "Legge regionale 24 luglio 2012, n. 20 - “Norme sul software libero, accessibilità di dati e documenti e hardware documentato” – Primi indirizzi";
- D.G.R. n. 1732/2014 - "Strategia regionale per la Specializzazione intelligente – approvazione dei documenti strategici “SmartPuglia 2020” e “Agenda Digitale Puglia 2020”;
- D.G.R. n. 2342/2014 - "Legge regionale n. 20/2012 “Norme sul software libero, accessibilità di dati e documenti e hardware documentato” - Linee di indirizzo per la sua attuazione e per il riuso dei programmi informatici";
- D.G.R. n. 1122/2015 - Open Data – Approvazione Linee Guida regionali e Piano Annuale Open Data 2015;
- D.G.R. n. 1219/2021 - Riorganizzazione digitale dell'amministrazione regionale - Linee di indirizzo;
- DGR n. 625/2022 – approvazione intervento “Evoluzione dell’ecosistema Open Data regionale;
- D.G.R. n. 791/2022 - Approvazione del Piano Triennale di Riorganizzazione Digitale 2022-2024;
- D.G.R. n. 155/2023 Deliberazione della Giunta regionale n. 1732/2014 “Indirizzi per l’aggiornamento dell’Agenda Digitale pugliese, la definizione della relativa governance e l’istituzione dell’Osservatorio regionale del Digitale in Puglia”;
- D.G.R. n. 347/2023 “Deliberazione della Giunta regionale n. 155/2023. Istituzione dell’ Osservatorio regionale del Digitale in Puglia. Approvazione del Disciplinare di funzionamento”;
- D.G.R. n. 584/2023 “Seguito D.G.R. 28 marzo 2022, n. 422 recante “Atto di indirizzo per l’apertura del patrimonio informativo regionale e aggiornamento della relativa normativa regionale” – Approvazione schema di adesione per l’utilizzo del portale dati regionale.”;
- D.G.R. n. 1094/2023 “Piano triennale di Riorganizzazione Digitale della Regione Puglia - Aggiornamento 2023-2025.”
5.3 Tecniche di Anonimizzazione
Il processo di anonimizzazione dei dati dipende fortemente dalla semantica degli stessi, dalla tematica applicativa trattata nonché dal contesto in cui si sta operando. La scelta della tecnica è demandata al Titolare del trattamento, che deve effettuare una valutazione preliminare riguardo le caratteristiche dei dati partenza ed il risultato perseguito. Infatti, la difficoltà non è solo nell’individuazione degli elementi da eliminare, bensì nel determinare quali elementi conservare affinché il risultato dell’elaborazione mantenga il suo valore.
Di seguito sono riportate alcune tecniche di anonimizzazione che potrebbero essere applicate ai dati anche in modalità combinata tra loro. Alcune di esse sono espressamente richiamate dal Regolamento (UE) 2023/138 sui “dataset a elevato valore”, al considerando (8).
Generalizzazione e soppressione dei dati
La generalizzazione è una famiglia di tecniche che agiscono sulla riduzione della granularità dei dati, in modo che vengano divulgati dati meno precisi rispetto a quelli di partenza. In particolare, viene modificata la scala o l’ordine di grandezza (per esempio, viene indicata una regione anziché una città, un mese anziché una settimana): sarà così meno probabile riconoscere soggetti precisi, poiché è probabile che più persone condividano gli stessi valori.
Tra le misure riconducibili alla generalizzazione si segnala l’aggregazione e k-anonimizzazione, che consiste nell’assicurare che ogni valore relativo a un soggetto interessato sia condiviso da almeno un numero minimo (k) di altre persone all’interno dell’insieme.
Ad esempio la seguente struttura:
Sesso Anno Nascita CAP Diagnosi
F 1970 70124 Frattura
F 1972 70125 Infarto
Potrebbe essere anonimizzata nel seguente modo
Sesso Anno Nascita CAP Diagnosi
F [1970 – 1975] 701** Frattura
F [1970 – 1975] 701** Infarto
Tale tecnica ha delle debolezze come quella dovuta alla possibile omogeneità del valore dell'attributo sensibile in un gruppo (se ci fosse un’unica diagnosi per un determinato gruppo).
Randomizzazione dei dati
La randomizzazione è una famiglia di tecniche che comportano l’alterazione dei dati di partenza, al fine di spezzare il legame tra l’individuo e i dati. Per il fine di eliminare la forte correlazione che esiste tra i dati e la persona, modifica la veridicità e l’esattezza dei dati: se i dati sono sufficientemente incerti e meno accurati, non possono più essere riferiti a una persona specifica.
Tra le misure riconducibili alla randomizzazione si segnalano:
- l’aggiunta di rumore statistico, che consiste nella modifica dei dati mediante l’aggiunta di piccoli cambiamenti casuali, per limitare la capacità di collegare i dati ad un individuo;
- la permutazione, che consiste nel mescolare i valori all’interno di una tabella in modo tale che alcuni di essi risultino artificialmente collegati a diverse persone interessate.
Mascheramento
Tale tecnica comporta la rimozione di identificatori personali ovvi e diretti riducendo il numero dei dati originali. Tale tecnica difficilmente consente il raggiungimento dell’anonimizzazione del dataset ma può essere utilizzata come base di partenza e come supporto ad altre tecniche.
Pseudoanonimizzazione
La pseudonimizzazione ha lo scopo di sostituire un dato identificativo (es. nomi, codice fiscale, ecc.) con un valore surrogato che spesso è chiamato token, il quale deve essere irreversibile senza informazione aggiuntiva e distinguibile dal valore originale. Nella tabella che segue è mostrato il risultato di un processo di pseudonimizzazione che ha sostituito nella prima tabella il nome con un token (codice).
Figura X: esempio di pseudoanonimizzazione
Anonimizzazione stratificata
Consiste in una seconda anonimizzazione di dati già resi anonimi. Può essere utilizzato a livello interdipartimentale in modo che, man mano che i dati vengono passati da un’area funzionale all’altra della stessa organizzazione, vengano effettuati diversi processi di anonimizzazione. A volte la ri-anonimizzazione delle variabili può fornire garanzie aggiuntive per evitare la re-identificazione delle persone.
0 comments
Add your comment
Sign in with your account or sign up to add your comment.
Loading comments ...