Linee Guida per il riutilizzo e l’apertura dei dati pubblici regionali (Open Data)
#OpenDataPuglia Processo partecipativo
1 - Introduzione
Introduzione
I dati aperti delle Pubbliche Amministrazioni rappresentano un enorme patrimonio di ricchezza e conoscenza che, negli ultimi anni, hanno acquisito un'importanza sempre crescente: infatti, grazie all'uso delle tecnologie, è possibile estrarne valore e significato, utilizzandoli per rendere l'Amministrazione più trasparente, erogare servizi ancor più efficienti, e riutilizzarli, in conformità alla normativa di settore, per qualsiasi scopo, non ultimo quello commerciale.
Per favorire la piena realizzazione del “mercato unico digitale”, l’Unione Europea sta lavorando già da alcuni anni a un imponente quadro normativo, al cui centro si pone la strategia per i dati, finalizzata a garantirne la massima circolazione possibile a beneficio di tutti. Molta strada è stata fatta dalla Direttiva 2003/98/CE (cd. PSI, Public Sector Information), primo passo per il concreto riutilizzo dell’informazione del settore pubblico: con la Direttiva (UE) 2019/1024, che ha modificato a sua volta la precedente Direttiva (UE) 2013/37, si sono poste le basi concrete per costruire uno spazio europeo dei dati basato sull’interoperabilità tra sistemi. Il Decreto Legislativo n. 36/2006 di recepimento, nel nostro Paese, della Direttiva PSI innanzi citata, è la base su cui poggiano le Linee Guida “relative alle regole tecniche sull’apertura dei dati e il riutilizzo dell’informazione del settore pubblico”, adottate da Agid con Determinazione n. 183/2023 del 3 agosto 2023, previste dall’art. 12 del testo della direttiva.
Linee Guida AgID costituiscono normativa regolamentare vincolante per le Amministrazioni, ai sensi dell’art. 71 del “Codice dell’Amministrazione Digitale” (cd. CAD - D. Lgs. n. 82/2005); pertanto, le presenti Linee Guida regionali, nel declinare le specificità relative al contesto regionale, si conformano al disposto delle LG AgID su tutti gli aspetti obbligatori (cd. Requisiti, richiamati espressamente nel corpo del testo) e ne recepiscono anche gli aspetti specifici non obbligatori (cd. Raccomandazioni).
1.1 I dati aperti: cosa sono e a cosa servono
Il CAD definisce “dati di tipo aperto” (art. 1, lett) l - ter) quei dati che presentano le seguenti caratteristiche:
- “sono disponibili secondo i termini di una licenza o di una previsione normativa che ne permetta l'utilizzo da parte di chiunque, anche per finalità commerciali, in formato disaggregato;
- sono accessibili attraverso le tecnologie dell'informazione e della comunicazione, ivi comprese le reti telematiche pubbliche e private, in un formato aperto (formato di dati reso pubblico, documentato esaustivamente e neutro rispetto agli strumenti tecnologici necessari per la fruizione dei dati stessi), sono adatti all'utilizzo automatico da parte di programmi per elaboratori e sono provvisti dei relativi metadati;
- sono resi disponibili gratuitamente attraverso le tecnologie dell'informazione e della comunicazione, ivi comprese le reti telematiche pubbliche e private, oppure sono resi disponibili ai costi marginali sostenuti per la loro riproduzione e divulgazione”.
Pertanto, i dati pubblici (art. 2, comma 1, lett. d), D. Lgs. n. 36/2006) che costituiscono “dati aperti” e rientrano nell’ambito di applicazione delle presenti Linee Guida DEVONO essere messi a disposizione, dai soggetti di seguito specificati, per il riutilizzo a fini commerciali e non commerciali (Requisito 1 LG AgID):
- in formato leggibile meccanicamente;
- in formato aperto;
- in modalità accessibile attraverso le tecnologie dell’informazione e della comunicazione
(Requisito 11 LG AgID);
- gratuitamente o con i costi marginali (Requisito 22 LG AgID);
- secondo i termini di licenze standard, disponibili in formato digitale;
- provvisti dei relativi metadati.
I dati possono avere un diverso grado di apertura, a seconda del formato di pubblicazione e della licenza che li accompagna e che ne consente il riutilizzo.
Per rendere immediatamente evidente il grado di apertura dei dati, Tim Berners Lee, co-inventore del World Wide Web e primo sostenitore del “movimento open data”, ha proposto una classificazione su una scala di valori da 1 a 5, identificati da un pari numero di “stelle”, che resta ancora oggi il più conosciuto e utilizzato sistema di classificazione dei dati aperti.
(★) 1 Stella
Livello base costituito da file non strutturati: ad esempio un’immagine in formato grezzo (formati come .gif, .jpg, .png), un documento in formato Microsoft Word, un file in formato Adobe Pdf.
(★★) 2 Stelle
Dati strutturati ma codificati con un formato proprietario: ad esempio un documento in formato Microsoft Excel.
(★★★) 3 Stelle
Dati strutturati e codificati in un formato non proprietario: ad esempio il formato CSV (Comma Separated Values) al posto del formato Microsoft Excel utilizzato nel caso precedente.
(★★★★) 4 Stelle
Dati strutturati e codificati in un formato non proprietario che sono dotati di un URI (Identificatore Univoco di Risorsa) che li rende indirizzabili sulla rete e quindi utilizzabili direttamente online, attraverso standard come RDF (Resource Description Framework) e SPARQL.
(★★★★★) 5 Stelle
Linked Open Data (LOD), cioè dati aperti che, oltre a rispondere alle caratteristiche indicate al punto precedente, presentano anche, nella struttura del Dataset, collegamenti ad altri Dataset.
La scelta del formato dei dati e della licenza condiziona utilizzo e riutilizzo del dato: per questo motivo, i dati devono essere resi disponibili in formato aperto e leggibile meccanicamente ad un livello almeno a 3 stelle; dataset in formati a 1 e 2 stelle, comunque sconsigliati, possono essere utilizzati dalle PA solo se pubblicati unitamente ad un formato almeno a 3 stelle (Requisiti 2 e 3 LG AgID). Si raccomanda un percorso graduale verso la produzione nativa di Linked Open Data – LOD (Raccomandazione 1 LG AgID).
La tabella di seguito riportata riassume le caratteristiche dei formati più diffusi.
Figura 1 - Formati più comuni per i dati aperti e relativi livelli di apertura
1.2 Le potenzialità dell’utilizzo del dato
La diffusione dei dati aperti consente di aprire il mondo dei ”produttori” di dati (Pubblica Amministrazione, Imprese, Università e Ricerca e qualunque altro soggetto) ai benefici offerti dalla gestione e l’analisi dei big data: grazie anche alla diffusione di open data e big data, infatti, sono state sviluppate negli anni tecniche predittive sempre più precise che si sono affiancate, con diffusione sempre maggiore a partire dagli anni 90, alle tecniche di stima “classiche” (regressione lineare, logistica, etc...). L'obiettivo principale è quello di andare oltre la comprensione del mero fenomeno per arrivare a una visione prospettica e, così, guidare le future decisioni. Tali tecniche, che utilizzano algoritmi di intelligenza artificiale (come gli algoritmi di machine learning), sono diventate sempre più complesse e dettagliate (deep learning), migliorando le proprie “prestazioni” predittive - applicabili a qualunque dominio di interesse (politico, economico, culturale…) - all’aumentare della base informativa a disposizione, sviluppando la capacità di “imparare”.
La Regione Puglia, con l’intervento OR_1 “Big Data, Open Data, DSS, CRM” previsto nel Piano triennale di Riorganizzazione Digitale 2022-2024, ha avviato la realizzazione di un sistema che:
- consente le analisi predittive descritte precedentemente, migliorando la conoscenza del territorio a beneficio dei decision maker e riducendo i tempi di analisi;
- permette di estrarre informazioni dall’incrocio di molteplici basi di dati e di processare dati real-time, consentendo di avere più prospettive di analisi su un dato fenomeno, in maniera tempestiva;
- facilita, inoltre, lo sviluppo di applicazioni intelligenti che sfruttino le regolarità nei dati per offrire servizi a cittadini, imprese e Pubbliche amministrazioni.
0 commenti
Aggiungi il tuo commento
Connessione con il tuo account o Sign up per aggiungere il tuo commento.
Sto caricando i commenti ...