Linee Guida per il riutilizzo e l’apertura dei dati pubblici regionali (Open Data)
#OpenDataPuglia Processo partecipativo
3 - Apertura e pubblicazione dei dati aperti
3.Apertura e pubblicazione dei dati aperti
3.1 Principi generali per l’apertura di un dataset
Nel processo di apertura di un dataset, è necessario seguire un percorso lineare, che “guidi” ciascuna Struttura nella preparazione e selezione dei dati, per garantirne l’attendibilità, la qualità e la sostenibilità. La figura che segue, tratta dal Capitolo 5 delle Linee Guida AgID, rappresenta un possibile percorso adattabile alle diverse realtà del territorio regionale.
Figura 3: processo di apertura dei dati (Fonte: AgID)
3.1.1 Identificare i dati
La fase di “Identificazione” comprende i processi necessari all’identificazione dei potenziali dataset da aprire all’interno dell’Ente e alla pianificazione delle aperture. In particolare, prevede:
- la ricognizione dei dati, che consente di quantificare e valutare la consistenza del patrimonio informativo a disposizione dell’Ente;
- l’analisi dei vincoli, che consente di fare una prima selezione dei dati che possono essere resi disponibili per il riutilizzo;
- la definizione delle priorità di apertura e la pianificazione delle stesse.
Ricognizione
Per i dati nativi, le strutture organizzative dell’amministrazione individuano, al proprio interno, tra tutti i dati prodotti, quelli che si è scelto di aprire o che la normativa impone di aprire.
Analisi dei vincoli
E’ esclusa la pubblicazione e il conseguente riutilizzo, a qualsiasi titolo, di dati appartenenti alle “particolari categorie di dati” di cui all’art. 9 del Regolamento (UE) 2016/679 e, generalmente, dei dati personali relativi a condanne penali e reati di cui all’art. 10 del medesimo Regolamento.
La verifica della presenza di dati personali all’interno dei dataset da aprire impone il rispetto del Regolamento (UE) 2016/679, delle "Linee guida in materia di trattamento di dati personali, contenuti anche in atti e documenti amministrativi, effettuato per finalità di pubblicità e trasparenza sul web da soggetti pubblici e da altri enti obbligati" (deliberazione del Garante per la protezione dei dati personali n. 243 del 15 maggio 2014), tuttora in vigore, nonché delle disposizioni del D. Lgs. n. 196/2003, aggiornato al D. Lgs. n. 101/2018.
Qualora i dataset da aprire contengano, all’origine, dati personali, devono essere pubblicati per il riutilizzo in forma anonima e aggregata; a tal fine, per ciascun dataset la Struttura responsabile/referente individua specifiche tecniche di anonimizzazione e/o il livello di aggregazione opportuno per impedire il rischio di identificazione dei soggetti cui i dati si riferiscono.
In appendice, al paragrafo 5.3, sono riportate, a titolo di esempio, alcune tecniche utilizzabili per l’anonimizzazione dei dati.
Qualora i dataset contenenti dati personali siano prodotti per la pubblicazione nella sezione “Amministrazione Trasparente” del proprio sito istituzionale (cfr. art. 7 D. Lgs. n. 33/2013), è necessario inserire un disclaimer che preveda che i dati siano "riutilizzabili solo alle condizioni previste dalla normativa vigente sul riuso dei dati pubblici (direttiva comunitaria 2003/98/CE e D. Lgs. n. 36/2006 di recepimento della stessa), in termini compatibili con gli scopi per i quali sono stati raccolti e registrati, e nel rispetto della normativa in materia di protezione dei dati personali" (cfr., provvedimento dell’Autorità Garante per la Protezione dei dati personali - deliberazione n. 243 del 25 maggio 2014).
Definizione delle priorità e percorso di apertura
Le priorità strategiche sono rivolte all’apertura dei dati dinamici, dei dati di elevato valore e dei dati della ricerca, così come definiti dalla normativa in vigore. Tutto il patrimonio informativo di Regione, compatibile con la disciplina in vigore verrà gradualmente aperto e reso disponibile (Raccomandazione 7 LG AgID) nell’ambito della realizzazione della parte open data del progetto DSS/CRM, OR_1 del Piano triennale di Riorganizzazione Digitale 2022-2024 dell’Amministrazione regionale (PRD) e relativo aggiornamento 2023-2025, a partire dagli ecosistemi di Sviluppo Economico, Sanità e Turismo.
Il percorso di apertura sopra descritto si applica all’Ente Regione. Gli ulteriori soggetti tenuti all’applicazione delle presenti Linee Guida potranno adattarlo alla propria struttura, nel rispetto delle indicazioni delle LG AgID.
3.1.2 Analizzare i dati
La fase di analisi Include i processi indirizzati a migliorare la qualità dei dati da pubblicare.
La qualità dei dati
Elemento essenziale nella strutturazione di dataset aperti è dato dall’elevata qualità dei dati, che assicura l’utilizzo di dati affidabili, aumentando la probabilità di successo dell’analisi compiuta sugli stessi. Le linee guida AgID, cui si uniformano le presenti linee guida, seguono lo standard ISO/IEC 25012:2008, divenuto norma italiana UNI CEI ISO/IEC 25012:2014, la quale definisce 15 tipologie di caratteristiche specifiche per la qualità dei dati. In particolare, esse possono essere suddivise in:
- inerenti: accuratezza, aggiornamento (attualità), completezza, consistenza (coerenza), credibilità;
- inerenti e dipendenti dal sistema: accessibilità, comprensibilità, conformità, efficienza, precisione, riservatezza, tracciabilità;
- dipendenti dal sistema: disponibilità, portabilità e ripristinabilità.
Lo Standard ISO/IEC 25012 è applicabile a tutte le tipologie di dati. Uno standard di riferimento specifico per i dati territoriali è l’ISO 19157 “Geographic information – Data quality”, già richiamato dalle LG AgID.
Con la Determinazione Commissariale n. 68/2013 di AgID, relativa alle regole tecniche per l’identificazione delle basi di dati critiche, tra quelle di interesse nazionale, specificate sulla base dell’art. 60 del CAD, si è prevista la garanzia del rispetto di quattro caratteristiche, delle 15 previste dallo Standard ISO/IEC 25012 (Raccomandazione 8 LG AgID), ovvero:
- accuratezza (sintattica e semantica) — il dato, e i suoi attributi, rappresenta correttamente il valore reale del concetto o evento cui si riferisce;
- coerenza — il dato, e i suoi attributi, non presenta contraddittorietà rispetto ad altri dati del contesto d’uso dell’amministrazione titolare;
- completezza — il dato risulta esaustivo per tutti i suoi valori attesi e rispetto alle entità relative (fonti) che concorrono alla definizione del procedimento;
- attualità (o tempestività di aggiornamento) — il dato, e i suoi attributi, è del “giusto tempo” (è aggiornato) rispetto al procedimento cui si riferisce.
Una volta definite le caratteristiche, è necessario quantificarle per consentirne la misurazione, individuando delle soglie che consentano di valutare la qualità di un dato rispetto alla caratteristica in esame. La fase di valutazione della qualità dei dati è, quindi, fondamentale in tutti i sistemi informativi, indipendentemente dalla loro apertura. Con l’adozione di politiche di apertura dei dati, la qualità dei dati assume un ruolo ancora più rilevante, in quanto elemento per la certificazione della qualità dei dati forniti e, soprattutto, dell’appropriatezza rispetto ai diversi utilizzi del dato.
La successiva norma ISO/IEC 25024 estende l’ISO/IEC 25012 “Data quality model” al campo delle misurazioni, definendo 63 misure di qualità applicabili alle 15 caratteristiche di qualità dei dati, con le relative funzioni di calcolo.
La bonifica del dato
L’analisi della qualità del dato può richiedere un processo di bonifica, in grado di garantire la correttezza dei dati, eliminando errori, duplicazioni, criticità di altro tipo. Attraverso la bonifica si aumenta il livello di qualità dei dati, migliorando una o più dimensioni previste dallo Standard ISO/IEC 25012 (accuratezza, coerenza, completezza, attualità, unicità, ...).
Il processo di bonifica può essere basato:
- sui dati — la bonifica basata sui dati prevede l’intervento direttamente sul dataset e può consistere, ad esempio, nella correzione di inconsistenze ed errori, nella rimozione e/o integrazione di dati incompleti o obsoleti, nella rimozione di elementi non machine-readable come la formattazione, nella appropriata rappresentazione di numeri, date ed altre quantità, nella riconciliazione delle etichette con altri dataset da utilizzare, etc.. Permette di raggiungere il risultato in tempi relativamente brevi, ma non risolve definitivamente il problema, in quanto, in un momento successivo, i dataset non corretti all’origine potrebbero presentare gli stessi problemi di qualità;
- sui processi — la bonifica basata sui processi, invece, ha il pregio di essere una strategia risolutiva perchè, andando ad analizzare le cause che hanno portato alla scarsa qualità dei dati, consente di rivedere i processi di produzione e garantire la qualità nel tempo. La scarsa accuratezza di una base di dati, derivante, ad esempio, da un processo di data entry manuale, potrebbe essere risolta prevedendo l’acquisizione automatica dei dati, in grado di minimizzare la possibilità di errore dovuta all’acquisizione manuale.
L’analisi di processo
La Regione Puglia con D.G.R. n. 791/2022 ha approvato il Piano triennale di Riorganizzazione Digitale 2022-2024 che prevede, nell’Obiettivo Realizzativo 1, la realizzazione di un DSS a cui tutti i sistemi dell’ente regione dovranno conferire i propri dati, con una precisa frequenza di aggiornamento e secondo i formati previsti. Le successive fasi di bonifica ed arricchimento dei dati, nonché la pubblicazione sul portale regionale dei dati aperti [meglio illustrate nei paragrafi seguenti] saranno svolte direttamente dallo stesso DSS. In tal modo, la produzione automatica di dati standard garantirà la qualità normativamente prevista, in modo coordinato tra tutte le strutture organizzative regionali.
Nelle more della realizzazione del sistema sopra descritto, le strutture regionali e tutti gli altri soggetti che devono o intendono pubblicare i propri dati aperti sul portale regionale dati.puglia.it, come in precedenza specificato, applicano le linee guida AgID, nelle quali è previsto che ogni produttore di dati aperti effettui l’analisi del “processo organizzativo che produce e gestisce il dato per fare in modo che la produzione di quel dato sia consolidata e diventi stabile, secondo la frequenza di aggiornamento e le modalità di rilascio adottate”. In sintesi, l’obiettivo del legislatore è la produzione automatica e standardizzata dei dati aperti da parte del titolare del dato nativo. La governance del processo è descritta nel precedente par. 2.2.
3.1.3 Arricchire i dati (fase eventuale)
I dati possono essere arricchiti attraverso la loro standardizzazione, l’integrazione con dati provenienti da altre fonti e il collegamento esterno.
Vocabolari controllati
L’uso di vocabolari controllati, quali elenchi di codici, tassonomie, classificazioni o terminologie, permette di standardizzare e normalizzare i dati.
Nel caso dei dati di elevato valore, per specifiche categorie tematiche [osservazione della terra e ambiente, statistica, imprese e proprietà delle imprese, mobilità, etc.] il Regolamento (UE) 2023/138 indica esplicitamente che i set di dati devono utilizzare, ove possibile, vocabolari controllati e tassonomie, documentati pubblicamente e riconosciuti nell’Unione o a livello internazionale. I vocabolari controllati sono disponibili nel Catalogo Nazionale della semantica dei dati schema.gov.it e, per i dati territoriali, nel Sistema di Registri INSPIRE Italia.
Dati da più fonti (mashup)
Le amministrazioni possono raccogliere e integrare informazioni da diverse fonti, sia interne, sia esterne (dati di “mashup”). Per tale tipologia di dati, la parte più importante è la definizione delle modalità di accesso e delle politiche di riutilizzo connesse alle licenze (politiche di licensing), a partire dalle logiche dei singoli produttori dei dati e le relative modalità di rilascio e aggiornamento dei dati. Sul riutilizzo dei dati di mashup, si suggerisce di consultare la matrice di compatibilità tra licenze presente nelle LG AgID, cap. 6.
Collegamento (linking) nei LOD
Il collegamento (linking) dei dati fra dataset di origine diversa (interni o esterni all’amministrazione) può aumentarne il valore, creando nuove relazioni e consentendo così nuovi tipi di analisi. Si ricorda che le linee guida AgID prevedono (Raccomandazione 1 LG AgID) un percorso graduale verso la produzione nativa di Linked Open Data – LOD.
3.1.4 Modellare e documentare i dati
I dati individuati per la pubblicazione, dopo la fase di bonifica qualitativa e la fase di arricchimento, devono essere aderenti ai modelli dei dati, alle ontologie e agli schemi dati definiti, sia a livello europeo, sia a livello nazionale (cfr. il “catalogo nazionale della semantica dei dati”, schema.gov.it), oppure devono essere corredati di documentazione completa e accessibile sulla loro struttura sintattica e semantica, al fine di garantire la piena interoperabilità (Requisito 12 LG AgID).
Schemi dei dati
I dati da aprire devono essere accompagnati dalla descrizione della loro sintassi e della loro struttura.
Modelli dei dati
Il produttore deve verificare se i dati da pubblicare siano già associabili ad entità, proprietà e, ove presenti, URI ampiamente conosciute specie in ambito europeo. In particolare, AgID raccomanda di modellare i dati sulla base dei vocabolari e ontologie di OntoPiA, in larga parte allineati (collegati) a standard aperti del Web e disponibili in formati aperti standard sulla piattaforma https://github.com/italia/daf-ontologie-vocabolari-controllati.
Nel caso di dati territoriali (Requisito 14 LG AgID), si deve fare riferimento a:
- Sistema di Registri INSPIRE Italia;
- Regolamento (UE) n. 1089/2010 (attuazione delle Direttiva INSPIRE, sull'interoperabilità dei set di dati territoriali e dei servizi di dati territoriali);
- Le "Implementing Rules" e "Technical Guidelines (Data Specifications)" pubblicate dalla Commissione Europea nello "INSPIRE knowledge database" (https://inspire.ec.europa.eu/data-specifications/2892).
Se i dati non sono riconducibili a modelli già esistenti, l’ente produttore deve definire e pubblicare il proprio modello dati, ontologia o vocabolario controllato.
Conservazione e storicizzazione
Le LG AgID prevedono di conservare le diverse versioni dei dati nel lungo periodo in un sistema di archiviazione/conservazione; a tal fine, si raccomanda di assicurare che le versioni stesse siano accessibili da una URL stabile, e che la stessa sia documentata unitamente alla pubblicazione del dato (Requisito 17 LG AgID).
3.1.5 Validare i dati
La validazione del processo di pubblicazione di un dataset privo di dati personali è a cura dei Responsabili della Struttura di riferimento.
Le modalità e le tempistiche vengono stabilite in raccordo con il RTD regionale, e comunicate al Team Open Data regionale.
Nel caso in cui il processo di pubblicazione abbia ad oggetto dataset contenenti dati personali provenienti da “Amministrazione Trasparente”, la pubblicazione va valutata e validata dalla Struttura regionale Responsabile anche con il supporto del Responsabile della Protezione Dati. Inoltre, deve essere indicata nei metadati del dataset la licenza d’uso e la data di cancellazione del dataset, nel rispetto della persistenza stabilita dalla legge.
Il processo sopra descritto può essere mutuato anche dagli altri soggetti cui si applicano le presenti Linee Guida. Si ricorda che la pubblicazione su dati.puglia.it da parte di soggetti terzi, prevista dalla D.G.R. n. 584/2023, non consente la pubblicazione di dataset contenenti dati personali sul portare regionale dei dati aperti dati.puglia.it.
3.1.6 Pubblicare i dati
- La procedura di pubblicazione dei dataset si compone di una serie di fasi, tra loro concatenate, che prevedono: la creazione dei metadati, la definizione delle politiche di accesso e del modello di licenza da applicare, la scelta della modalità di pubblicazione.
Metadatazione
La prima fase, che precede la pubblicazione di ciascun dataset, consiste nel raccogliere nella scheda metadati una serie di informazioni ad esso relative, fondamentali sia per una corretta comprensione dei dati, sia per il loro riutilizzo. I metadati sono “dati associati ai dati” e hanno la funzione di informare gli utilizzatori del significato del dato stesso. La loro funzione è, quindi, essenziale ai fini della ricerca, dell’accesso e dell’utilizzo e riutilizzo del dato pubblicato. I dati infatti, se fatti circolare senza il corredo informativo essenziale rappresentato dai metadati, avranno possibilità di riutilizzo fortemente limitate e saranno inevitabilmente esposti a rischi di impoverimento informativo e decontestualizzazione. Proprio per questi motivi, tutte le operazioni effettuate sui dati pubblicati per renderli accessibili, interoperabili, riusabili e per tenerli costantemente aggiornati devono essere applicate anche ai metadati (Requisiti 11, 12 e 13 LG AgID). Tra i metadati descrittivi dei dataset, ad esempio, soggetti e relativi ruoli, contestualizzazione geografica e temporale, licenza, frequenza di aggiornamento, aspetti di distribuzione, punto di contatto, rivestono particolare importanza i seguenti:
- Titolare del dato: specifica il proprietario del dataset. Per un ente, il nome dell’ente deve essere registrato in IndicePA;
- Identificatore unico e persistente dei dati e metadati (DOI): garantisce, tra l’altro il riutilizzo rendendo i dati reperibili da macchine ed esseri umani (Requisito 10 LG AgID);
- Indicazione se il dato è dinamico, o ad elevato valore, o se si tratta di dati della ricerca: per individuare i particolari tipi di dati individuati dal decreto legislativo n.36/2006
- Informazioni aggiuntive che consentano all’utente di comprendere meglio i dati;
- Informazioni sulla struttura del dataset, utili affinchè le applicazioni elaborino correttamente il dataset: ad esempio per i dati geografici, la proiezione utilizzata.
Per garantire accessibilità e interoperabilità, anche i metadati devono essere conformi a formati e standard pertinenti, standardizzati riconosciuti.
Si ricorda che nelle LG AgID ricorrono specifiche indicazioni:
- per i dati dinamici (Requisiti 5 e 6 e Raccomandazione 2 delle LG AgID);
- per i dataset ad elevato valore (Requisiti 7 e 8 LG AgID).
Per i metadati descrittivi generali, ovvero non dipendenti dalle tipologie di dati, deve essere applicato il profilo nazionale DCAT-AP_IT, rispettando le obbligatorietà, le raccomandazioni e seguendo gli esempi così come definiti nella relativa specifica e ontologia. Il profilo è stato definito con le “Linee guida per i cataloghi dati” (Requisito 15 LG AgID).
Per i metadati dei dati statistici, lo standard utilizzato è SDMX, tramite la specifica StatDCAT-AP, che consente di normalizzare lo scambio di dati statistici e relativi metadati tra organizzazioni statistiche e simili (Raccomandazione 16 LG AgID).
Per i metadati del Patrimonio Culturale, si rimanda al Piano Nazionale di Digitalizzazione e in particolare alle “Linee guida per la redazione del piano di gestione dei dati” che riguardo agli standard di metadatazione delle risorse culturali, indicano lo standard XML/METS.
Le amministrazioni sono tenute a inserire e a mantenere aggiornati i metadati dei dati, da inserire nel portale dati.gov.it, attraverso le modalità di alimentazione previste dal catalogo, ad esclusione di quelli territoriali che seguono le direttive sotto descritte (Requisito 29 LG AgID).
Nel caso di dati territoriali, devono essere applicate le regole tecniche adottate nell’ambito della Direttiva 2007/2/CE e del relativo decreto di recepimento, D. Lgs. n. 32/2010, oltre che di tutte le altre norme ad essi collegate; in particolare, i dati territoriali disponibili per il riutilizzo devono essere documentati esclusivamente attraverso metadati conformi alle “Linee Guida recanti regole tecniche per la definizione e l’aggiornamento del contenuto del Repertorio Nazionale dei Dati Territoriali” (coerenti con il Regolamento(CE) n. 1205/2008) e le relative guide operative per la compilazione dei metadati RNDT, coerente con la guida tecnica INSPIRE sui metadati (Requisito 16, Requisito 27 Lg AgID). I metadati relativi ai dati territoriali possono essere pubblicati sul Repertorio Regionale dei Dati Territoriali (RRDT) come descritto nel par. 3.3. I metadati pubblicati sul RRDT sono automaticamente importati dal Repertorio Nazionale dei Dati Territoriali (RNDT). Nelle more dell'attivazione della procedura di accreditamento degli utenti del RRDT e della pubblicazione della relativa documentazione d'uso, i metadati relativi ai dati territoriali possono essere pubblicati direttamente nel RNDT, secondo le indicazioni riportate nelle Linee Guida sopra richiamate e nelle guide operative per la compilazione dei metadati RNDT.
I metadati territoriali documentati nel RNDT secondo le suddette regole, saranno allineati automaticamente al catalogo nazionale dei dati aperti (dati.gov.it) attraverso la specifica GeoDCAT-AP (Requisito 14 e 30 Lg AgID).
Il documento “Scheda Informativa dataset e modalità di pubblicazione”, disponibile nella sezione manualistica del portale dati.puglia.it, fornisce indicazioni per la produzione di metadati e la loro pubblicazione su dati.puglia.it.
Licenze Utilizzabili
La seconda fase del processo di pubblicazione prevede la scelta della licenza da utilizzare. L’Ente Regione, con la Delibera di Giunta Regionale del 28 marzo 2022, n. 422 - atto di indirizzo per l’apertura del patrimonio informativo regionale e aggiornamento della relativa normativa regionale - ha individuato la licenza CC-BY 4.0 quale licenza di base per il rilascio dei nuovi dataset da pubblicare nel portale regionale dei dati aperti, in coerenza con quanto già fatto da AgID nelle precedenti Linee guida, richiamata, nel Piano Triennale per l’Informatica nella Pubblica Amministrazione come licenza nazionale di riferimento, e confermata nella Linee Guida AgID adottate (Requisito 20 LG AgID, Raccomandazioni 9 e 13 LG AgID).
Con la D.G.R. n. 584/2023, la Giunta regionale ha, altresì, precisato che è possibile adottare, in alternativa alla licenza di default, una licenza analoga o meno restrittiva, in conformità con le indicazioni delle Linee Guida AgID (Requisito 21 LG AgID).
E’ generalmente sconsigliato l’uso di licenze differenti da quelle suggerite (Raccomandazione 10 LG AgID; vedi anche, su CC-BY-SA, Raccomandazione 11 LG AgID), nonchè consigliato il rinnovo della licenza in caso di uso di vecchie versioni (Raccomandazioni 12 e 14 LG AgID). Non è ammesso, invece, l’uso di licenze più restrittive o di licenze proprietarie (Requisito 19 LG AgID). Alle licenze sono applicate le Raccomandazioni dalla 9 alla 14 delle Lg AgID.
Sul portale dati.puglia.it sono presenti, tra le opzioni di scelta in fase di pubblicazione dei dataset, le solo licenze ammesse secondo le presenti Linee Guida.
Per il settore culturale, si rimanda al già richiamato Piano Nazionale di Digitalizzazione, e in particolare alle “Linee guida per l’acquisizione, la circolazione e il riuso delle riproduzioni dei beni culturali in ambiente digitale” disponibile al seguente link:
https://docs.italia.it/italia/icdp/icdp-pnd-circolazione-riuso-docs/it/v1.0-giugno-2022/index.html.
3.2 Il Portale dati aperti di Regione Puglia
Il Portale regionale dati.puglia.it nasce per la gestione e pubblicazione di tutti i dati in formato aperto di Regione Puglia (Raccomandazione 17 LG AgID) e con le caratteristiche di riutilizzabilità, accessibilità e gratuità, consente il loro utilizzo per:
- Creare servizi innovativi (app, banche dati, sistemi);
- Promuovere progetti di innovazione sul territorio per lo sviluppo sociale, economico e culturale;
- Coinvolgere cittadini, imprese, altre amministrazioni ed università in progetti di partnership pubblico-privata;
- Accrescere la conoscenza e la consapevolezza della popolazione di riferimento;
- Consentire scelte e decisioni “data-driven”.
Il Portale è composto da 5 sezioni principali:
- Catalogo dati
- Saperne di più
- Statistiche
- Informazioni
- Segnalazioni
- Notizie
Figura 4 – Pagina iniziale del Portale Dati Aperti Regione Puglia
L'utente, anche non registrato al sito, può navigare liberamente tra i dataset presenti nel Catalogo Dati ricercando i dati di suo interesse, tramite ricerca libera o associata a Temi, Organizzazioni, Tag, Formati, Licenze e Sottotemi.
Nella sezione “Saperne di più, Informazioni”, l'utente ha la possibilità di informarsi sull'utilità dei dati aperti tramite casi d'uso (Storytelling, Collezioni, Riutilizzo dei dati), ottenere informazioni più dettagliate su Normative vigenti in materia di dati aperti, leggere i Manuali redatti dagli amministratori su come operare attraverso il sito.
All'interno delle sezioni sopra citate è presente la pagina dedicata alle Statistiche dove qualsiasi utente può effettuare delle analisi su come i dati sono stati sfruttati all'interno del portale stesso (Risorse più scaricate, Risorse più visualizzate, Dataset più visualizzati, Organizzazioni più visualizzate, Pagine più visualizzate etc.)
Infine, tramite “Segnalazioni e Notizie”, l'utente può segnalare eventuali dubbi o lasciare feedback agli amministratori e scegliere di rimanere informato su tutte le notizie pubblicate dalla regione sui dati aperti.
3.2.1 La procedura di pubblicazione dei dati sul portale
Possono pubblicare i propri dati sul portale Open Data della Regione Puglia, oltre a Regione e ai soggetti indicati dall’art. 2 della L.R. n. 20/2012, gli altri soggetti previsti dalla D.G.R. n. 584/2023 (soggetti aderenti, previa sottoscrizione dell’accordo allegato alla D.G.R.).
L'ente interessato (soggetto aderente) manifesta formalmente la propria volontà di utilizzare la piattaforma regionale degli Open Data attraverso l’approvazione e l’invio a Regione Puglia dello Schema di Adesione, compilato e sottoscritto dal soggetto aderente e inviato, unitamente all’atto deliberativo del soggetto aderente, a mezzo PEC, all’indirizzo del RTD resp.transizionedigitale@pec.rupar.puglia.it e per conoscenza all’email opendata@regione.puglia.it.
La Regione Puglia predispone il sistema creando, nel portale regionale, l’organizzazione corrispondente all’ente richiedente e l’account per il suo referente interno e comunica le credenziali di accesso insieme al materiale informativo di supporto. L’ente procede alla pubblicazione dei dati in base alle modalità di pubblicazione scelte. Regione Puglia verifica e monitora costantemente, tramite il gestore della piattaforma, la corretta pubblicazione dei dataset.
Sono previste 3 modalità di pubblicazione dei dati:
- Autonoma tramite accesso Portale Regionale
- Mediante fornitore dei servizi (per strutture interne regionali non autonome)
- Tramite interoperabilità dei servizi Rest o Harverst (Utilizzo di API).
1. Autonoma tramite Portale Regionale
La pubblicazione dei dataset può avvenire autonomamente tramite il collegamento sul Portale dati.puglia.it, e successiva aggiunta, compilazione e pubblicazione del dataset.
Utilizzando le credenziali ricevute, il referente interno dell’ente effettua l’accesso all’Area Riservata del portale Open Data regionale e all’interno della propria organizzazione crea i dataset compilando i Form per l’inserimento dei metadati, effettua l’upload delle risorse e pubblica i dati.
Attraverso la stessa Area Riservata, l’ente potrà nel tempo aggiornare sia i metadati (dei dataset e delle risorse) sia le risorse con l’upload dei nuovi file aggiornati.
Per maggiori informazioni riguardo questa modalità si rimanda al manuale: “Regione Puglia - Open Data - Manuale utente per pubblicazione diretta su dati.puglia.it”
2. Mediante fornitore dei servizi (per strutture interne regionali non autonome)
Nel caso in cui una struttura regionale non sia autonoma all’accesso sul Portale per la pubblicazione dei propri dataset, esiste una modalità alternativa di caricamento dei dati, che prevede la compilazione da parte della struttura, di un foglio di calcolo contenente i metadati unitamente ai file relativi alle Risorse del dataset.
I file relativi a Dataset e Risorse devono essere inviati all’indirizzo di posta elettronica: opendata@regione.puglia.it per la successiva pubblicazione da parte del fornitore dei servizi.
3. Tramite interoperabilità dei servizi Rest o Harverst (utilizzo di API)
Altra modalità di pubblicazione dei Dataset sul portale dati.puglia.it prevede l’utilizzo dei servizi Rest nativi e non, esposti dal sistema CKAN ed utili alla creazione di dataset attraverso l’invocazione da sistemi terzi.
Inoltre, è possibile attivare la procedura di harvesting, utile all’importazione in CKAN di dataset in maniera automatica prelevati da servizi terzi. Le tipologie di sorgenti per l’harvesting sono:
- CKAN
- Generic DCAT RDF Harvester
- DCAT JSON Harvester
- CKAN Harvester for DCATAPIT
Maggiori informazioni riguardo questa modalità sono disponibili nel manuale: “Regione Puglia - Open Data - Manuale servizi REST esposti da Ckan e procedura Harvest”
3.2.2 Ricerca e statistica
I dataset presenti all'interno del Portale dati.puglia.it sono ricercabili tramite la sezione Catalogo Dati: tale Sezione permette la visualizzazione e l’anteprima, attraverso un'interfaccia web, di tutti i dati nei formati aperti disponibili. L’accesso al patrimonio informativo può essere effettuato in diverse modalità, in linea con le metodologie e gli standard previsti. Strumento principale è la ricerca per parole chiave.
La sezione Catalogo dati è composta dalle voci:
- Dataset
- Organizzazioni
- Organizzazioni in Evidenza
- Temi
A seconda della scelta, l'utente verrà reindirizzato su una banca-dati ottimizzata per Rilevanza, Organizzazione, e Tema di appartenenza.
1.Dataset
Vi sono due modalità di ricerca, una base ed una avanzata: la ricerca base ha lo scopo di estrapolare il patrimonio informativo mediante l’inserimento esclusivo di parole chiave; con la ricerca avanzata, invece, è possibile restringere il campo di ricerca utilizzando i filtri presenti nella colonna a sinistra che sono:
• posizione geografica del dataset;
• organizzazione di riferimento (Es. Regione Puglia, …);
• categoria tematica del dataset previsti dallo standard (Es. Ambiente, Finanza, ecc...);
• sottocategorie tematiche previste dallo standard (Es. Ambiente, Finanza, ecc...);
• formato delle risorse associate al dataset (Es. excel, csv, ecc…);
• formato della licenza (Es. Creative Commons CC0, ecc…).
I risultati della ricerca saranno presentati sotto forma di lista. Per ogni risultato l’utente ha a disposizione il link rapido per accedere alla pagina di dettaglio del dataset.
In fase di visualizzazione del dettaglio di un dataset, il sistema propone all’utente anche una lista di risorse ad esso correlate. Le funzionalità disponibili sulle risorse sono le seguenti:
- Download - Permette di scaricare i file di dati
- Tabella - Permette la consultazione dei dati in formato tabellare
- Grafico - Permette la visualizzazione dei dati in formato grafico
- Mappa - Permette la visualizzazione su mappa cartografica di alcuni dati predisposti per tale visualizzazione
- Shape File - I file di tipo shape sono visionabili con appositi software
2.Organizzazioni
Dalla voce di menu “Catalogo Dati” – “Organizzazioni”, l’utente guest accede all’elenco delle Organizzazioni censite all’interno del portale. L’elenco delle organizzazioni può essere ordinato per nome crescente o decrescente ed inoltre l’utente guest può filtrare l’elenco delle organizzazioni tramite una ricerca inserendo il nome dell’organizzazione da ricercare anche in maniera parziale. Per ogni organizzazione viene riportato oltre al logo e a una breve descrizione, anche il numero di dataset presenti per la specifica organizzazione.
Cliccando su ogni organizzazione presente nella lista, si accede alla lista dei dataset ad essa associata.
3.Organizzazioni in Evidenza
Nella sezione “Organizzazioni in Evidenza” l’utente visualizza un elenco di organizzazioni, con la possibilità di accedere al dettaglio della specifica organizzazione. Inoltre, potrà raffinare la ricerca tramite il filtro “Cerca”, che permetterà di effettuare una “Ricerca Testuale” e/o per “Data pubblicazione”.
4.Temi
Dalla voce di menu “Catalogo Dati” – “Temi”, l’utente guest accede all’elenco dei temi dei dati, secondo il profilo di metadatazione DCAT-AP_IT: cliccando su una delle icone presenti in elenco, l’utente può effettuare l’accesso diretto all'elenco dei dataset appartenenti alla specifica tematica.
I temi possono essere ordinati per nome crescente o decrescente e ultima modifica; inoltre può filtrare l’elenco degli stessi tramite una ricerca, inserendo il nome del Tema da ricercare anche in maniera parziale. Sull’icona di ogni Tema, si visualizza anche il numero dei dataset pubblicati.
Infine, nella Sezione Statistiche, l'utente può consultare le Statistiche relative all'utilizzo dei dataset o risorse all'interno del Portale, quali:
- Risorse più scaricate
- Risorse più visualizzate
- Dataset più visualizzati
- Organizzazioni più visualizzate
- Pagine più visualizzate
Ogni Statistica è descritta tramite grafico (a barre con possibilità di cambio in grafico a torta) e possibilità di relativo download in PDF o XLS.
3.3 Il Repertorio Regionale dei dati territoriali
Il Repertorio Regionale Dati Territoriali (RRDT), pubblicato sul Sistema Informativo Territoriale della Regione Puglia (www.sit.puglia.it) è un catalogo di metadati basato sugli Standard ISO 19110, 19115 e 19139, in coerenza con le direttive AgID ed INSPIRE.
Il RRDT, tramite l'implementazione di servizi di catalogo basati sullo standard CSW definito da OGC, e' interoperabile con il Repertorio Nazionale dei Dati Territoriali (RNDT).
Tutti i soggetti già previsti nell’art. 2 della L.R. n. 20/2012 possono pubblicare sul RRDT i metadati relativi ai propri dati territoriali.
Gli enti, utilizzando le funzioni di redazione, potranno creare e pubblicare i metadati per ogni dataset di cui sono proprietari, previo accreditamento sul RRDT, applicando le indicazioni presenti nel documento "Guida operativa per la compilazione dei metadati RNDT".
3.4 Disponibilità e gratuità del dato
Caratteristica essenziale dei dati aperti è la loro gratuità, confermata anche dalla Direttiva (UE) 2019/1024: i dati di cui le pubbliche amministrazioni sono titolari, e che rinvengono dalle attività istituzionali, non costituiscono beni da cui trarre un utile, ma, piuttosto, beni comuni; di conseguenza, per la richiesta di un eventuale corrispettivo per il loro riutilizzo è giustificata solo nei limiti della necessità di coprire i costi sostenuti per la riproduzione, la messa a disposizione e la divulgazione dei dati (cd. Costo marginale). L’art. 52 del CAD, al comma 2 stabilisce che “i dati e i documenti che le amministrazioni titolari pubblicano senza l’espressa adozione di una licenza si intendono rilasciati come dati di tipo aperto” (cd. open data by default): sulla base di questo principio, i dati pubblicati dall’Amministrazione regionale sul portale dati.puglia.it sono liberamente e gratuitamente utilizzabili e riutilizzabili, secondo la specifica licenza apposta. (Requisito 9 e Requisiti dal 22 al 26 delle LG AgID).
3.5 Frequenza di aggiornamento dei dataset
Ciascuna struttura responsabile del dataset – fatta eccezione per quei dataset la cui frequenza di aggiornamento è stabilita da disciplina specifica di settore – definisce: la strutturazione dei dataset da aprire e la relativa frequenza di aggiornamento, inserendo tali informazioni nei metadati.
Il sito istituzionale dei dati aperti sarà aggiornato annualmente con gli elenchi delle categorie di dati disponibili ai fini di riutilizzo (Requisito 31 delle LG Agid) e con tutte le relative statistiche.
3.6 Le richieste di apertura di nuovi dati
L’apertura dei dati può essere un’operazione conseguente anche ad una esplicita richiesta da parte di un soggetto interessato. La Direttiva (UE) n. 36/2006 evidenzia che, in questi casi, i tempi di risposta alle richieste di riutilizzo dei documenti dovrebbero essere ragionevoli ed essere in linea con il tempo necessario per rispondere alle richieste di accesso a un dato documento, conformemente ai pertinenti regimi di accesso.
Pertanto, i soggetti interessati al riutilizzo di dati e/o di documenti diversi ed ulteriori rispetto a quelli già pubblicati sul portale Open Data, che siano nella titolarità dell’Amministrazione regionale, possono presentare formale richiesta di riutilizzo ai sensi dell’art. 5 del D. Lgs. n. 36/2006, inserendo la richiesta tramite una web form, che sarà resa disponibile su dati.puglia.it. Il RTD, ricevuta la richiesta, qualora sia nella titolarità dell’Amministrazione regionale, la inoltra alla Struttura competente [Dirigente di Sezione] che ha la responsabilità dello specifico dataset richiesto e al referente per i dati aperti dello stesso Dipartimento. Il Referente comunica al richiedente, sempre via web form, la presa in carico della richiesta. A seguito di un confronto con il Team Open Data, volto a eseguire un’analisi della richiesta e delle modalità di pubblicazione, la Struttura competente accoglie o rigetta la richiesta, nel termine di trenta giorni, eventualmente prorogabili di ulteriori venti giorni qualora le richieste siano numerose o complesse (art. 5 del D. Lgs. n. 36/2006), dandone comunicazione al richiedente all’indirizzo PEO/PEC comunicato.
Qualora il dataset sia nella titolarità di altre Amministrazioni o Soggetti che pubblicano sul portale dati.puglia.it, il RTD inoltra la richiesta all’Amministrazione titolare, per l’avvio del relativo procedimento (Requisito 18 LG AgID).
In caso di accoglimento della richiesta di riutilizzo, la Struttura competente mette a disposizione i dati sul portale regionale dei dati aperti, nei formati previsti delle presenti Linee Guida, e ne da comunicazione al richiedente all’indirizzo PEO/PEC comunicato.
In caso di diniego della richiesta di riutilizzo, la Struttura competente ne comunica i motivi al richiedente all’indirizzo PEO/PEC, e per conoscenza al RTD e a opendata@regione.puglia.it. In tale ipotesi, il richiedente può esperire i mezzi di tutela previsti dall'art. 25, commi 4 e 5 della Legge n. 241/90, che vengono comunicati al richiedente con il provvedimento di diniego.
Nel caso in cui rendere disponibili i dati per il riutilizzo comporti attività che vadano al di là della semplice manipolazione dei dati e implicano difficoltà sproporzionate, il titolare dei dati non ha l’obbligo di adeguare i documenti, o di crearne nuovi, o, ancora, di fornire estratti di documenti. Tale motivazione di mancato accoglimento prevede l’adozione di un apposito provvedimento, nel quale vengono illustrate le difficoltà sproporzionate e le attività sui dati che eccedono la semplice manipolazione (Requisito 4 LG AgID).
0 commenti
Aggiungi il tuo commento
Connessione con il tuo account o Sign up per aggiungere il tuo commento.
Sto caricando i commenti ...