Salta al contenuto principale
Passa alla visualizzazione normale.

Cosa sono i principi FAIR

16-giu-2023

Ascolta

Horizon Europe richiede una gestione responsabile dei dati secondo i principi FAIR. Tali principi sono stati codificati con lo scopo di aiutare a definire in che modo i dati possano essere resi disponibili ai ricercatori e ai cittadini secondo il principio “as open as possible, as closed as necessary”. Motivi di sicurezza o di privacy potrebbero impedirne la disseminazione open, ma anche in questi casi è comunque possibile rendere nota la struttura e la metodologia di raccolta e di elaborazione dei dati.  

Il termine FAIR fu coniato al Lorentz workshop, presso l'Università di Leiden, nel 2014; i principi FAIR furono pubblicati nel 2016 sulla rivista Nature, come FAIR Guiding Principles for scientific data management and stewardship’.  Tramite la pubblicazione di un Addendum, nel 2019, è stato annunciato che il “living document” relativo ai principi FAIR è ospitato ed aggiornato sul sito GoFAIR all’URL https://www.go-fair.org/fair-principles/

Requisiti per i dati FAIR - vai avanti per visualizzare il pdf accessibile
Visualizza il pdf accessibile

 

Di seguito i principi con la loro formulazione e la spiegazione (Traduzione e adattamento da: “FAIR Principles” in GO FAIR , https://www.go-fair.org/fair-principles/, Creative Commons Attribution 4.0 International  )

 

Principio

Definizione

Cosa vuol dire?

Findable

Il primo passo per (ri)utilizzare i dati è trovarli. Metadati e dati dovrebbero essere facili da trovare sia per gli esseri umani che per i computer. I metadati leggibili dalla macchina sono essenziali per il rilevamento automatico di set di dati e servizi, quindi questo è un componente essenziale del processo di FAIRification.

F1. Ai (meta)dati viene assegnato un identificatore globale unico e persistente (Pid)

F2. I dati sono descritti con metadati avanzati (definiti da R1 di seguito)

F3. I metadati includono in modo chiaro ed esplicito l'identificatore dei dati che descrivono

F4. I (meta)dati sono registrati o indicizzati in una risorsa ricercabile

Il PId deve essere globalmente univoco e persistente, perché sia ricercabile, citabile e indicizzabile. I metadati avanzati consentono di ritrovare i dati non soltanto in base al PId, ma anche delle altre informazioni sul contesto, la qualità, le condizioni e le caratteristiche del dato. I metadati devono descrivere esplicitamente il PId. La trovabilità dei dataset è molto agevolata se i metadati sono indicizzati in risorse specializzate, meglio se largamente usate per l’argomento di ricerca.

Accessible

Una volta che l'utente ha trovato i dati richiesti, deve sapere come è possibile accedervi, come funzionano eventualmente l'autenticazione e l'autorizzazione.

A1. I (meta)dati sono recuperabili dal loro identificatore utilizzando un protocollo di comunicazione standardizzato

A1.1 Il protocollo è aperto, gratuito e universalmente implementabile

A1.2 Il protocollo prevede una procedura di autenticazione e autorizzazione, ove necessaria

A2. I metadati sono accessibili, anche quando i dati non sono più disponibili

Il recupero dei dati FAIR dovrebbe essere mediato senza strumenti o metodi di comunicazione specializzati o proprietari. In casi particolari, come per dati altamente sensibili è conforme ai principi FAIR fornire un'e-mail, un numero di telefono o un nome Skype di una persona di contatto, chiaramente indicata nei metadati, in grado di fornire assistenza sull'accesso ai dati. Poiché accessibile non significa necessariamente aperto, il protocollo dovrebbe fornire un meccanismo autorizzativo per il download da parte di particolari utenti. Deve essere inoltre garantita la conservazione a lungo termine dei metadati, per consentire il reperimento dei dataset.

Interoperable

I dati di solito devono essere integrati con altri dati. Inoltre, i dati devono interagire con applicazioni o flussi di lavoro per l'analisi, l'archiviazione e l'elaborazione.

I1. I (meta)dati utilizzano un linguaggio formale, accessibile, condiviso e ampiamente applicabile per la rappresentazione della conoscenza.

I2. I (meta)dati utilizzano vocabolari che seguono i principi FAIR

I3. I (meta)dati includono riferimenti qualificati ad altri (meta)dati

L'obiettivo principale di questo principio è quello di fornire una comprensione ampiamente condivisa degli oggetti digitali, mediante l'utilizzo di un linguaggio di rappresentazione che abbia una sintassi e una grammatica definite in modo preciso, condivise e accessibili. Il vocabolario controllato utilizzato per descrivere i set di dati deve essere documentato e risolvibile utilizzando identificatori univoci e persistenti a livello globale. Questa documentazione deve essere facilmente reperibile e accessibile da chiunque utilizzi il set di dati. I dataset collegati devono essere citati utilizzando i relativi PId.

Reusable

 

L'obiettivo finale di FAIR è ottimizzare il riutilizzo dei dati. Per ottenere ciò, i metadati e i dati dovrebbero essere ben descritti in modo che possano essere replicati e/o combinati in contesti diversi.

R1. I (meta)dati sono riccamente descritti con una pluralità di attributi accurati e rilevanti

R1.1. I (meta)dati vengono rilasciati con una licenza di utilizzo dei dati chiara e accessibile

R1.2. I (meta)dati sono associati alla provenienza dettagliata

R1.3. I (meta)dati soddisfano gli standard della comunità rilevanti per il dominio

Per decidere se i dati sono effettivamente UTILI in un particolare contesto, l'editore di dati dovrebbe fornire non solo metadati che ne consentano la reperibilità, ma anche metadati che descrivano dettagliatamente il contesto in cui i dati sono stati generati (come ad es. i protocolli sperimentali, il produttore e il marchio della macchina o del sensore che ha creato i dati, le specie utilizzate, il regime farmacologico, ed altre informazioni anche apparentemente irrilevanti). Devono essere fornite informazioni chiare su come possono essere riutilizzati i dati, mediante l’uso di licenze standard. Le informazioni sulla provenienza devono consentire di citare correttamente i dati, l’eventuale utilizzo di dati di terzi e la licenza d’uso. Il riuso dei dati viene agevolato se i metadati aderiscono, oltre a standard di formati, anche a ontologie, per garantire una omogeneità nell’insieme delle informazioni.


 

I principi si riferiscono a tre tipi di entità: dati (o qualsiasi oggetto digitale), metadati (informazioni su quell'oggetto digitale) e infrastruttura. Ad esempio, il principio F4 definisce che sia i metadati che i dati sono registrati o indicizzati in una risorsa ricercabile (il componente dell'infrastruttura).

Poichè il fine ultimo dei principi FAIR è quello di permettere il più ampio riutilizzo dei dati della ricerca, è necessaria una accurata descrizione dei dati e degli eventuali standards legati ai metadati, che comprenda anche i termini di utilizzo. I dati e i relativi metadati devono essere corredati da una licenza, con la citazione della fonte dei dati o delle modalità di raccolta. Ad esempio, se i dati sono di proprietà di terze parti, o coperti da segreto militare, o soggetti a vincoli di privacy, è necessario dichiararlo.


Non gestire i dati secondo i principi FAIR rappresenta un costo per l’economia pubblica, come descritto nel report della Commissione Europea “Cost of not having FAIR research data” (https://op.europa.eu/s/smTL).