Salta al contenuto principale
Passa alla visualizzazione normale.

Cosa sono i principi FAIR?

3-feb-2022

Horizon Europe richiede una gestione responsabile dei dati secondo i principi FAIR. Tali principi sono stati codificati con lo scopo di aiutare a definire dei dati che possano essere resi disponibili ai ricercatori e ai cittadini “as open as possible, as closed as necessary”. Attuando una gestione dei dati che aderisca a tali principi, è possibile renderli aperti nella maggior parte dei casi, non accessibili solo in casi particolari (ad esempio sicurezza o privacy), ma nel secondo caso comunque è possibile rendere nota la struttura dei dati (non i contenuti) e la metodologia di raccolta ed elaborazione. 


I principi FAIR sono i seguenti:

Findable

The first step in (re)using data is to find them. Metadata and data should be easy to find for both humans and computers. Machine-readable metadata are essential for automatic discovery of datasets and services, so this is an essential component of the FAIRification process.

F1. (Meta)data are assigned a globally unique and persistent identifier

F2. Data are described with rich metadata (defined by R1 below)

F3. Metadata clearly and explicitly include the identifier of the data they describe

F4. (Meta)data are registered or indexed in a searchable resource

Trovabile

Il primo passo per (ri)utilizzare i dati è trovarli. Metadati e dati dovrebbero essere facili da trovare sia per gli esseri umani che per i computer. I metadati leggibili dalla macchina sono essenziali per il rilevamento automatico di set di dati e servizi, quindi questo è un componente essenziale del processo di FAIRification.

F1. Ai (meta)dati viene assegnato un identificatore globale unico e persistente

F2. I dati sono descritti con metadati avanzati (definiti da R1 di seguito)

F3. I metadati includono in modo chiaro ed esplicito l'identificatore dei dati che descrivono

F4. I (meta)dati sono registrati o indicizzati in una risorsa ricercabile

Bisogna utilizzare metadati e specificare gli eventuali standard in uso per i dati (ne esistono alcuni per disciplina, che aiutano a descrivere specifici materiali) o, in alternativa, descrivere i tipi di dati creati e come; la creazione di parole chiave può aiutare maggiormente nella ricerca dei dati; è indispensabile l’utilizzo di convenzioni per la nomenclatura dei dati e dei file, che includa un sistema versioning. Tra i metadati deve essere presente un identificativo unico e persistente dei dati (ad esempio il DOI viene utilizzato in DataCite e Zenodo).

Per essere reperibili, i dati devono essere conservati per almeno 10 anni in un archivio che garantisca una conservazione a lungo termine, come ad esempio Zenodo, l’archivio del CERN di Ginevra accessibile a tutti. Archivi disciplinari

possono essere trovati su Re3data-Registry of data repositories, mentre su FAIR

sharing sono presenti anche standards e policies. Dataverse, Protocols.io e Figshareconsentono di creare gruppi di ricerca per la condivisione di dati, in modalità “social”.

 

Accessible

Once the user finds the required data, she/he/they need to know how can they be accessed, possibly including authentication and authorisation.

A1. (Meta)data are retrievable by their identifier using a standardised communications protocol

A1.1 The protocol is open, free, and universally implementable

A1.2 The protocol allows for an authentication and authorisation procedure, where necessary

A2. Metadata are accessible, even when the data are no longer available

Accessibile

Una volta che l'utente ha trovato i dati richiesti, deve sapere come è possibile accedervi, includendo eventualmente l'autenticazione e l'autorizzazione.

A1. I (meta)dati sono recuperabili dal loro identificatore utilizzando un protocollo di comunicazione standardizzato

A1.1 Il protocollo è aperto, gratuito e universalmente implementabile

A1.2 Il protocollo prevede una procedura di autenticazione e autorizzazione, ove necessaria

A2. I metadati sono accessibili, anche quando i dati non sono più disponibili

Quando l’utente ha trovato i dati cercati, è necessario che sappia come accedervi: quindi devono essere resi noti protocolli, standard, formati ed eventuali software per leggerli, modalità di autenticazione ed autorizzazione.

N.B. Accessible e open non sono necessariamente sinonimi: l’importante è sapere dove sono disponibili i dati e a quali condizioni. Possono essere esposti in modalità open anche soltanto i metadati.

 

Interoperable

The data usually need to be integrated with other data. In addition, the data need to interoperate with applications or workflows for analysis, storage, and processing.

I1. (Meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation.

I2. (Meta)data use vocabularies that follow FAIR principles

I3. (Meta)data include qualified references to other (meta)data

Interoperabile

I dati di solito devono essere integrati con altri dati. Inoltre, i dati devono interagire con applicazioni o flussi di lavoro per l'analisi, l'archiviazione e l'elaborazione.

I1. I (meta)dati utilizzano un linguaggio formale, accessibile, condiviso e ampiamente applicabile per la rappresentazione della conoscenza.

I2. I (meta)dati utilizzano vocabolari che seguono i principi FAIR

I3. I (meta)dati includono riferimenti qualificati ad altri (meta)dati

L’interoperabilità dei dati mira a garantire lo scambio e il riutilizzo dei dati tra ricercatori e istituzioni di tutto il mondo. Essi devono dunque essere codificati utilizzando formati e vocabolari aderenti a standard ampiamente utilizzati nel settore disciplinare di riferimento. 

 

Reusable

The ultimate goal of FAIR is to optimise the reuse of data. To achieve this, metadata and data should be well-described so that they can be replicated and/or combined in different settings.

R1. (Meta)data are richly described with a plurality of accurate and relevant attributes

R1.1. (Meta)data are released with a clear and accessible data usage license

R1.2. (Meta)data are associated with detailed provenance

R1.3. (Meta)data meet domain-relevant community standards

The principles refer to three types of entities: data (or any digital object), metadata (information about that digital object), and infrastructure. For instance, principle F4 defines that both metadata and data are registered or indexed in a searchable resource (the infrastructure component).

Riutilizzabile

L'obiettivo finale di FAIR è ottimizzare il riutilizzo dei dati. Per ottenere ciò, i metadati e i dati dovrebbero essere ben descritti in modo che possano essere replicati e/o combinati in contesti diversi.

R1. I (meta)dati sono riccamente descritti con una pluralità di attributi accurati e rilevanti

R1.1. I (meta)dati vengono rilasciati con una licenza di utilizzo dei dati chiara e accessibile

R1.2. I (meta)dati sono associati alla provenienza dettagliata

R1.3. I (meta)dati soddisfano gli standard della comunità rilevanti per il dominio

I principi si riferiscono a tre tipi di entità: dati (o qualsiasi oggetto digitale), metadati (informazioni su quell'oggetto digitale) e infrastruttura. Ad esempio, il principio F4 definisce che sia i metadati che i dati sono registrati o indicizzati in una risorsa ricercabile (il componente dell'infrastruttura).

Poichè il fine ultimo dei principi FAIR è quello di permettere il più ampio riutilizzo dei dati della ricerca, è necessaria una accurata descrizione dei dati e degli eventuali standards legati ai metadati, che comprenda anche i termini di utilizzo. I dati e i relativi metadati devono essere corredati da una licenza, con la citazione della fonte dei dati o delle modalità di raccolta. Ad esempio, se i dati sono di proprietà di terze parti, o coperti da segreto militare, o soggetti a vincoli di privacy, è necessario dichiararlo.


Non gestire i dati secondo i principi FAIR rappresenta un costo per l’economia pubblica, come descritto nel report della Commissione Europea “Cost of not having FAIR research data” (https://op.europa.eu/s/smTL).