Salta al contenuto principale
Passa alla visualizzazione normale.

Portale delle Biblioteche

Per “open science”, concetto molto ampio e in costante evoluzione, si intende l’accesso libero alle diverse fasi e ai differenti strumenti utilizzati nella ricerca. Si tratta, quindi, di un movimento culturale finalizzato a spingere ricercatori a rendere disponibili, alla comunità scientifica e ai cittadini l’intero iter del processo scientifico. Si potrebbe parlare di un’estensione del movimento open access, che promuove la pubblicazione ad accesso aperto dei lavori di ricerca scientifica, basandosi sull’assunto che ciò che è stato prodotto utilizzando fondi pubblici dovrebbe essere pubblico: l’open science propugna l’accesso aperto non solo delle pubblicazioni ma anche dei dati della ricerca, sia quelli raccolti nell’ambito di un progetto che quelli elaborati per il raggiungimento delle conclusioni finali, nonché la metodologia utilizzata nella gestione dei dati nel loro intero ciclo di vita, i software prodotti ed utilizzati nell’elaborazione dei dati della ricerca, fino ad arrivare alla peer review aperta per la revisione delle pubblicazioni finali, passando per una continua collaborazione tra i gruppi di ricerca e un dialogo continuo con la società (l’open science comprende, infatti, anche la divulgazione della ricerca tra i cittadini, con tutti gli strumenti che la comunicazione mette a disposizione).

Sull’open science dibattono diverse scuole di pensiero, descritte nel volume Opening Science - The Evolving Guide on How the Internet is Changing Research, Collaboration and Scholarly Publishing, a cura di Sönke Bartling e Sascha Friesike, Springer, Cham, https://doi.org/10.1007/978-3-319-00026-8al concetto di open science vengono associate cinque diverse scuole di pensiero, ognuna delle quali rappresenta una delle sfaccettature di un concetto così ampio:

  • la Public School, che mira a rendere la ricerca accessibile e partecipata, e comprensibile a tutti, anche ai cittadini;

  • la Democratic School, che mira a rendere disponibili a tutti i risultati finali della ricerca (open access) e i dati della ricerca (open data);

  • la Pragmatic School, che mira a rendere più efficiente la ricerca rendendo aperte tutte le fasi e favorendo la collaborazione, anche con strumenti online;

  • la Infrastructure School, che si concentra sulle infrastrutture tecnologiche necessarie per fare open science, ad esempio il distributed computing o social network specifici;

  • la Measurement School, che cerca di trovare misure alternative per la valutazione della ricerca. Con Horizon Europe uno degli elementi di valutazione della proposta è l’impatto che la ricerca può avere non soltanto sulla comunità scientifica ma anche sulla società, per cui il criterio di valutazione dell’impatto non può più essere limitato soltanto agli indicatori bibliometrici come l’impact factor o l’H-index.

Di seguito i principi dell’open science come definita a novembre 2021 nel documento dell’UNESCO “Recommendation on Open Science” (https://unesdoc.unesco.org/ark:/48223/pf0000379949.locale=en):

[...] To ensure that science truly benefits the people and the planet and leaves no one behind, there is need to transform the entire scientific process. Open Science is a movement aiming to make science more open, accessible, efficient, democratic, and transparent. Driven by unprecedented advances in our digital world, the transition to Open Science allows scientific information, data and outputs to be more widely accessible (Open Access) and more reliably harnessed (Open Data) with the active engagement of all relevant stakeholders (Open to Society). By encouraging science to be more connected to societal needs and by promoting equal opportunities for all (scientists, innovators, policy-makers and citizens), Open Science can be a true game-changer in fulfilling the human right to science and bridging the science, technology and innovation gaps between and within countries. However, in the fragmented scientific and policy environment, a global understanding of the meaning, opportunities and challenges of Open Science is still missing. UNESCO is therefore taking the lead in building a global consensus on Open Science, including a common definition, a sheared set of values and proposals for action [...]


UNESCO_open-science

e una tassonomia dell’open science come definita nell’articolo Nancy Pontika; Petr Knoth; Matteo Cancellieri; Samuel Pearce (2015). "Fostering Open Science to Research using a Taxonomy and an eLearning Portal" (http://oro.open.ac.uk/44719/). Retrieved 12 August 2015

os_taxonomy

Con i programmi di finanziamento Horizon 2020 e ancor di più Horizon Europe, durante l’intero ciclo di vita del progetto di ricerca viene richiesta una trasparenza molto ampia nella gestione del progetto e dei dati. Ciò favorisce una maggiore disseminazione dei risultati della ricerca, con una correlata maggiore possibilità di essere citati e una rilevante opportunità di riutilizzo dei dati, e il conseguente risparmio dei costi per produrne di nuovi, e il tutto al fine di garantire la più ampia opportunità di progresso per la scienza.

Partendo dall’assunto che i risultati delle ricerche scientifiche impiegano anni prima di poter avere una applicazione industriale e commerciale, e che l’innovazione è alla base della creazione di prosperità per la società, Carlos Moedas - commissario europeo per la ricerca, la scienza e l’innovazione (tra il 2014 e il  2019 - ha impresso una forte spinta ai principi dell’open science. Tali concetti sono espressi in una pubblicazione della Commissione Europea, Open innovation, open science, open to the world (https://data.europa.eu/doi/10.2777/552370).

Da allora si sono succedute diverse policy a sostegno dell’open science, a partire dal Settimo Programma Quadro, passando per Horizon 2020, fino ad arrivare, oggi, a Horizon Europe in cui, oltre alla obbligatorietà dell’open access per le pubblicazioni in cui vengono esposti i risultati del lavoro di ricerca, viene definita una sempre crescente obbligatorietà di rendere aperti anche i dati e le metodologie utilizzati nel progetto di ricerca.

evolution-of-EU-funding-programmes-for-ReI
Dalle slide Fit for Purpose! Shaping Open Access and Open Science Policies for Horizon Europe, Victoria Tsoukala, PhD, DG RTD Open Science (Unit G4), PUBMET 2019, Zadar, September 19th, 2019 (http://pubmet.unizd.hr/pubmet2019/talks/fit-for-purpose-shaping-open-access-and-open-science-policies-for-horizon-europe/)

Nel Settimo Programma Quadro la richiesta di rendere open le pubblicazioni era opzionale; con Horizon 2020 tale richiesta diventa vincolante e viene aggiunta quella di rendere aperti i dati della ricerca e di redigere un Data Management Plan, che poi diventerà “by default”. Con Horizon Europe il DMP diventa obbligatorio ed è strutturato in sezioni ben precise da compilare, con l’obiettivo di rendere i dati della ricerca aperti e rispondenti ai principi FAIR e la possibilità di mantenere i dati chiusi solo per giustificati motivi. L’adozione del DMP rende il progetto di ricerca “open science embedded” in quanto rende trasparenti tutte le fasi del processo di ricerca.

Due interessanti pubblicazioni sui principi dell’open science sono state predisposte dalla Open Science Policy Platform, attiva tra il 2016 e il 2020 nell’ambito della Commissione europea e formata da un gruppo di esperti, con la missione di divulgare le conoscenze sullo sviluppo e l’implementazione delle politiche di open science in Europa:

Altre pubblicazioni tematiche:

Realising the European open science cloud - First report and recommendations of the Commission high level expert group on the European open science cloud, Publications Office of the EU, 2016 (https://op.europa.eu/s/pk9M)



Open Access (OA) significa accesso libero, immediato e gratuito sul web ai dati e ai risultati della ricerca scientifica finanziata con fondi pubblici: è un modello ad alto potenziale di disseminazione e di impatto,  alternativo o complementare a quello del mercato editoriale tradizionale. L’open access riguarda la letteratura scientifica e didattica che gli autori mettono volutamente a disposizione della comunità in modo immediato e gratuito; si applica ai dati della ricerca finanziata con fondi pubblici al fine di rendere pienamente disponibili prodotti scientifici di qualità, validati dopo un’attenta peer-review. Questo garantisce: una più ampia visibilità e una più efficace disseminazione dei lavori di ricerca; crescita di prestigio e impatto; una maggior riconoscibilità e reputazione del ricercatore anche al di là della propria comunità scientifica di riferimento.

In anni recenti il concetto di Open Access si è ampliato e oggi si parla di Open Science, per indicare l’accesso libero alle diverse fasi e ai differenti strumenti utilizzati nella ricerca: i dati (Open Data); i risultati consultabili in monografie, articoli scientifici e altri documenti (Open Access); il materiale didattico (Open Educational Resources); le metodologie di ricerca (Open Methodology); i software (Open Source); la revisione dei pari, utile a verificare la qualità dei lavori scientifici (Open Peer review). L'open science comprende anche la divulgazione della ricerca tra i cittadini, con tutti gli strumenti che la comunicazione mette a disposizione.

Quindi, se l’open access riguarda principalmente la possibilità di consultare e riutilizzare a vario titolo sia le pubblicazioni frutto del lavoro di ricerca che i dati, l’open science abbraccia, oltre alle pubblicazioni finali, l’intero ciclo di vita del progetto, richiedendo che vengano codificate e rese disponibili sia all’interno che all’esterno del progetto, tutte le regole per la gestione delle diverse fasi.


Tradizionalmente la comunicazione scientifica si è basata su un modello di business che, a partire dai finanziamenti pubblici e dal lavoro dei ricercatori (sia come gestori dei progetti di ricerca, ideatori di progetto e autori delle pubblicazioni scientifiche che come revisori delle opere scientifiche da pubblicare) genera profitto esclusivamente per l’editoria scientifica, cheguadagna altissimi proventi in abbonamenti, anch’essi pagati con fondi pubblici.

Rendere aperti (cioè trasparenti e conoscibili a tutti) i diversi aspetti del processo di ricerca riporta su un ciclo virtuoso tutte le fasi della comunicazione scientifica, agevolando tutte le componenti della società interessate a conoscere ed eventualmente riutilizzare i risultati della ricerca.

Rendere aperti i dati della ricerca, se costruiti e resi disponibili secondo i principi FAIR, garantisce la riproducibilità dei risultati della ricerca, con un enorme risparmio di tempi e costi. Per lo stesso motivo sarebbe importante rendere aperti anche i risultati delle ricerche che hanno dato esito negativo, confutando l’ipotesi sperimentale, evitando così di spendere soldi pubblici, e impiegare tempo prezioso per la ricerca, per ripeterle.

In Horizon 2020 è richiesto innanzitutto il deposito in un repository (istituzionale o tematico) delle pubblicazioni frutto del lavoro di ricerca, quantomeno nella versione post-print, cioè la versione risultante dal processo di peer review, in un formato machine readable (cioè interpretabile automaticamente da motori di ricerca o altri software) e conservato a lungo termine. Per conoscere i repository attendibili, tra i quali poter scegliere quello su cui depositare il proprio lavoro, si consiglia di consultare Open Access Repository Directory (www.opendoar.org) oppure Registry of Research Data Repository (https://www.re3data.org/). Si rimanda anche alla FAQ “Come faccio a scegliere l’archivio migliore per i dati del mio progetto di ricerca?”.

L’accesso aperto al prodotto può essere garantito, oltre che mediante archiviazione in deposito (cosiddetta green road) anche mediante pubblicazione in rivista (gold road, eventualmente anche a fronte del pagamento di una APC, Article Processing Charge). La gold road prevede che l’accesso sia aperto sin dall’inizio, perchè il prodotto della ricerca è stato pubblicato su una rivista nativamente open access; con la green road è possibile prevedere un periodo di embargo (generalmente da 6 mesi per le pubblicazioni di ambito STEM a 12 mesi per le discipline umanistiche). Per maggiori dettagli consigliamo di consultare la sezione “Conoscere l'open Access” del Portale delle biblioteche.

Per conoscere le policy dei diversi editori riguardo alla pubblicazione aperta o con embargo delle diverse versioni della pubblicazione, si consiglia di consultare il sito SHERPA-RoMEO (http://www.sherpa.ac.uk/romeo/search.php). Per trovare una rivista open access e conoscere l’importo delle APC da pagare per pubblicare, si può consultare la directory DOAJ Directory of Open Access Journals (https://doaj.org/). Inoltre è disponibile una selezione di riviste indicizzate in DOAJ che non richiedono APC (https://www.unipa.it/amministrazione/direzionegenerale/sba/settoreserviziperlaricerca/.content/documenti/DOAJ-no-APC.xlsx), operata dal Settore Servizi per la ricerca e diffusione della conoscenza scientifica.


Tra i tanti documenti di riferimento per la gestione dei progetti finanziati nell’ambito di H2020. sono particolarmente importanti gli art. 29.2 e 29.3 del Model Grant Agreement, che regolamentano:

  • l’accesso alle pubblicazioni (29.2): Open access to scientific publications. Each beneficiary must ensure open access (free of charge, online access for any user) to all peer-reviewed scientific publications relating to its results. 

  • l’accesso ai dati (29.3): Open access to research data. Regarding the digital research data generated in the action (‘data’), the beneficiaries must: (a) deposit in a research data repository and take measures to make it possible for third parties to access, mine, exploit, reproduce and disseminate (b) provide information — via the repository — about tools and instruments at the disposal of the beneficiaries and necessary for validating the results.

L’accesso aperto ai dati non implica che questi siano necessariamente open access, ma che sia disponibile tutta la documentazione di supporto per poterli utilizzare, comprendere, ricostruire. 

A tal fine si consiglia la consultazione dei documenti Guidelines to the Rules on Open Access to Scientific Publications and Open Access to Research Data in Horizon 2020 e H2020 Programme Guidelines on FAIR Data Management in Horizon 2020.

Molto utile il quaderno di APRE“S-LÉGAMI!” - Manuale d’uso per ricercatori, Open Access (2022), che nasce nell’ambito delle attività svolte dal Gruppo di Lavoro APRE, dedicato all’Open Science, e si sviluppa come un manuale d’uso per i ricercatori sul tema Scienza Aperta.

Alla pagina https://www.tudelft.nl/en/library/research-data-management/r/policies/funders-policies del sito TUDelft, una utile pagina, costantemente aggiornata, che riepiloga le policy sui dati richieste dai diversi enti finanziatori.

Horizon Europe è il Programma quadro dell’Unione europea per la ricerca e l’innovazione per il periodo 2021-2027 (successivo ad Horizon 2020, che riguardava il periodo 2014-2020). La fonte di riferimento per l’accesso aperto alle pubblicazioni è l’art. 17 EU Grants: HE MGA (Communication, Dissemination and Visibility)
Horizon Europe è più incentrato, rispetto al precedente, sui principi dell’open science: per avere informazioni in merito, conoscere e partecipare ad Horizon Europe, una buona guida è in https://horizoneurope.apre.it/.
I beneficiari di un progetto finanziato nell’ambito di Horizon Europe devono assicurare l’accesso aperto alle pubblicazioni risultanti dalle attività del progetto di ricerca, prima di tutto attraverso il deposito in un trusted repository di prodotti della ricerca (per maggiori dettagli sul trusted repository si rimanda alla lettura della FAQ Come faccio a scegliere l’archivio migliore per i dati del mio progetto di ricerca?).

La pubblicazione deve essere resa disponibile in versione editoriale o come post print (ossia peer-reviewed ma non ancora con veste editoriale), contemporaneamente alla data di pubblicazione editoriale (quindi senza embargo), in un formato machine-readable, accompagnata dall'ultima versione disponibile di Creative Commons Attribution International Licenza Pubblica (CC BY) o da una licenza con diritti equivalenti; per le monografie, la licenza d’uso può escludere usi commerciali e lavori derivati (es. CC BY-NC, CC BY-ND): questo consente ai beneficiari del progetto o i coautori della pubblicazione, potranno mantenere la porzione di diritti d’autore che possa comunque garantire la pubblicazione in open access. 

Il set minimo di metadati (cfr art. 17 EU Grants: HE MGA e ANNEX 5) dovrà prevedere titolo, autori, data di pubblicazione, sede di pubblicazione, programma di finanziamento, nome, acronimo e numero del progetto come da grant, termini di utilizzo, identificatori persistenti per la pubblicazione, autori coinvolti, relative istituzioni e il grant. Nello stesso ANNEX 5 vengono definiti i requisiti da soddisfare per i dati della ricerca, tra cui la conformità ai principi FAIR (si rimanda alla lettura della FAQ Cosa sono i principi FAIR?), il deposito in un trusted repository, la regolamentazione della gestione dei dati tramite Data Management Plan (scadenze, software utilizzati e formati dei dati), rispetto degli obblighi derivanti dal finanziamento in materia di licenze d’uso per il riuso, ecc. 

Sono ammissibili al rimborso solo le spese sostenute per lavori scientifici sottoposti a peer review e pubblicati in sedi editoriali a completo accesso aperto; di conseguenza la pubblicazione su riviste ibride non potrà più essere rendicontata nel progetto. In questo modo la Commissione vuole scoraggiare il fenomeno del double dipping, con il quale si verifica che, oltre a pagare un abbonamento per accedere a una rivista, si paga poi una fee per poter far pubblicare un articolo in open access sulla stessa rivista.

Il mancato rispetto delle regole riguardanti la pubblicazione in accesso aperto delle risultanze del progetto e dei dati trattati, può comportare la revoca di parte delle somme finanziate.

I principali cambiamenti sulla pubblicazione dei risultati della ricerca in Horizon Europe rispetto a Horizon 2020, consistono dunque nel fatto che i contenuti devono essere immediatamente pubblicati in open access, senza alcun periodo di embargo; inoltre le APC sono costi rimborsabili di progetto solo nel caso di riviste fully open access, quindi non devono essere ibride. Viene dato maggior rilievo alla gestione e alla disseminazione dei dati della ricerca.

Per ulteriori dettagli si rimanda alla consultazione della pagina https://apre.it/open-access-come-e-andata-in-h2020-e-cosa-prevede-horizon-europe/

Alla pagina https://www.tudelft.nl/en/library/research-data-management/r/policies/funders-policies del sito TUDelft, una utile pagina, costantemente aggiornata, che riepiloga le policy sui dati richieste dai diversi enti finanziatori.


PlanS è una iniziativa per l’open access supportata da CoalitionS, gruppo di enti finanziatori, tra cui la Commissione Europea, che si propone di rendere aperto l’accesso alle pubblicazioni scientifiche nel caso in cui queste siano finanziate da fondi pubblici.

Dal 2021 tutte le pubblicazioni frutto di progetti finanziati da enti pubblici sia nazionali e europei devono essere pubblicati su riviste o piattaforme open access compatibili.

I punti principali attuati da COAlitionS sono:

  • la non compatibilità del modello di pubblicazione su riviste ibride;

  • stabilire un tetto massimo per il pagamento delle APC;

  • le APC devono essere pagate dagli enti finanziatori e non devono essere a carico del ricercatore;

  • i diritti di copyright devono rimanere agli autori;

  • la licenza d’uso sui dati deve essere CC BY (per ulteriori dettagli http://www.creativecommons.it/Licenze).

ORE (Open Research Europe - https://open-research-europe.ec.europa.eu/) è una piattaforma che eroga un servizio di pubblicazione open access. La piattaforma ha iniziato a pubblicare a marzo 2021, si tratta di una vera e propria rivista, che prevede una review open. I costi di pubblicazione sono supportati dalla Commissione Europea. Per pubblicare su ORE bisogna essere beneficiario di un grant della Commissione Europea (H2020 o HE). La pubblicazione su ORE non è obbligatoria; la piattaforma è a disposizione della comunità scientifica, anche per sopperire alla mancanza di fondi appositi per le APC. Poichè non si tratta di un repository ma di una rivista a tutti gli effetti, i lavori pubblicati in questa sede non possono essere ripubblicati in altre riviste.

La gestione dei dati non riguarda solo chi fa ricerca, ma anche i potenziali fruitori futuri. Le tecniche di gestione dei dati aiutano chi fa ricerca. La corretta gestione dei dati deve condurre a renderli FAIR e, se possibile, open.

Nella gestione dei dati sono fondamentali i backup, un eventuale software di accompagnamento per la loro lettura nel caso in cui si tratti di un particolare formato, anche proprietario, la legenda (o comunque una documentazione che spieghi la natura e le modalità di calcolo di ogni signolo metadato). 

La gestione dei dati della ricerca è prevista nella direttiva open data “Direttiva europea 2019/1024 del Parlamento europeo e del Consiglio del 20 giugno 2019 (https://eur-lex.europa.eu/legal-content/IT/TXT/PDF/?uri=CELEX:32019L1024) , relativa all’apertura dei dati e al riutilizzo dell’informazione nel settore pubblico” (Gazzetta ufficiale dell’Unione Europea del 26.6.2019), recepita in Italia con il decreto legislativo n. 200 dell’8 novembre 2021, entrato in vigore il 15 dicembre 2021, atteso provvedimento relativo all’apertura dei dati e al riutilizzo delle informazioni del settore pubblico.

Alla luce di questi provvedimenti rivestono grande importanza le politiche di Ateneo a supporto della gestione dei dati e della loro sicurezza, intesa sia come sicurezza da attacchi esterni, sia come sicurezza nelle conseguenze relative alla diffusione dei dati.

Di seguito un elenco di strumenti di supporto e utili letture per la gestione dei dati del progetto di ricerca:

Cosa conservare? Dati rilevanti per la missione dell’ente; valore storico, unicità, potenziale di riuso, non replicabili, con un buon rapporto costi / benefici, corredati da una documentazione completa. Checklist sul sitohttps://www.dcc.ac.uk/guidance/how-guides/appraise-select-data#5

Gestire i dati: GDPR art. 89 (eccezioni per la ricerca ma sempre su basi legali). Vedi CESSDA Training,” Data Management Expert Guide”  (https://www.cessda.eu/Training/Training-Resources/Library/Data-Management-Expert-Guide). Se si gestiscono dati sensibili, bisogna conservare le informative privacy e documentare per quale scopo si stanno elaborando i dati, in quanto poi non si possono fare elaborazioni per scopi diversi. In alcuni casi è opportuno agire in sinergia con l’ufficio legale. Sarebbe ottimale creare un processo per gestire i dati GDPR. Nel sito TU Delft è interessante il Personal Research Data Workflow (https://www.tudelft.nl/en/library/research-data-management/r/manage/confidential-data/personal-data) che suggerisce quale livello della propria organizzazione deve essere coinvolto per gestire dati personali o sensibili.

Strumento per creare un modulo di consenso informato: DARIAH ELDAH - CONSENT FORM WIZARD (https://www.oeaw.ac.at/acdh/tools/consent-form-wizard/)

Strumento per anonimizzare o pseudo anonimizzare i dati: Amnesia, in OpenAIRE (https://amnesia.openaire.eu/)

Strumenti per calcolare l’impatto dei dati: DataCite (https://datacite.org/). 

Riferimenti e risorse per il training:

Video (https://www.sas.ac.uk/videos-and-podcasts/research-training/matthew-davies-why-data-management-important-historians ) di un ricercatore dell’Università di Londra che racconta perché per lui è stato importante gestire bene i dati: risparmio di tempo, maggiore efficienza, risparmio di costi, ecc.

Check list per una buona progettazione dei dati https://zenodo.org/record/3819204#.YMDOWvkzY2w, in Zenodo, dal sito TU Delft della Dleft University of Technology. I ricercatori sono abituati a pensare ai dati solo in termini di pubblicazione finale; questa check list li stimola a pensare ai diversi set di dati che vengono raccolti e gestiti durante tutto il processo di ricerca.

Corso sulla gestione dei dati, gratuito (da pagare soltanto, se si desidera, la certificazione finale): Essentials 4 Data Support (https://researchdata.nl/en/services/cursus/) ; link direttohttps://datasupport.researchdata.nl/en/. Tutto il materiale è scaricabile.

The Turing way contiene il capitolo sulla gestione dei dati della ricerca (https://the-turing-way.netlify.app/reproducible-research/rdm.html)

Corso online sulla gestione dei dati, “Mantra” dell’Università di Edimburgo (https://mantra.edina.ac.uk/)

Corso online sulla gestione dei dati, UK Data Service,https://www.ukdataservice.ac.uk/manage-data/training.aspx

Video: 23 Things Revisited Field Guides to Research Data Management (https://www.rd-alliance.org/23-things-revisited-field-guides-research-data-management-0)

Articolo “Support Your Data: A Research Data Management Guide for Researchers” (https://doi.org/10.3897/rio.4.e26439) con una interessante tabella guida per le diverse fasi del progetto e gli obiettivi prefissati.

Corso di gestione dei dati della ricerca per l’ambito delle scienze umane “Manage improve and open up your research data” (https://training.parthenos-project.eu/sample-page/manage-improve-and-open-up-your-research-and-data/)

Libro sulla gestione dei dati della ricerca nell’ambito delle scienze umane: “Digital Technology and the Practices of Humanities Research” (https://library.oapen.org/handle/20.500.12657/22813


Tratto dal materiale del corso della dott.ssa Elena Giglia “Open Science dalla A alla Z” (DOI: 10.5281/zenodo.3908317)

Un Electronic Lab Notebook (o ELN o digital lab notebook) è un software progettato per supportare gli scienziati nella gestione della documentazione e nella condivisione delle informazioni di progetto, per garantire la riproducibilità della ricerca.

Tra le funzionalità offerte dagli ELN:

  • Editor di testo per scrivere note  e appunti

  • Fogli elettronici per il calcolo e la formattazione di tabelle e grafici

  • Modelli per la documentazione di procedure e protocolli

  • Inventari di laboratorio per la documentazione di campioni, reagenti e apparecchiature

  • Strumenti di collaborazione per la condivisione di informazioni sperimentali

Un elenco di Electronic Lab Notebook, sia open source che a pagamento, è consultabile alla pagina Wikipedia List of electronic laboratory notebook software packages.


Horizon Europe richiede una gestione responsabile dei dati secondo i principi FAIR. Tali principi sono stati codificati con lo scopo di aiutare a definire dei dati che possano essere resi disponibili ai ricercatori e ai cittadini “as open as possible, as closed as necessary”. Attuando una gestione dei dati che aderisca a tali principi, è possibile renderli aperti nella maggior parte dei casi, non accessibili solo in casi particolari (ad esempio sicurezza o privacy), ma nel secondo caso comunque è possibile rendere nota la struttura dei dati (non i contenuti) e la metodologia di raccolta ed elaborazione. 


I principi FAIR sono i seguenti:

Findable

The first step in (re)using data is to find them. Metadata and data should be easy to find for both humans and computers. Machine-readable metadata are essential for automatic discovery of datasets and services, so this is an essential component of the FAIRification process.

F1. (Meta)data are assigned a globally unique and persistent identifier

F2. Data are described with rich metadata (defined by R1 below)

F3. Metadata clearly and explicitly include the identifier of the data they describe

F4. (Meta)data are registered or indexed in a searchable resource

Trovabile

Il primo passo per (ri)utilizzare i dati è trovarli. Metadati e dati dovrebbero essere facili da trovare sia per gli esseri umani che per i computer. I metadati leggibili dalla macchina sono essenziali per il rilevamento automatico di set di dati e servizi, quindi questo è un componente essenziale del processo di FAIRification.

F1. Ai (meta)dati viene assegnato un identificatore globale unico e persistente

F2. I dati sono descritti con metadati avanzati (definiti da R1 di seguito)

F3. I metadati includono in modo chiaro ed esplicito l'identificatore dei dati che descrivono

F4. I (meta)dati sono registrati o indicizzati in una risorsa ricercabile

Bisogna utilizzare metadati e specificare gli eventuali standard in uso per i dati (ne esistono alcuni per disciplina, che aiutano a descrivere specifici materiali) o, in alternativa, descrivere i tipi di dati creati e come; la creazione di parole chiave può aiutare maggiormente nella ricerca dei dati; è indispensabile l’utilizzo di convenzioni per la nomenclatura dei dati e dei file, che includa un sistema versioning. Tra i metadati deve essere presente un identificativo unico e persistente dei dati (ad esempio il DOI viene utilizzato in DataCite e Zenodo).

Per essere reperibili, i dati devono essere conservati per almeno 10 anni in un archivio che garantisca una conservazione a lungo termine, come ad esempio Zenodo, l’archivio del CERN di Ginevra accessibile a tutti. Archivi disciplinari

possono essere trovati su Re3data-Registry of data repositories, mentre su FAIR

sharing sono presenti anche standards e policies. Dataverse, Protocols.io e Figshareconsentono di creare gruppi di ricerca per la condivisione di dati, in modalità “social”.

 

Accessible

Once the user finds the required data, she/he/they need to know how can they be accessed, possibly including authentication and authorisation.

A1. (Meta)data are retrievable by their identifier using a standardised communications protocol

A1.1 The protocol is open, free, and universally implementable

A1.2 The protocol allows for an authentication and authorisation procedure, where necessary

A2. Metadata are accessible, even when the data are no longer available

Accessibile

Una volta che l'utente ha trovato i dati richiesti, deve sapere come è possibile accedervi, includendo eventualmente l'autenticazione e l'autorizzazione.

A1. I (meta)dati sono recuperabili dal loro identificatore utilizzando un protocollo di comunicazione standardizzato

A1.1 Il protocollo è aperto, gratuito e universalmente implementabile

A1.2 Il protocollo prevede una procedura di autenticazione e autorizzazione, ove necessaria

A2. I metadati sono accessibili, anche quando i dati non sono più disponibili

Quando l’utente ha trovato i dati cercati, è necessario che sappia come accedervi: quindi devono essere resi noti protocolli, standard, formati ed eventuali software per leggerli, modalità di autenticazione ed autorizzazione.

N.B. Accessible e open non sono necessariamente sinonimi: l’importante è sapere dove sono disponibili i dati e a quali condizioni. Possono essere esposti in modalità open anche soltanto i metadati.

 

Interoperable

The data usually need to be integrated with other data. In addition, the data need to interoperate with applications or workflows for analysis, storage, and processing.

I1. (Meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation.

I2. (Meta)data use vocabularies that follow FAIR principles

I3. (Meta)data include qualified references to other (meta)data

Interoperabile

I dati di solito devono essere integrati con altri dati. Inoltre, i dati devono interagire con applicazioni o flussi di lavoro per l'analisi, l'archiviazione e l'elaborazione.

I1. I (meta)dati utilizzano un linguaggio formale, accessibile, condiviso e ampiamente applicabile per la rappresentazione della conoscenza.

I2. I (meta)dati utilizzano vocabolari che seguono i principi FAIR

I3. I (meta)dati includono riferimenti qualificati ad altri (meta)dati

L’interoperabilità dei dati mira a garantire lo scambio e il riutilizzo dei dati tra ricercatori e istituzioni di tutto il mondo. Essi devono dunque essere codificati utilizzando formati e vocabolari aderenti a standard ampiamente utilizzati nel settore disciplinare di riferimento. 

 

Reusable

The ultimate goal of FAIR is to optimise the reuse of data. To achieve this, metadata and data should be well-described so that they can be replicated and/or combined in different settings.

R1. (Meta)data are richly described with a plurality of accurate and relevant attributes

R1.1. (Meta)data are released with a clear and accessible data usage license

R1.2. (Meta)data are associated with detailed provenance

R1.3. (Meta)data meet domain-relevant community standards

The principles refer to three types of entities: data (or any digital object), metadata (information about that digital object), and infrastructure. For instance, principle F4 defines that both metadata and data are registered or indexed in a searchable resource (the infrastructure component).

Riutilizzabile

L'obiettivo finale di FAIR è ottimizzare il riutilizzo dei dati. Per ottenere ciò, i metadati e i dati dovrebbero essere ben descritti in modo che possano essere replicati e/o combinati in contesti diversi.

R1. I (meta)dati sono riccamente descritti con una pluralità di attributi accurati e rilevanti

R1.1. I (meta)dati vengono rilasciati con una licenza di utilizzo dei dati chiara e accessibile

R1.2. I (meta)dati sono associati alla provenienza dettagliata

R1.3. I (meta)dati soddisfano gli standard della comunità rilevanti per il dominio

I principi si riferiscono a tre tipi di entità: dati (o qualsiasi oggetto digitale), metadati (informazioni su quell'oggetto digitale) e infrastruttura. Ad esempio, il principio F4 definisce che sia i metadati che i dati sono registrati o indicizzati in una risorsa ricercabile (il componente dell'infrastruttura).

Poichè il fine ultimo dei principi FAIR è quello di permettere il più ampio riutilizzo dei dati della ricerca, è necessaria una accurata descrizione dei dati e degli eventuali standards legati ai metadati, che comprenda anche i termini di utilizzo. I dati e i relativi metadati devono essere corredati da una licenza, con la citazione della fonte dei dati o delle modalità di raccolta. Ad esempio, se i dati sono di proprietà di terze parti, o coperti da segreto militare, o soggetti a vincoli di privacy, è necessario dichiararlo.


Non gestire i dati secondo i principi FAIR rappresenta un costo per l’economia pubblica, come descritto nel report della Commissione Europea “Cost of not having FAIR research data” (https://op.europa.eu/s/smTL).


Se i dati della ricerca e la loro gestione vengono progettati sin dall'inizio del progetto in conformità con i principi FAIR, essi potranno quasi sicuramente essere resi open, ad eccezione dei soli casi in cui vincoli di sicurezza o legali lo impediscano.

I dati possono comunque essere resi FAIR con l’aiuto di numerosi strumenti, questionari, guide, software di test, che aiutino il gruppo di ricerca a riorganizzare i dati perché possano essere resi conformi ai principi FAIR.

Nello stesso giorno in cui è stato lanciato EOSC è stato pubblicato a Vienna il documento Turning FAIR into reality, una pubblicazione del Publications Office of the EU (https://op.europa.eu/en/publication-detail/-/publication/7769a148-f1f6-11e8-9982-01aa75ed71a1). 

All’interno di EOSC alla fine del 2020 è stato pubblicato il report Six Recommendations for Implementation of FAIR Practice https://op.europa.eu/en/publication-detail/-/publication/4630fa57-1348-11eb-9a54-01aa75ed71a1, doi 10.2777/986252. In questo documento si raccomanda di formare i ricercatori sul tema e di incentivare l’adozione dei principi FAIR; per arrivare a ciò sarà necessario a breve cambiare le regole per la valutazione della ricerca.

Allo scopo di capire quali sono i compiti dei diversi attori del processo di ricerca (ricercatori, bibliotecari, repository, ecc.) è molto utile una tabella creata da bibliotecari svizzeri, Explanation of the FAIR data principles Wilkinson et al. (2016), The FAIR Guiding Principles for scientific data management and stewardship, Scientific Data 3, doi:10.1038/sdata.2016.18, in cui viene accostato, ad ogni principio FAIR, il lavoro svolto dal ricercatore e dal repository (tramite la tecnologia e il lavoro dei bibliotecari).

Dal punto di vista tecnico, per passare all’implementazione dei principi FAIR, le singole comunità di ricerca potrebbero fare dei workshop per decidere quali sono i metadati da utilizzare nell’ambito delle diverse discipline, creare i FAIR implementation profiles per creare successivamente i FAIR data points.

Questi ultimi rappresentano l’attuazione dei dati FAIR, che saranno conformi al GDPR nella misura in cui saranno depositati e saranno anche visitabili da virtual machines, grazie al fatto che sono findable e readable. Ad esempio VODAN (https://www.go-fair.org/implementation-networks/overview/vodan/) è un implementation network che si è occupato dei dati del COVID. In Africa, in collaborazione con l’Università di Leiden, sono stati impiantati due FAIR data point; OAI 12 - The Geneva Workshop on Innovations in Scholarly Communication (https://oai.events//) si è tenuto in modalità virtuale dal 6 al 10 settembre 2021 con una sezione specifica sui dati FAIR. 

I dati sono tutto ciò che viene raccolto, generato e utilizzato nel processo di ricerca. Per open data si intendono dunque non soltanto i dati necessari per validare i risultati presentati nella pubblicazione scientifica, ma anche i metadati associati, cioè le informazioni che descrivono i dati della ricerca depositati, ma anche ogni altro dato (anche quelli non processati, ad esempio i dati raccolti per costruire i campioni) e relativi metadati che sono stati trattati nel corso del progetto. 

In Horizon 2020 i beneficiari devono depositare i propri dati in un repository secondo il principio “as far as possible as closed as necessary”: i dati devono essere resi disponibili per il riuso e devono quindi essere resi aperti, a meno che non ci siano vincoli particolari per motivi di riservatezza (dati sensibili, dati militari, brevetti, ecc.).

L’obiettivo del movimento open science è quello di renderli aperti e riutilizzabili. Il loro riuso crea nuovo valore.


Il data mangement plan (DMP), oltre ad essere un deliverable (cioè un prodotto, un documento o altro, che deve essere consegnato al committente e all’ente finanziatore come evidenza delle attività svolte) di progetto in casi di finanziamenti ottenuti con Horizon Europe, è uno strumento di lavoro che aiuta il ricercatore a focalizzare alcune fasi importanti della sua ricerca, con particolare riferimento alla gestione dei dati. Con il DMP il focus del ricercatore si sposta dalla pubblicazione finale (anch’essa importante) alla gestione del progetto di ricerca e dei dati trattati. Infatti si tratta di un documento vivo, che in Horizon Europe deve essere aggiornato ogni volta che è necessario (in Horizon 2020 erano previsti tre momenti di aggiornamento del documento), contiene la codifica di tutte le regole stabilite per la gestione dei dati e dei documenti di progetto, oltre che le motivazioni che porteranno a rendere aperti o no i dati della ricerca (as open as possibile, as closed as necessary).

Il DMP deve essere specifico per l’argomento trattato dal progetto di ricerca, sintetico e schematico, perché siano facilmente utilizzabili le istruzioni per l’utilizzo dei dati trattati. Non bisogna inserire informazioni generiche e vaghe, ma informazioni specifiche sul progetto in corso, con dati reali e riscontrabili, perché sia realmente uno strumento di lavoro prima di tutto per il gruppo di progetto, poi per chi volesse riutilizzare i dati per altri progetti. La precisione sui dati trattati è fondamentale anche per una valutazione dei costi inerenti la gestione dei dati (infatti anche il deposito su piattaforme libere come Zenodo potrebbe comportare dei costi a seconda della quantità di GB occupati, oppure potrebbe essere necessario avvalersi di un data steward, che comporterebbe costi di personale). E’ molto importante effettuare queste stime in quanto molte voci di costo derivate dalla gestione dei dati e dall’assunzione dell’apposito personale sono rendicontabili, ma per esserlo devono essere previste e dichiarate fin dall’inizio del progetto. Inoltre è fondamentale dichiarare regole e attività effettivamente svolte, in quanto potrebbero essere oggetto di verifiche da parte dell’ente finanziatore, oppure dichiarare che alcune regole non sono ancora state definite per mancanza di informazioni in merito, dimostrando di avere sotto controllo tutti gli aspetti del problema.

E' possibile ritrovare alcuni consigli in merito nella scheda Tips for writing a data management plan (https://www.lcrdm.nl/files/lcrdm/2019-04/LCRDM%2010%20tips%20for%20writing%20a%20DMP%20no%20branding.pdf) sul sito olandese Research Data Management National Coordination Point.


Per la compilazione di un Data Management Plan (o DMP), è importante e molto utile la guida di Science Europe Practical Guide to the International Alignment of Research Data Management - Extended Edition (https://scienceeurope.org/our-resources/practical-guide-to-the-international-alignment-of-research-data-management/, DOI:10.5281/zenodo.4915861).

All’interno vengono evidenziate le sezioni minime che devono essere sviluppate nella redazione del DMP: 

  • la descrizione dei dati e collezioni o il riuso di dati esistenti; 
  • la documentazione che verrà redatta per accompagnare i dati e il tipo di controllo di qualità verrà effettuato sui dati; dove verranno immagazzinati i dati e le relative politiche di backup; 
  • aspetti etici e legali sui dati, come ad esempio quelli legati al rispetto della legislazione sulla privacy e sul copyright; 
  • modalità di condivisione dei dati e conservazione a lungo termine; 
  • definizione di ruoli e responsabilità nella gestione dei dati, con le relative risorse necessarie.

All’interno della stessa guida, è molto utile la sezione Translating the core requirements into a DMP template, con una serie di domande che stimolano nella redazione dei contenuti del DMP.

Altre domande guida utili per la redazione del DMP si possono ritrovare nel sito CESSDA, nella pubblicazione Adapt your Data Management Plan - A list of Data Management Questions based on the Expert Tour Guide on Data Management (https://www.cessda.eu/content/download/4302/48656/file/TTT_DO_DMPExpertGuide_v1.2.pdf).

In rete sono disponibili dei wizard per la composizione del DMP, ad esempio DMP Online oppure Data Stewardship wizard.

IlDMP Online (https://dmponline.dcc.ac.uk/) è un software open source ed è personalizzabile. Ad esempio sarebbe possibile precompilare alcune sezioni come il codice etico o altre politiche di Ateneo che valgono per tutti i progetti di ricerca. Offre una dashboard che consente di conservare i propri documenti.

Nella sezione OA@UniTO dell’Università di Torino dal titolo “Come scrivere un Data Management Plan”, sono presenti due video della dott.ssa Elena Giglia: il primo spiega come utilizzare il DMP Online e il secondo spiega l'utilizzo del Data Stewardship Wizard (https://ds-wizard.org/).

Nel DMP online, la prima sezione è quella dei dati dell’ente, con funzionalità di collegamento a codifiche internazionali, come ad esempio l’ORCID del principal investigator, il grant number, l’acronimo del progetto, ecc.. Si possono utilizzare dei modelli preconfezionati, ad esempio quello della Commissione Europea per Horizon 2020 (in questo caso sono disponibili nelle 3 versioni previste, iniziale, intermedia e finale, con relativa guida contestuale) o Science Europe. Il wizard è predisposto per il lavoro di gruppo, mediante condivisione con altri utenti, e consente di effettuare il download del documento compilato. I campi da compilare sono corredati da help contestuale.

Cliccando su “Create plan” si avvia la compilazione di campi, mediante la guida di domande mirate e di un help contestuale, con un text editor che consente la formattazione delle risposte e una colonna di destra che fornisce continuamente suggerimenti e link a strumenti utili. Ad esempio il wizard guida l’utente nella compilazione di tutte le parti che garantiranno che i dati rispondano ai requisiti FAIR: sul requisito Findable suggerisce il link alla Metadata Standards Directory del sito Research Data Alliance, sul requisito Accessible ricorda che i dati devono essere “as open as possible, as closed as necessary”; nel caso del template basato su Horizon 2020 ricorda che è stato sottoscritto un Grant Agreement che richiede che i dati e i risultati della ricerca siano open o che bisogna addurre un valido motivo perché essi rimangano chiusi.

Il wizard comprende anche la parte di allocazione della risorse (sia in termini di risorse finanziarie che di risorse umane), ricordando di inserire tutte le voci di costo che sono poi rimborsabili da parte dell’ente finanziatore; la parte relativa alla sicurezza dei dati, che potrebbe essere precompilata nel caso in cui l’Ateneo avesse già predisposto delle procedure standard in merito. Nella parte che riguarda aspetti etici e legali sui dati si possono indicare eventuali riferimenti a vincoli imposti dal GDPR ed eventuali consensi informati necessari per poter trattare i dati.

Al termine della composizione del DMP online è possibile scaricare un file con le formattazioni di massima impostate con il wizard, in formato html, pdf, txt, csv, ecc.

In Horizon Europe il DMP va presentato entro il 6° mese dall’approvazione del progetto, ma anche nella proposta di progetto deve essere inserita una pagina in cui si dichiarerà schematicamente come verranno trattati i dati nel progetto, e che quindi sarà uno degli elementi di valutazione del progetto presentato per il finanziamento.

Di seguito vengono elencate numerose risorse da consultare:

Nel documento Strategic Research and Innovation Agenda (SRIA) - EOSC (EOSC-SRIA-V1.0_15Feb2021.pdf,https://eosc.eu/sites/default/files/EOSC-SRIA-V1.0_15Feb2021.pdf), la presenza della figura del data steward, nelle organizzazioni che si occupano di ricerca, viene menzionata tra i fattori critici di successo per la realizzazione degli obiettivi. Il data steward è una figura professionale specializzata nell’implementazione delle politiche open access, linee guida e programmi di realizzazione, a supporto dell’intero processo di ricerca, realizzando pienamente gli obiettivi di EOSC ([…]the European Open Science Cloud is a process, not a project[…], in The Vienna Declaration on the European Open Science Cloud,https://eosc-launch.eu/declaration/).

Il profilo del data steward presuppone una competenza di dominio sui dati (ad esempio le caratteristiche dei reperti archeologici, le caratteristiche dei dati diagnostici effettuati con determinati macchinari, ecc.) e delle competenze tecniche per il trattamento dei dati della ricerca, secondo i principi FAIR.

La figura del data steward può essere declinata in modi diversi: tecnico, sviluppatore, agente del cambiamento (https://findresearcher.sdu.dk:8443/ws/portalfiles/portal/160501865/National_Coordination_of_Data_Steward_Education_in_Denmark_Final_report_to_the_National_Forum_for_Research_Data_Management_DM_Forum_Results_and_recommendations_Janua_002_.pdf).

Un’altra interpretazione della figura del data steward può essere consultata sul sito https://www.itware.com/blog-itware/big-data-analytics-data-management/item/1311-data-steward-per-mestiere-piu-semplice-che-data-analyst-piu-di-valore-per-l-impresa.

Sul sito olandese dell’Università TUDelft (https://www.tudelft.nl/en/) è presente una intera sezione sull’open science (https://www.tudelft.nl/en/open-science) . Nella sottosezione dedicata al Research Data Management (https://www.tudelft.nl/en/library/research-data-management) sono presenti diversi spunti per la gestione delle attività legate ai dati della ricerca.

Tra le attività che possono garantire una buona gestione dei dati del progetto, i data stewart possono offrire:

• Attuazione della policy di Ateneo per la gestione dei dati e delle eventuali policy specifiche adottate dai Dipartimenti, in aderenza alle buone prassi legate alle specificità del dominio dei dati di un particolare settore disciplinare

• Attuazione delle policy sui dati come richieste dagli enti finanziatori (interessante una pagina del sito TUDelft con l’elenco aggiornato dei maggiori enti europei e della relativa documentazione https://www.tudelft.nl/en/library/research-data-management/r/policies/funders-policies 

• Impostazione dell'archiviazione sicura dei dati

• Consigli su buone pratiche di gestione dei dati

• Informazioni sull'archiviazione dei dati

• Suggerimenti per aumentare l'impatto con la condivisione dei dati

• Preparazione di piani di gestione dei dati

• Eventuali altre attività legate alla gestione dei dati


I costi sono un capitolo fondamentale del Data Management Plan, perché è proprio in questo documento che viene fatta la pianificazione di costi e risorse (https://www.openaire.eu/what-will-it-cost-to-manage-and-share-my-data).

Un interessante articolo su openAIRE, “How to identify and assess Research Data Management (RDM) costs” (https://www.openaire.eu/how-to-comply-to-h2020-mandates-rdm-costs), consente di valutare i costi del proprio progetto utilizzando lo strumento Estimating costs RDM tool (https://www.openaire.eu/how-to-comply-to-h2020-mandates-rdm-costs). Il tool pone delle domande dettagliate.

Un tool più completo è il data wizard, Data Management Costing Tool (https://zingtree.com/host.php?style=buttons&tree_id=511095771&persist_names=Restart&persist_node_ids=1&start_node=1&start_tree=511095771)

Un altro tool che puo essere utilizzato è il Data Wizard DSW Storage Costs Evaluator (https://storage-costs-evaluator.ds-wizard.org/


Prima di procedere alla pubblicazione dei dati del proprio progetto di ricerca, bisogna effettuare una serie di controlli:

  • verificare sull’eventuale presenza di dati personali o sensibili: in questo caso bisogna provvedere alla anonimizzazione, con strumenti come ad esempio Amnesia

  • verificare con l’editore la politica di disponibilità dei dati a corredo dell’articolo scientifico che si sta pubblicando

  • per garantire che i dati siano reperibili (findable), assicurarsi che i dati siano dotati di un identificativo persistente (es. DOI)

  • assicurarsi che i dati espongano un “data access statement”, cioè che, oltre all’identificatore persistente, siano accompagnati da informazioni che descrivano i dati, le modalità di accesso ed eventuali vincoli per il loro utilizzo (es. file README)

  • assicurarsi che i dati espongano una licenza di utilizzo per l’utente finale. Per i dati è possibile scegliere tra innumerevoli tipi di licenze, che devono essere standard (cfr. http://opendefinition.org/licenses/) per poter essere chiaramente comprese dall’utente finale e rendere i dati reusable, sempre nell’ottica dei principi FAIR. Nel caso di software è possibile consultare questo elenco di licenze possibili

  • esporre i dati in un formato di file aperto e standard, per assicurarsi, in conformità ai principi FAIR, che siano reusable e interoperable. Molti data repository espongono la lista dei formati di file consigliati/preferiti a seconda della tipologia di oggetti archiviati (immagini, testi, database, audio, video, ecc.). Oltre ai formati semplici più diffusi, un particolare formato di dati utilizzato nel campo della ricerca scientifica è NetCDF (Network Common Data Form), un formato auto descrittivo che include anche metadati generici e specifici machine-readable; questo formato può essere utilizzato in modo avanzato con server che implementano il protocollo OPeNDAP (Open-source Project for a Network Data Access Protocol); con questo protocollo, infatti, la lettura di dataset e subset nei file può essere eseguita senza che sia necessario scaricare l’intero set di dati, si possono effettuare aggregazioni di dataset e subset in un dataset virtuale e si possono effettuare elaborazioni via software accedendo direttamente ai dataset. 

Riferimenti (sito TU Delft):


Come descritto nel sito OpenAIRE (How to find a trustworthy repository for your data), tutti i progetti Horizon 2020 partecipano automaticamente all’Open Research Data Pilot e sono obbligati a depositare prima possibile in un research data repository tutti i dati necessari a validare i risultati delle ricerche presentati nelle pubblicazioni scientifiche, corredati degli opportuni metadati ed altri dati trattati nel progetto di ricerca (es. dati grezzi), come dichiarato nel Data Management Plan, sempre corredati dai metadati. Inoltre nello stesso data repository per il progetto di ricerca è necessario depositare le informazioni sui software utilizzati per il trattamento di tali dati e, possibilmente, dare la possibilità di utilizzare il software.

La Comunità Europea preferisce l’utilizzo di data repositories certificati. Infatti nel documento Guidelines on FAIR Data Management in Horizon 2020 la Commissione Europea chiede di dichiarare dove verranno depositati i dati, i metadati, la documentazione e il codice, e chiede di preferire degli archivi di dati certificati e aperti.

I ricercatori possono contare su diversi tipi di certificazioni standard a livello internazionale dedicate agli archivi digitali. In ambito europeo, le certificazioni disponibili sono:

  • CoreTrustSeal (CTS): basata sulData Seal of Approval (DSA) e sulWorld Data System (WDS) van ICSU. La lista degli archivi in possesso di tale certificazione può essere consultata all’URLhttps://www.coretrustseal.org/why-certification/certified-repositories/. Gli archivi digitali italiani certificati sono due, Phaidra dell’Università di Padova (basato sul software Fedora, è la piattaforma del Sistema Bibliotecario di Ateneo per l’archiviazione a lungo termine di oggetti e collezioni digitali. La piattaforma è multidisciplinare e ospita oggetti digitali di diverso genere, quali immagini, documenti di testo, libri e video, per lo più derivanti da digitalizzazioni di originali analogici) e ILC4CLARIN (basato sul software DSPACE e contenente specificatamente datasets) del CNR di Pisa.
  • Nestor Seal: principalmente per la Germania, in conformità con lo standard DIN 31644
  • La certificazione ISO 16363 (ad oggi non ancora utilizzata in Europa e in Italia)

Sono disponibili anche altri data repositories con un lunga e solida presenza, come ad esempio Zenodo, che non è certificato, ma è considerato trusted da OpenAIRE. Altri esempi di repositories possono essere ritrovati in OpenDOAR, la Directory of Open Access Repositories. Si prevede che questi archivi faranno domanda per la certificazione nel prossimo futuro, perché l'organizzazione dei finanziamenti alla ricerca e delle organizzazioni di ricerca in Europa (Science Europe) sta sviluppando criteri per la selezione di archivi affidabili. Questi criteri conterranno una raccomandazione che gli archivi che non sono ancora certificati richiedono la certificazione da tale organismo.

Durante lo svolgimento dei progetti è necessario gestire i dati e la documentazione secondo gli standard e le buone pratiche in uso nella propria disciplina, anche quelli che non possono essere resi disponibili ad accesso aperto. Per una maggiore consapevolezza sulle attività da svolgere per una buona gestione dei dati, può essere utile la lettura dell’OpenAIRE RDM handbook.

Ai dati depositati deve essere attribuito un identificativo unico (persistent identifier o anche PID), ad esempio ilDOI. Inoltre è molto importante che al dataset venga attribuita una licenza d’uso, che possa dire a chi vuole riutilizzare i dati cosa può o non può fare con essi. Ad esempio OpenAIRE raccomanda l’adozione della licenza Creative Commons CC0CC-BY, a meno che non ci siano limitazioni particolari, ad esempio in caso di dati sensibili o di dati coperti da segreto militare. L’EUDAT License Selector è un wizard che può aiutare nella scelta della licenza. In genere, nel caso di data repository certificati, viene offerto anche il servizio di attribuzione di un identificativo unico persistente e della licenza d’uso.

In merito alla scelta di un preciso data repository, è possibile scegliere tra un archivio disciplinare, un archivio istituzionale (se la propria istituzione ne offre uno in cui venga garantita la conservazione a lungo termine), depositare nell’archivio generalista Zenodo gestito dal CERN, oppure ricercarne uno adatto tramite il portale re3data.org, che offre la possibilità di applicare il filtro per archivio certificato, al contrario di OpenDOAR.

Altre caratteristiche ricercabili nella scelta del data repository sono il supporto per una gestione dei formati standard per dati e metadati, per la gestione dei dati sensibili, ad esempio mediante l’integrazione con strumenti automatici di anonimizzazione (come ad esempio Amnesia), per l’attribuzione delle licenze d’uso. I repository certificati impongono regole più stringenti a chi deposita, proprio perché i requisiti per la certificazione prevedono l’adesione ai principi FAIR di gestione dei dati, secondo il principio dettato dalla Commissione Europea “FAIR data in trustworthy repositories”.

I principali requisiti per la certificazione di un data repository sono (traduzione dalla pagina https://www.openaire.eu/find-trustworthy-data-repository del sito OpenAIRE, sezione WHAT ARE THESE REPOSITORY CERTIFICATIONS BASED ON?):

Requisito 2 (R2): il repository mantiene tutte le licenze applicabili relative all'accesso e all'utilizzo dei dati e ne monitora la conformità.

R3: Il repository ha un piano di continuità per garantire l'accesso continuo e la conservazione delle sue proprietà.

R4: Il repository garantisce, per quanto possibile, che i dati siano creati, curati, consultati e utilizzati nel rispetto delle norme disciplinari ed etiche.

R7: Il repository garantisce l'integrità e l'autenticità dei dati.

R8: Il repository accetta dati e metadati in base a criteri definiti per garantire la pertinenza e la comprensibilità dei dati per gli utenti.

R10: Il repository si assume la responsabilità della conservazione a lungo termine e gestisce questa funzione in modo pianificato e documentato.

R11: L'archivio dispone di competenze adeguate per affrontare i dati tecnici e la qualità dei metadati e garantisce che siano disponibili informazioni sufficienti per consentire agli utenti finali di effettuare valutazioni relative alla qualità.

R13: Il repository consente agli utenti di scoprire i dati e fare riferimento ad essi in modo persistente attraverso un'apposita citazione.

R14: Il repository consente il riutilizzo dei dati nel tempo, garantendo la disponibilità di metadati appropriati per supportare la comprensione e l'utilizzo dei dati.

Anche se Zenodo non può garantire sulla qualità dei dati, sul fatto che essi possano essere considerati FAIR e su tutte le procedure di gestione che è necessario mettere in campo per garantire un processo di validazione sul fronte della aderenza allo standard dei formati di dati e metadati, sulla cura dei metadati, su criteri di pertinenza e comprensibilità, sulla pertinenza delle licenze d’uso, ecc., di contro può fornire una soluzione immediata al deposito dei dati del proprio progetto di ricerca, in quanto è considerato “trusted” da OpenAIRE (Non ha la certificazione Core Trust Seal ma è considerato “trusted” da OpenAIRE (“Why use Zenodo? Safe — your research is stored safely for the future in CERN’s Data Centre for as long as CERN exists.” In home page).

Il diritto d’autore è previsto nel caso in cui ci sia una rielaborazione creativa dei dati (vedi FAQ “Cosa vuol dire Sui Generis Database Right (SGDR)?”. Sui dati grezzi, cioè i dati raccolti in quanto tali, senza alcuna rielaborazione, il ricercatore non ha alcun diritto d’autore. 

Per rendere riusabili i propri dati è necessario esporre le licenze d’uso ad essi relative.  

Per quanto detto sopra, l’unica licenza legalmente corretta per il dati è la CC0, come riportato nelFact Sheet on Creative Commons & Open Science (https://zenodo.org/record/840652#.YNsoYagzY2w)..E’ sempre opportuno citare la fonte (credits). 

In caso di partner stranieri nel progetto, è opportuno chiarire se ci sono obblighi di legge o regolamenti da rispettare, oppure se il dataset è di proprietà di qualche istituzione. A questo proposito è interessante consultare, sul sito CESSDA Training, una pagina con unapanoramica sulla legislazione in materia di copyright in diversi paesi europei (https://www.cessda.eu/Training/Training-Resources/Library/Data-Management-Expert-Guide/5.-Protect/Copyright/Diversity-in-copyright), tratta dalla guidaData Magement Expert Guide (https://www.cessda.eu/Training/Training-Resources/Library/Data-Management-Expert-Guide). Nell’ambito dell’organizzazione di progetto è importante stabilire i ruoli nella gestione dei dati (storage, conservazione, backup, ecc.). E’ anche molto importante stabilire chi potrà sfruttare i dati, anche in ottemperanza a requisiti di Horizon Europe, che alla fine del progetto prevede tra i deliverable l’emissione di una “Right ownership list”.

Riguardo al diritto d’autore nel caso di software, potrebbe essere necessario applicare delle restrizioni in caso di possibile uso militare, o a problemi di privacy (ad esempio profilazione degli utenti, sottoposta a limitazioni dal GDPR). Sulle problematiche di Software Licencing è utile la lettura del volume Software Licensing & Data Governance - Tutelare e gestire le creazioni tecnologiche, di Simone Aliprandi, Apogeo. Per attribuire la licenza al proprio software è molto utile un wizard, sul sito OSSWATCH, ilLicence Differentiator (http://oss-watch.ac.uk/apps/licdiff/) che aiuta il ricercatore a trovare la licenza più adatta nell’ambito del progetto di ricerca.

Come riferimento sul diritto d’autore riguardo ai dati, possono essere utili due webinar sul sito OpenAIRE:

·       Aspetti legali dei dati della ricerca (https://www.openaire.eu/item/aspetti-legali-dei-dati-della-ricerca);

·       Supporting researchers on the reuse of data: legal aspects to consider (https://www.openaire.eu/item/openaire-legal-policy-webinars);

due volumi di Simone Aliprandi

·       Software Licensing & Data Governance - Tutelare e gestire le creazioni tecnologiche, di Simone Aliprandi, APOGEO Online;

·       Creative Commons: manuale operativo - Guida all’uso delle licenze e degli altri strumenti CC, Casa editrice: SUM edizioni, Data di pubblicazione: 2013 (ottobre), ISBN: 9788890691324, Licenza: Creative Commons by-nc-sa 2.5 Italia (permalink: https://aliprandi.org/books/manuale-cc/)

tre guide sul sito OpenAIRE, a cura di Thomas Margoni:

How do I know if my research data is protected? (https://www.openaire.eu/how-do-i-know-if-my-research-data-is-protected);

How do I license my research data? (https://www.openaire.eu/how-do-i-license-my-research-data);

Can I reuse someone else’s research data? (https://www.openaire.eu/can-i-reuse-someone-else-research-data)

e inoltre il volume

Paolo Guarda, Il regime giuridico dei dati della ricerca scientifica,

Editoriale scientifica, 2021, disponibile in Open Access qui: 

https://iris.unitn.it/handle/11572/315657#.YT8lzNMza3I

 

I dati grezzi sono i dati raccolti nell’ambito di un progetto di ricerca: essi possono essere misurazioni, immagini, file o altri oggetti cartacei o informatici. 

Quando questi dati vengono classificati, catalogati, arricchiti con altre informazioni descrittive (metadati) e vengono elaborati per ottenere delle informazioni, allora si ottiene un database, cioè una raccolta sistematica di informazioni, organizzate applicando particolari metodi. 

Sui dati grezzi non è possibile reclamare alcun diritto d’autore. 

Nel caso in cui ci sia una rielaborazione creativa dei dati, e quindi si abbia un database, può essere applicata la direttiva sui generis (Sui Generis Database Right o SGDR). Il diritto sui generis protegge lo sforzo impiegato nell’organizzazione dei dati, e quindi in questo caso viene detenuto dall’istituzione che ha finanziato il progetto di ricerca. 

Se il database contiene anche una parte creativa, ad esempio un’edizione critica, allora interviene il diritto d'autore, che in questo caso protegge la struttura del database, cioè la parte creativa, ma non i dati di partenza.

Il titolare del SGDR è chi ha creato la struttura del database, tipicamente l’ente che sostiene il rischio finanziario del progetto di ricerca, oppure può essere il singolo ricercatore.

Il SGDR, che solitamente ha una durata di 15 anni, attribuisce al titolare del diritto il diritto di eseguire o autorizzare l'estrazione (copia) di una quantità sostanziale di dati, o l'estrazione ripetuta di quantità non sostanziale, e il loro riutilizzo estendendo quindi di fatto la protezione dei dati.


L’European Open Science Cloud si configura come un ambiente virtuale multidisciplinare federato e aperto nel quale ricercatori, innovatori, aziende e cittadini europei possono pubblicare, trovare e riutilizzare dati, strumenti e servizi per la ricerca, l'innovazione e finalità educative. Si tratta di un progetto nato nel 2015 con l'obiettivo di federare le infrastrutture di dati di ricerca esistenti in Europa e realizzare una rete di dati FAIR e servizi correlati per la scienza, rendendo i dati di ricerca interoperabili e utilizzabili dalle macchine seguendo i principi guida FAIR. Nel marzo 2018, la Commissione europea ha pubblicato la Roadmap di attuazione dell' EOSC che dettaglia le principali linee d'azione della prima fase di attuazione dell'EOSC fino al 2020. Dal novembre 2018 è stata istituita una struttura di governance provvisoria a più livelli per guidare e supervisionare l'attuazione dell' EOSC.

Nella fase iniziale di sviluppo fino al 2020, la Commissione ha investito svariati milioni di euro per avviare la prototipazione dell'EOSC tramite bandi di progetto nell'ambito di Horizon 2020, il programma di finanziamento della ricerca e dell'innovazione della Commissione.

Dal 2021 si è avviata la fase di implementazione mossa da una visione condivisa, obiettivi comuni e contributi complementari a livello europeo, nazionale e istituzionale.

Per i successivi 7 anni è previsto un coinvestimento (con contributi in natura e finanziari) da parte di partner UE ed extra UE di almeno 1 miliardo di euro.

EOSC_vision

 

 Grafico tratto da Draft proposal for a European Partnership under Horizon Europe European Open Science Cloud (EOSC) Partnership Version 28 May 2020

La Citizen Science è un insieme di pratiche che coinvolgono i cittadini nella costruzione del sapere scientifico.

La comunità scientifica coinvolge i cittadini in attività di mappatura di dati con progetti a livello locale o globale, aiuta ad ampliare la quantità di informazioni raccolte in natura, e coinvolge attivamente cittadini, studenti e scienziati. La citizen science può fornire efficaci sistemi di monitoraggio e strumenti di ricerca sempre più importanti. Il livello di coinvolgimento della cittadinanza può essere più o meno spinto. A livello europeo, già a fine 2013 la Commissione Europea ha iniziato a promuovere la citizen science collocandola in un processo di emancipazione sociale e responsabilizzazione civica. Una delle prime azioni promosse dalla European Citizen Science Association  è stata la stesura dei 10 principi di Citizen Science, tradotti ad oggi in 27 lingue per garantirne la massima diffusione possibile:

  1. I progetti di CS coinvolgono attivamente i cittadini in attività scientifiche che generano nuova conoscenza o comprensione. I cittadini possono agire come contributori, collaboratori o responsabili di progetto e ricoprono un ruolo significativo nel progetto.

  2. I progetti di CS producono un risultato scientifico originale. Ad esempio, fornire una risposta ad un quesito di ricerca o mettere in pratica azioni di conservazione, decisioni gestionali o politiche ambientali.

  3. Sia gli scienziati professionisti sia i cittadini coinvolti traggono vantaggio dal prendere parte a progetti di CS. I vantaggi possono includere la pubblicazione dei risultati di una ricerca, opportunità di apprendimento, piacere personale, benefici sociali, soddisfazione per aver contribuito a fornire una evidenza scientifica per, ad esempio, trovare risposte a questioni di rilevanza locale, nazionale e internazionale e, attraverso queste, avere l’opportunità di influire sulle politiche di settore.

  4. Le persone coinvolte in processi di CS possono, se vogliono, prendere parte a più fasi del processo scientifico. Questo può includere lo sviluppo di quesiti di ricerca, mettere a punto un metodo, raccogliere e analizzare dati e comunicare i risultati.

  5. Le persone coinvolte in processi di CS ricevono feedback. Ad esempio, come i loro dati vengono utilizzati e quali sono i risultati nel campo della ricerca, politico e sociale.

  6. La CS è considerata una metodologia di ricerca come qualunque altra, con limiti e margini di errore che devono essere considerati e tenuti sotto controllo. Tuttavia, a differenza delle metodologie tradizionali di ricerca, la CS fornisce opportunità di un ampio coinvolgimento del pubblico e di democratizzazione della scienza.

  7. Dati e metadati provenienti da progetti di CS sono resi pubblicamente disponibili e, ove possibile, i risultati sono pubblicati in un formato open access. La condivisione dei dati può avvenire durante o dopo il progetto, a meno che esistano motivi di sicurezza o privacy che lo impediscano.

  8. Il contributo delle persone coinvolte in progetti di CS viene riconosciuto ufficialmente nei risultati dei progetti e delle pubblicazioni.

  9. I programmi di CS vengono valutati per il loro risultato scientifico, per la qualità dei dati, l’esperienza dei partecipanti e l’ampiezza dell’impatto sociale e sulle politiche di settore.

  10. I responsabili di progetti di CS prendono in considerazione aspetti legali ed etici relativi a copyright, proprietà intellettuale, accordi sulla condivisione dei dati, confidenzialità, attribuzione e impatto ambientale di ogni attività.