Les dades poden ser estadístiques, resultats d'experiments, mesures, observacions resultants de l'estudi de camp, d'enquestes o d'entrevistes i imatges.
Els principis de dades FAIR, sigles en anglès de (Findable, Accessible, Interoperable, Reusable - Trobables, Accessibles, Interoperables i Reusables), publicats per primer cop en Scientific Data al 2016, són un conjunt de característiques que han de tenir els objectes de dades (metadades i dades), per poder ser recuperables i reutilitzables per l'ésser humà i les màquines.
Dades obertes i dades FAIR:
Les dades obertes poden ser utilitzades, reutilitzades i redistribuïdes lliurement per qualsevol persona. Es troben subjectes, quan més, al requeriment d'atribució i de compartir-se de la mateixa manera que apareixen. Font: Open Data Handbook
En canvi, per raons de seguretat, privacitat, protecció de dades personals o d'explotació comercial/industrial i seguint els principis de la Comissió Europea "as open as possible, as closed as necessary" les dades FAIR no tenen perquè ser obertes però sí les metadades sota una CCO o equivalent, en la mesura que es salvaguardin els interessos o les limitacions legítimes.
Agents implicats
El personal investigador, els responsables dels repositoris i els curadors de dades són claus per fer possible aquests principis.
Per l'acompliment dels principis FAIR, dipositeu les dades de recerca en un trusted repository com CORA-RDR i ompliu tantes metadades com sigui possible amb informació del vostre dataset per a que pugui ser trobable fàcilment.
A1 Les metadades es poden recuperar pel seu identificador mitjançant un protocol de comunicació estandaritzats
A1.1 els protocols han de ser oberts, gratuits i universalment implementables.
A1.2 Quan sigui necessari per raons de privacitat, seguretat o interessos comercials, el protocol ha de permetre un sistema d'autenticació i autorització a les dades
A2 Les metadades han de ser accessibles fins i tot quan les dades ja no estan disponibles
R1 Les metadades es descriuen amb una pluralitat d'atributs precisos i rellevants
R1.1 Publicar dades i metadades amb una llicència d'ús clara i accessible
R1.2 Utilitzar criteris de provenance (creació, atribució i historial de versions) per associar les metadades a les dades durant el seu cicle de vida
R1.3 Els estàndards de dades i metadades utilitzats compleixen amb els estàndards comuns de l'àrea de coneixement al que es refereixen les dades
Consells per l'acompliment R1
Aquest concepte està relacionat amb el principi F1 però focalitzat en com fa la cerca l'usuari per decidir si les dades són del seu interès
Descriu l'abast de les teves dades: amb quina finalitat es van recollir?
Esmenta limitacions sobre les dades que altres hauríen de conèixer
Especifica la data de generació/recollida de les dades, condicions de laboratori, qui va prepara les dades, el nom i la versió del programari utilitzat
Les dades són en brut o processades?
Consells per l'acompliment R1.2
Perquè altres puguin reutilitzar les vostres dades han de saber d'on provenen, indicant aquesta informació a R1
A qui citar i/o com voleu que us reconeguin. Incloeu una descripció del flux de treball que va portar a les vostres dades: qui les va generar o recollir? Com s'ha processat? S'ha publicat abans?
Conté dades d'una altra persona que heu transformat o completat?
Utilitza el programa desenvolupat per DANS (Data Archiving and Networked Services) i respon a les 12 preguntes del formulari per saber si les teves dades són FAIR
El personal investigador de la UPC pot publicar conjunts de dades de recerca en modalitat FAIR d'acord amb les directrius de l'EOSC.
El CSUC i el CORA-RDR són proveïdors oficials de serveis dins de l'EOSC, contribuint activament a l'avanç de la recerca, impulsant la reutilització de dades i promocionant els valors de la ciència oberta en benefici de la comunitat científica en general.
Abans de publicar el primer dataset a CORA-RDR cal que us registreu seguint aquestes instruccions i informeu a info.biblioteques@upc.edu per assignar-vos permisos de publicació.
La publicació no és immediata. Els curadors de dades de les biblioteques de la UPC revisen les metadades abans de publicar el dataset.
Abans de publicar verifiqueu que les dades segueixen els principis FAIR
Podeu verificar amb la guia ràpida si disposeu de tota la informació de les dades per seguir els principis FAIR.
UPCommons
Es recomana dipositar datasets a UPCommons només si en el vostre DMP heu indicat UPCommons com a repositori o bé els datasets formen part d'un projecte que ja conté datasets a UPCommons.
La col·lecció Research data d'UPCommons permet publicar, compartir, descriure i llicenciar dades de recerca FAIR vinculades a una publicació o a un projecte de recerca:
Les dades publicades a UPCommons han de ser produïdes per la comunitat científica de la UPC.
UPCommons permet allotjar dades en qualsevol format. Seguint la política institucional sobre programari lliure, et recomanem que utilitzis formats oberts sempre que sigui possible.
A més del handle, UPCommons assigna un DOI a cada dataset.
Els fitxers poden tenir una mida màxima de 2GB. Per a fitxers més grans o per publicar diversos fitxers, contacta amb info.bibliotequesupc.edu.
Com publicar datasets a UPCommons:
A la comunitat Research data, selecciona Diposita dades de recerca.
Introdueix les metadades:
Autor/s de les dades.
Departament/s i grup/s de recerca dels autor/s.
Títol, descripció i paraules-clau del dataset.
Any de creació.
Software per consultar les dades, si s'escau.
Codi de l'entitat finançadora o títol de la publicació associada a les dades.
Informació sobre llicències.
Amb cada dataset:
Afegiu un fitxer readme amb informació sobre les dades de recerca. El fitxer s'ha de guardar amb el nom "Readme_títol del dataset.txt".
Descarregueu-vos les plantilles i amb el botó dret del ratolí feu "Guardar enlace como".
La publicació no és immediata. Abans de fer-les públiques, els bibliotecaris revisen les metadades.
Abans de publicar dades de recerca:
Comprova que ets titular dels drets de difusió de les dades. Si no és així, necessites un permís de re-ús de les dades per part dels titulars d'aquestes.
Assegura't que les dades que vols publicar no estan subjectes a cap restricció per qüestions de confidencialitat, privacitat o copyright. Si les dades fan referència a persones (enquestes, ...), s'han de publicar anonimitzades o disposar del consentiment explícit de les persones que hi han participat. Per a més informació consulta els apartats: Drets d'autoria i Llicències.
Zenodo: dipòsit de dades de recerca desenvolupat pel CERN en el marc del projecte OpenAIRE. Si no trobes cap dipòsit que encaixi amb el teu projecte, pots utilitzar repositoris multidisciplinars.
Eudat (European Data Insfrastucture): projecte multi-institucional finançat pel programa H2020 de la UE.
Durant la recerca, et recomanem que organitzis i documentis les dades que generis i les preservis durant el període que estableixis, per exemple, entre 5 i 10 anys. Compartir les dades amb altres investigadors dipositant‐les en repositoris d’accés obert, comporta beneficis per a:
L’investigador i la seva institució:
Emmagatzematge segur a llarg termini.
Poder demostrar els resultats de la investigació.
Fer visibles les dades i poder-les citar.
Permetre la reutilització de les dades.
Augmentar les citacions i per tant l’impacte de la investigació.
Establir col∙laboracions sobre temes relacionats.
Per a les entitats finançadores:
Tenir localitzades les dades de la recerca finançada.
Evitar duplicitats en la recollida de dades.
Fer un ús més eficient de la recerca finançada amb fons públics.
Augmentar el retorn de la inversió promovent la reutilització de dades.
Per a la ciència i la societat:
Maximitzar la transparència.
Millorar la qualitat en la verificació, la replicació i la confiança.
Promoure la innovació a través de nous usos de les dades.
D'acord amb el General Model Grant Agreement (Annex 5, article 17 - Communication, dissemination, Open Science and visibility), el personal investigador beneficiari d'un projecte ha de:
Gestionar les dades de recerca de forma responsable i d’acord amb els principis FAIR: que es puguin cercar amb facilitat, que siguin accessibles, interoperables i reutilitzables
Dipositar les dades en un trusted repository tan aviat com sigui posible
Assegurar l'accés obert a les dades via el repositori, d'acord amb el criteri “tan obert com possible, tan tancat com necessari” i amb una llicència CC-BY o CC-0 o equivalent
Proporcionar informació al repositori sobre els resultats de la investigació i qualsevol altra eina necessària per a validar les dades
Les metadades de les dades de recerca han de ser obertes i amb una llicència CC-0 o equivalent
En el marc de l’Horitzó 2020, la Comissió Europea va iniciar l'any 2015 l'Open Research Data Pilot que requeria als projectes d’unes àrees concretes, l'elaboració d’un pla de gestió de dades i la publicació en accés obert de les dades.
Des del 2017, l’Open Research Data Pilot s’ha extès a totes les àrees dels projectes finançats per l’H2020 i, per tant, requereix la publicació en obert de les dades en tots els projectes. A més, cal que les dades siguin FAIR, és a dir que siguin trobables (Findable), accessibles (Accessible), interoperables (Interoperable) i reutilitzables (Reusable).
En la clàusula 29.3 del Model Grant Agreement es detallen els requisits legals que han de complir els projectes:
Dipositar les dades de la recerca en un repositori el més aviat possible per garantir a qualsevol persona, el seu accés, mineria, explotació, reproducció i difusió emprant una llicència Creative Commons apropiada.
En el mateix dipòsit on es publiquen les dades proporcionar informació sobre les eines i els instruments (programes informàtics, etc.) necessaris per validar els resultats i quan sigui possible, oferir aquestes eines.
Els costos associats amb les dades, incloent la creació del DMP es consideren despeses elegibles en el projecte.
Excepcions: Seguint els principis de la Comissió "as open as possible, as closed as necessary", es pot excloure la difusió en obert dels resultats del projecte per raons de seguretat, de privacitat, de protecció de dades personals o d'explotació comercial/industrial.
Donar suport a l'accés obert i a la gestió de dades de recerca d'acord amb els principis internacionals FAIR, implantant l'obligatorietat de realitzar un pla de gestió de dades (PGD) com a part integral dels projectes de recerca finançats amb fons públics.
Les dades associades a l'article (supplementary data) en un repositori de dades temàtic o multidisciplinar com CORA-RDR. Més informació sobre com publicar datasets a CORA-RDR.
Un pla de gestió de dades que s'haurà de dipositar en dipòsits institucionals, nacionals o internacionals un cop finalitzat el projecte i transcorregut el termini establert a les corresponents convocatòries, respectant sempre totes les situacions en les que les dades s'han de protegir per raons de confidencialitat, seguretat, protecció o quan sigui necessari per a l'explotació comercial dels resultats obtinguts.
Les dades associades a l'article (supplementary data) en un repositori de dades temàtic o multidisciplinar com CORA-RDR. Més informació sobre com publicar datasets a CORA-RDR.
"No disposen de protecció les informacions o dades en brut, com pot ser una llista de dades demogràfiques, un conjunt de registres meteorològics o una relació de coordenades UTM, si bé la seva incorporació o representació per mitjà d’una base de dades, o d’un plànol, o la seva presentació i interpretació en el marc d’un treball de recerca mereixeran protecció pel valor afegit que aquests materials o estudis proporcionen. Es reconeixen drets a aquests productes o estudis, però no a la informació que ha servit de base per elaborar-los".
El dret "sui generis" sobre una base de dades protegeix la inversió substancial, avaluada qualitativa o quantitativament, que realitza el seu fabricant ja sigui de mitjans financers, inversió de temps, esforç, energia o altres de natura similar, per a l'obtenció, verificació o presentació del seu contingut.
Mitjançant aquest dret, el fabricant d'una base de dades pot prohibir l'extracció i/o reutilització de la totalitat o d'una part substancial del seu contingut sempre i quan l'obtenció, la verificació o la presentació d'aquest contingut representi una inversió substancial des del punt de vista quantitatiu o qualitatiu. Aquest dret podrà transferir-se, cedir-se o donar-se en llicència contractual.
Tampoc s'autoritza l'extracció i/o reutilització repetida o sistemàtica de parts no substancials del contingut de la base de dades, que suposin actes contraris a una explotació normal de la mateixa o que causin un perjudici injustificat als interessos legítims del seu fabricant.
El dret "sui generis" sobre la base de dades s'aplica sense perjudici dels possibles drets existents sobre el seu contingut (drets d'autor de les obres incloses o altres).
Per tant, la reutilització de dades pròpies o de tercers comporta la consideració dels següents aspectes:
Qui és el propietari de les dades?
Les dades es troben a una base de dades objecte de protecció?
Tens permisos per preservar les dades i permetre la seva reutilització?
Hi ha restriccions sobre les dades de tercers?
Existeix algun període d'embargament que limiti l'accés obert de les dades?
Quines llicències farà servir per facilitar la reutilització de les pròpies dades?
"as far as possible, projects must then take measures to enable for third parties to access, mine, exploit, reproduce and disseminate (free of charge for any user) this research data. One straightforward and effective way of doing this is to attach Creative Commons Licence (CC-BY or CC0 tool) to the data deposited (http://creativecommons.org/licenses/)."
Cal tenir en compte que les llicències de domini públic són el mitjà per oferir les dades de la forma més oberta possible ja que el llicenciador renuncia a tots els drets (fins on és possible amb la llei vigent aplicable).
També s'ha de considerar que la versió 4.0 de les llicències Creative Commons presenta algunes millores que poden ser d'interès en el cas de les dades de recerca:
Bases de dades: cobertura del dret "sui generis" de les bases de dades, excepte exclusió explícita del llicenciador.
Autoria: milllora dels procediment amb què un autor pot demanar la no menció de la seva autoria, tant en les reproduccions de la seva obra com en les obres derivades de la mateixa. A més, els usuaris de les obres poden reconèixer l'autoria de les obres emprades mitjançant un enllaç a una pàgina web on es detalli aquesta informació.
Interoperabilitat: maximització de la interoperabilitat entre les llicències CC i altres llicències.
Alex Ball, membre del Digital Curation Centre, ha elaborat la guia How to License Research Data, document que recull diversos aspectes que cal considerar quan s'atorga una llicència a les dades de recerca:
La majoria de projectes poden fer servir les llicències estàndards com les Creative Commons o Open Data Commons, però també es pot fer una llicència personalitzada segons la casuística de dades i sempre que es disposi de l'assessorament de professionals.
En casos en què cap de les llicències existents sigui plenament satisfactòria, es pot optar per la concessió de diverses llicències ("multiple licensing").
Les llicències Creative Commons tracten els datasets i les bases de dades com a conjunt, però no les dades individuals incloses (diferenciades de la bases de dades o col·lecció). Això pot resultar dificultós en alguns casos complexos, com les col·leccions de diverses obres objecte de drets d'autor.
Les bases de dades estan incloses entre les obres que es poden oferir en domini públic mitjançant la llicència CC0. En relació a les llicències Creative Commons restants, es recomana emprar la versió 4.0.
Existeixen altres llicències, en el marc del projecte Open Data Commons, que són específiques per a les bases de dades:
Open Data Commons Attribution License (ODC-BY): Llicència que permet a tercers copiar, distribuir i usar la base de dades, així com emprar-la per crear-ne nous continguts, bases de dades o col·leccions de bases de dades (sempre i quan es citi la base de dades original).
Open Data Commons Database License (ODbL): És la mateixa llicència que la ODC-BY però, en el cas de que es facin noves bases de dades derivades (no col·leccions de bases de dades ni altres possibles continguts derivats), cal atorgar-hi la mateixa llicència que la base de dades original. També permet l'aplicació de la tecnologia Digital Rights Management (DRM), tant a la base de dades original com a la derivada, sempre i quan s'ofereixi alternativament una còpia de la base de dades sense restriccions.
Open Data Commons Public Domain Dedication and License (PDDL): Llicència semblant a la CC0, però redactada específicament per a les bases de dades. Permet copiar, distribuir i usar la base de dades, així com crear-ne obres i bases de dades derivades, sense cap altra restricció.
Tal com es recull als preàmbuls d'aquestes llicències Open Data Commons:
ODC-BY i ODbL només abasten els drets sobre la base de dades, no sobre els continguts de la mateixa (imatges, material audiovisual, etc.). En aquest cas, els llicenciadors hauran d'emprar ODbl conjuntament amb altres llicències.
En canvi, PDDL es pot emprar per a les bases de dades o per als seus continguts (dades), tant de forma conjunta com individual.
Els aspectes ètics afecten les dades que es poden mostrar, el temps i l'anonimat de les persones implicades, respectant la dignitat i la integritat per garantir la privacitat i la confidencialitat.