INVESTIGADORS

Dades de recerca FAIR

Seguint les Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020, la Comissió Europea defineix les dades de recerca com a informació factual o numèrica, recollida per ser examinada i considerada com la base d'un raonament, d'una discussió o d'un càlcul.

Les dades poden ser estadístiques, resultats d'experiments, mesures, observacions resultants de l'estudi de camp, d'enquestes o d'entrevistes i imatges.

 

Principis FAIR

Els principis de dades FAIR, sigles en anglès de (Findable, Accessible, Interoperable, Reusable - Trobables, Accessibles, Interoperables i Reusables), publicats per primer cop en Scientific Data al 2016, són un conjunt de característiques que han de tenir els objectes de dades (metadades i dades), per poder ser recuperables i reutilitzables per l'ésser humà i les màquines.

Dades obertes i dades FAIR:

  • Les dades obertes poden ser utilitzades, reutilitzades i redistribuïdes lliurement per qualsevol persona. Es troben subjectes, quan més, al requeriment d'atribució i de compartir-se de la mateixa manera que apareixen. Font: Open Data Handbook
  • En canvi, per raons de seguretat, privacitat, protecció de dades personals o d'explotació comercial/industrial i seguint els principis de la Comissió Europea "as open as possible, as closed as necessary" les dades FAIR no tenen perquè ser obertes però sí les metadades sota una CCO o equivalent, en la mesura que es salvaguardin els interessos o les limitacions legítimes.

Agents implicats

  • El personal investigador, els responsables dels repositoris i els curadors de dades són claus per fer possible aquests principis.
  • Per l'acompliment dels principis FAIR, dipositeu les dades de recerca en un trusted repository com CORA-RDR i ompliu tantes metadades com sigui possible amb informació del vostre dataset per a que pugui ser trobable fàcilment.  

Més informació: 

 

Com fer que les dades de recerca siguin Findable  

  • F1 Les metadades han de tenir un identificador únic globlal i persistent (handle, DOI, ...)
  • F2 Les dades es descriuen amb metadades enriquides
  • F3 Hi ha una metadada específica per l'identificador permanent
  • F4 Les metadades es registren o s'indexen en un motor de cerca

Consells per l'acompliment de F2

  • Incloure informació descriptiva sobre el context i/o les característiques de les dades. Més informació

Com fer que les dades de recerca siguin Accesible

    • A1 Les metadades es poden recuperar pel seu identificador mitjançant un protocol de comunicació estandaritzats
      • A1.1 els protocols han de ser oberts, gratuits i universalment implementables.
      • A1.2 Quan sigui necessari per raons de privacitat, seguretat o interessos comercials, el protocol ha de permetre un sistema d'autenticació i autorització a les dades
    • A2 Les metadades han de ser accessibles fins i tot quan les dades ja no estan disponibles

    Més informació

    Com fer que les dades siguin Interoperable

    • I1 Les metadades utilitzen un llenguatge formal, accessible,compartit i àmpliament aplicable per a la representació del coneixement
    • I2 Les metadades utilitzen un vocabulari FAIR (vocabularis controlats)
    • I3 Les metadades inclouen referències qualificades a d'altres metadades (publicacions i materials relacionats) 

    Més informació

    Com fer que les dades siguin Reusable

    • R1 Les metadades es descriuen amb una pluralitat d'atributs precisos i rellevants
      • R1.1 Publicar dades i metadades amb una llicència d'ús clara i accessible
      • R1.2 Utilitzar criteris de provenance (creació, atribució i historial de versions) per associar les metadades a les dades durant el seu cicle de vida
      • R1.3 Els estàndards de dades i metadades utilitzats compleixen amb els estàndards comuns de l'àrea de coneixement al que es refereixen les dades

    Consells per l'acompliment R1

    Aquest concepte està relacionat amb el principi F1 però focalitzat en com fa la cerca l'usuari per decidir si les dades són del seu interès

    • Descriu l'abast de les teves dades: amb quina finalitat es van recollir?
    • Esmenta limitacions sobre les dades que altres hauríen de conèixer
    • Especifica la data de generació/recollida de les dades, condicions de laboratori, qui va prepara les dades, el nom i la versió del programari utilitzat
    • Les dades són en brut o processades?

    Consells per l'acompliment R1.2

    • Perquè altres puguin reutilitzar les vostres dades han de saber d'on provenen, indicant aquesta informació a R1
    • A qui citar i/o com voleu que us reconeguin. Incloeu una descripció del flux de treball que va portar a les vostres dades: qui les va generar o recollir? Com s'ha processat? S'ha publicat abans?
    • Conté dades d'una altra persona que heu transformat o completat?

    Més informació

    Vols saber si les teves dades són FAIR?

    • Utilitza el programa desenvolupat per DANS (Data Archiving and Networked Services) i respon a les 12 preguntes del formulari per saber si les teves dades són FAIR

    SATIFYD: eina d'autoavaluació dades FAIR

    Publicar dades de recerca

    CORA. Repositori de Dades de Recerca   

    • Es recomana dipositar les dades de recerca a CORA-RDR. És un trusted repository específic per a dades.
    • CORA-RDR és el repositori de dades de les universitats catalanes i dels centres CERCA.
    • Les metadades publicades en CORA-RDR es troben indexades i per tant trobables a:
    • El personal investigador de la UPC pot publicar conjunts de dades de recerca en modalitat FAIR d'acord amb les directrius de l'EOSC.
    • El CSUC i el CORA-RDR són proveïdors oficials de serveis dins de l'EOSC, contribuint activament a l'avanç de la recerca, impulsant la reutilització de dades i promocionant els valors de la ciència oberta en benefici de la comunitat científica en general.
    • Abans de publicar el primer dataset a CORA-RDR cal que us registreu seguint aquestes instruccions i informeu a info.biblioteques@upc.edu per assignar-vos permisos de publicació. 
    • La publicació no és immediata. Els curadors de dades de les biblioteques de la UPC revisen les metadades abans de publicar el dataset. 
    • Contacteu amb info.biblioteques@upc.edu per publicar datasets superiors a 10GB.

    Amb cada dataset:

    • Afegiu un fitxer readme amb informació sobre les dades de recerca. El fitxer s'ha de guardar amb el nom "Readme_títol del dataset.txt".

    Descarregueu-vos les plantilles (feu servir l'idioma de les dades) i amb el botó dret del ratolí feu "Guardar enlace como".

    Abans de publicar verifiqueu que les dades segueixen els principis FAIR 

    • Podeu verificar amb la guia ràpida si disposeu de tota la informació de les dades per seguir els principis FAIR.

     

    UPCommons

    Es recomana dipositar datasets a UPCommons només si en el vostre DMP heu indicat UPCommons com a repositori o bé els datasets formen part d'un projecte que ja conté datasets a UPCommons.

    La col·lecció Research data d'UPCommons permet publicar, compartir, descriure i llicenciar dades de recerca FAIR vinculades a una publicació o a un projecte de recerca:

    • Les dades publicades a UPCommons han de ser produïdes per la comunitat científica de la UPC.
    • UPCommons permet allotjar dades en qualsevol format. Seguint la política institucional sobre programari lliure, et recomanem que utilitzis formats oberts sempre que sigui possible.
    • A més del handle, UPCommons assigna un DOI a cada dataset.
    • Els fitxers poden tenir una mida màxima de 2GB. Per a fitxers més grans o per publicar diversos fitxers, contacta amb info.bibliotequesupc.edu.

     

    Com publicar datasets a UPCommons:

    • A la comunitat Research data, selecciona Diposita dades de recerca.

    Introdueix les metadades:

    • Autor/s de les dades.

    • Departament/s i grup/s de recerca dels autor/s.

    • Títol, descripció i paraules-clau del dataset.

    • Any de creació.

    • Software per consultar les dades, si s'escau.

    • Codi de l'entitat finançadora o títol de la publicació associada a les dades.

    • Informació sobre llicències.

    Amb cada dataset:

    • Afegiu un fitxer readme amb informació sobre les dades de recerca. El fitxer s'ha de guardar amb el nom "Readme_títol del dataset.txt".

    Descarregueu-vos les plantilles i amb el botó dret del ratolí feu "Guardar enlace como".

    La publicació no és immediata. Abans de fer-les públiques, els bibliotecaris revisen les metadades.

     

    Abans de publicar dades de recerca:

    • Comprova que ets titular dels drets de difusió de les dades. Si no és així, necessites un permís de re-ús de les dades per part dels titulars d'aquestes.

    • Assegura't que les dades que vols publicar no estan subjectes a cap restricció per qüestions de confidencialitat, privacitat o copyright. Si les dades fan referència a persones (enquestes, ...), s'han de publicar anonimitzades o disposar del consentiment explícit de les persones que hi han participat. Per a més informació consulta els apartats: Drets d'autoria i Llicències.

     

    A més de CORA-RDR i d'UPCommons, pots dipositar les dades en altres repositoris. Tingues en compte els criteris següents:

    • La capacitat d'emmagatzematge és suficient.
    • Permet dipositar en el format desitjat i les diferents versions d'un mateix arxiu.
    • Es poden enllaçar les dades a les publicacions associades.
    • Disposa d'una política de preservació: còpies de seguretat, terminis de conservació, etc. 
    • Garanteix la interoperabilitat amb OpenAIRE, si les dades són d'un projecte europeu
    • Disposa d'un identificador persistent i únic (DOI o URN) per a cada conjunt de dades.
    • El dipòsit segueix directrius i certificacions de qualitat de dades com ara, ISO, DINI, Data Seal of Approval.
    • Les dades són fàcilment recuperables.
    • Permet escollir entre diferents llicències d'ús.
    • Permet la restricció d'accés a les dades (tancades, restringides o establir un període d'embargament).
    • Quins són els costos associats a l'ús del dipòsit.
    • La disciplina de les dades del projecte.

    El directori re3data.org et permet seleccionar entre molts dipòsits segons l'àmbit temàtic, la tipologia de dades, etc. 

    També pots buscar repositoris de dades segons els principals àmbits de coneixement de la UPC:
    Aeronàutica i espai Edificació Enginyeries Enginyeria química
    Arquitectura Energies Enginyeria de la telecomunicació Física
    Ciències de la salut Enginyeria agroalimentària Enginyeria dels materials Informàtica
    Ciències de la visió Enginyeria biomèdica Enginyeria elèctrica Matemàtiques
    Economia i organització d'empreses Enginyeria civil Enginyeria mecànica Urbanisme

     

    • Zenodo: dipòsit de dades de recerca desenvolupat pel CERN en el marc del projecte OpenAIRE. Si no trobes cap dipòsit que encaixi amb el teu projecte, pots utilitzar repositoris multidisciplinars.
    • Eudat (European Data Insfrastucture): projecte multi-institucional finançat pel programa H2020 de la UE.

     

    Durant la recerca, et recomanem que organitzis i documentis les dades que generis i les preservis durant el període que estableixis, per exemple, entre 5 i 10 anys. Compartir les dades amb altres investigadors dipositant‐les en repositoris d’accés obert, comporta beneficis per a:

    L’investigador i la seva institució:

    •    Emmagatzematge segur a llarg termini.
    •    Poder demostrar els resultats de la investigació.
    •    Fer visibles les dades i poder-les citar.
    •    Permetre la reutilització de les dades.
    •    Augmentar  les citacions i per tant l’impacte de la investigació.
    •    Establir col∙laboracions sobre temes relacionats.

    Per a les entitats finançadores:

    •    Tenir localitzades les dades de la recerca finançada.
    •    Evitar duplicitats en la recollida de dades.
    •    Fer un ús més eficient de la recerca finançada amb fons públics.
    •    Augmentar el retorn de la inversió promovent la reutilització de dades.

    Per a la ciència i la societat:

    •    Maximitzar la transparència.
    •    Millorar la qualitat en la verificació, la replicació i la confiança.
    •    Promoure la innovació a través de nous usos de les dades.
    •    Augmentar el valor social de la recerca.
    •    Complir amb els mandats a favor de l’accés obert.

    Entitats finançadores i dades de recerca

    D'acord amb el General Model Grant Agreement (Annex 5, article 17 - Communication, dissemination, Open Science and visibility), el personal investigador beneficiari d'un projecte ha de: 

    • Gestionar les dades de recerca de forma responsable i d’acord amb els principis FAIR: que es puguin cercar amb facilitat, que siguin accessibles, interoperables i reutilitzables  
    • Elaborar un Pla de Gestió de Dades (PDG), actualitzant-lo periòdicament. 
    • Dipositar les dades en un trusted repository tan aviat com sigui posible
    • Assegurar l'accés obert a les dades via el repositori, d'acord amb el criteri “tan obert com possible, tan tancat com necessari” i amb una llicència CC-BY o CC-0 o equivalent
    • Proporcionar informació al repositori sobre els resultats de la investigació i qualsevol altra eina necessària per a validar les dades
    • Les metadades de les dades de recerca han de ser obertes i amb una llicència CC-0 o equivalent
    En el marc de l’Horitzó 2020, la Comissió Europea va iniciar l'any 2015 l'Open Research Data Pilot que requeria als projectes d’unes àrees concretes, l'elaboració d’un pla de gestió de dades i la publicació en accés obert de les dades.
    Des del 2017, l’Open Research Data Pilot s’ha extès a totes les àrees dels projectes finançats per l’H2020 i, per tant, requereix la publicació en obert de les dades en tots els projectes. A més, cal que les dades siguin FAIR, és a dir que siguin trobables (Findable), accessibles (Accessible), interoperables (Interoperable) i reutilitzables (Reusable).
    En la clàusula 29.3 del Model Grant Agreement es detallen els requisits legals que han de complir els projectes: 
    • Desenvolupar un Pla de Gestió de Dades - Data Management Plan (DMP).
    • Dipositar les dades de la recerca en un repositori el més aviat possible per garantir a qualsevol persona, el seu accés, mineria, explotació, reproducció i difusió emprant una llicència Creative Commons apropiada.
    • En el mateix dipòsit on es publiquen les dades proporcionar informació sobre les eines i els instruments (programes informàtics, etc.) necessaris per validar els resultats i quan sigui possible, oferir aquestes eines.
    Els costos associats amb les dades, incloent la creació del DMP es consideren despeses elegibles en el projecte.

    Més informació: 

     

    Per a les accions finançades per l'European Research Council (ERC) consulteu:

    Excepcions: Seguint els principis de la Comissió "as open as possible, as closed as necessary", es pot excloure la difusió en obert dels resultats del projecte per raons de seguretat, de privacitat, de protecció de dades personals o d'explotació comercial/industrial.  

    Més informació:

    Amb la finalitat d'impulsar l'accés a les dades d'investigació dels projectes I+D+i finançats, les convocatòries derivades del Plan Estatal de Investigación Científica y Técnica y de Innovación 2021-2023 menciona incloure:

    Un pla de gestió de dades que s'haurà de dipositar en dipòsits institucionals, nacionals o internacionals un cop finalitzat el projecte i transcorregut el termini establert a les corresponents convocatòries, respectant sempre totes les situacions en les que les dades s'han de protegir per raons de confidencialitat, seguretat, protecció o quan sigui necessari per a l'explotació comercial dels resultats obtinguts.

    La Llei 17/2022 de 5 de setembre de la ciència, la tecnologia i la innovació, en el seu article 37, disposa que el personal investigador que participa en projectes competitius nacionals ha de dipositar:

    • Les dades associades a l'article (supplementary data) en un repositori de dades temàtic o multidisciplinar com CORA-RDR. Més informació sobre com publicar datasets a CORA-RDR.

    Drets i llicències de les dades de recerca

    Tal com es recull a les Recomanacions de la guia de publicacions de continguts docents (UdG):

    "No disposen de protecció les informacions o dades en brut, com pot ser una llista de dades demogràfiques, un conjunt de registres meteorològics o una relació de coordenades UTM, si bé la seva incorporació o representació per mitjà d’una base de dades, o d’un plànol, o la seva presentació i interpretació en el marc d’un treball de recerca mereixeran protecció pel valor afegit que aquests materials o estudis proporcionen. Es reconeixen drets a aquests productes o estudis, però no a la informació que ha servit de base per elaborar-los".

    Tot i que les dades en brut no tenen autoria i, per tant, no són objecte de propietat intel·lectual, cal tenir en compte que sí que ho són les bases de dades on aquestes apareixen. Tal i com estableix l'article 133 de la Llei de propietat intel·lectual i la Llei 5/1998 de 6 de març, d’incorporació al Dret espanyol de la Directiva 96/9/CE, del Parlament Europeu i del Consell, d’11 de març de 1996, sobre la  protecció jurídica de les bases de dades:

    • El dret "sui generis" sobre una base de dades protegeix la inversió substancial, avaluada qualitativa o quantitativament, que realitza el seu fabricant ja sigui de mitjans financers, inversió de temps, esforç, energia o altres de natura similar, per a l'obtenció, verificació o presentació del seu contingut.
    • Mitjançant aquest dret, el fabricant d'una base de dades pot prohibir l'extracció i/o reutilització de la totalitat o d'una part substancial del seu contingut sempre i quan l'obtenció, la verificació o la presentació d'aquest contingut representi una inversió substancial des del punt de vista quantitatiu o qualitatiu. Aquest dret podrà transferir-se, cedir-se o donar-se en llicència contractual.
    • Tampoc s'autoritza l'extracció i/o reutilització repetida o sistemàtica de parts no substancials del contingut de la base de dades, que suposin actes contraris a una explotació normal de la mateixa o que causin un perjudici injustificat als interessos legítims del seu fabricant.
    • El dret "sui generis" sobre la base de dades s'aplica sense perjudici dels possibles drets existents sobre el seu contingut (drets d'autor de les obres incloses o altres).

    Per tant, la reutilització de dades pròpies o de tercers comporta la consideració dels següents aspectes:

    • Qui és el propietari de les dades?
    • Les dades es troben a una base de dades objecte de protecció?
    • Tens permisos per preservar les dades i permetre la seva reutilització?
    • Hi ha restriccions sobre les dades de tercers?
    • Existeix algun període d'embargament que limiti l'accés obert de les dades?
    • Quines llicències farà servir per facilitar la reutilització de les pròpies dades?

    Tal i com recull la Comissió Europea al document Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020:

    "as far as possible, projects must then take measures to enable for third parties to access, mine, exploit, reproduce and disseminate (free of charge for any user) this research data. One straightforward and effective way of doing this is to attach Creative Commons Licence (CC-BY or CC0 tool) to the data deposited (http://creativecommons.org/licenses/)."

         

     

    Cal tenir en compte que les llicències de domini públic són el mitjà per oferir les dades de la forma més oberta possible ja que el llicenciador renuncia a tots els drets (fins on és possible amb la llei vigent aplicable).

    També s'ha de considerar que la versió 4.0 de les llicències Creative Commons presenta algunes millores que poden ser d'interès en el cas de les dades de recerca:

    • Bases de dades: cobertura del dret "sui generis" de les bases de dades, excepte exclusió explícita del llicenciador.
    • Autoria: milllora dels procediment amb què un autor pot demanar la no menció de la seva autoria, tant en les reproduccions de la seva obra com en les obres derivades de la mateixa. A més, els usuaris de les obres poden reconèixer l'autoria de les obres emprades mitjançant un enllaç a una pàgina web on es detalli aquesta informació.
    • Interoperabilitat: maximització de la interoperabilitat entre les llicències CC i altres llicències.
    • Altres: "What’s New in 4.0".

    Alex Ball, membre del Digital Curation Centre, ha elaborat la guia How to License Research Data, document que recull diversos aspectes que cal considerar quan s'atorga una llicència a les dades de recerca:

    • La majoria de projectes poden fer servir les llicències estàndards com les Creative Commons o Open Data Commons, però també es pot fer una llicència personalitzada segons la casuística de dades i sempre que es disposi de l'assessorament de professionals.
    • En casos en què cap de les llicències existents sigui plenament satisfactòria, es pot optar per la concessió de diverses llicències ("multiple licensing").
    • Les llicències Creative Commons tracten els datasets i les bases de dades com a conjunt, però no les dades individuals incloses (diferenciades de la bases de dades o col·lecció). Això pot resultar dificultós en alguns casos complexos, com les col·leccions de diverses obres objecte de drets d'autor.
    • Les bases de dades estan incloses entre les obres que es poden oferir en domini públic mitjançant la llicència CC0. En relació a les llicències Creative Commons restants, es recomana emprar la versió 4.0.
    • Existeixen altres llicències, en el marc del projecte Open Data Commons, que són específiques per a les bases de dades:
      • Open Data Commons Attribution License (ODC-BY): Llicència que permet a tercers copiar, distribuir i usar la base de dades, així com emprar-la per crear-ne nous continguts, bases de dades o col·leccions de bases de dades (sempre i quan es citi la base de dades original).
      • Open Data Commons Database License (ODbL): És la mateixa llicència que la ODC-BY però, en el cas de que es facin noves bases de dades derivades (no col·leccions de bases de dades ni altres possibles continguts derivats), cal atorgar-hi la mateixa llicència que la base de dades original. També permet l'aplicació de la tecnologia Digital Rights Management (DRM), tant a la base de dades original com a la derivada, sempre i quan s'ofereixi alternativament una còpia de la base de dades sense restriccions.
      • Open Data Commons Public Domain Dedication and License (PDDL): Llicència semblant a la CC0, però redactada específicament per a les bases de dades. Permet copiar, distribuir i usar la base de dades, així com crear-ne obres i bases de dades derivades, sense cap altra restricció.

    Tal com es recull als preàmbuls d'aquestes llicències Open Data Commons:

    • ODC-BY i ODbL només abasten els drets sobre la base de dades, no sobre els continguts de la mateixa (imatges, material audiovisual, etc.). En aquest cas, els llicenciadors hauran d'emprar ODbl conjuntament amb altres llicències.
    • En canvi, PDDL es pot emprar per a les bases de dades o per als seus continguts (dades), tant de forma conjunta com individual.

    Aspectes ètics i citació

    Els aspectes ètics afecten les dades que es poden mostrar, el temps i l'anonimat de les persones implicades, respectant la dignitat i la integritat per garantir la privacitat i la confidencialitat.

    Cal tenir en compte:

    Per citar correctament les dades de recerca, segueix les pautes.

     

     


    Darrera actualització: 22/11/2023