INVESTIGADORS

Dades de recerca en obert

Seguint les Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020, la Comissió Europea defineix les dades de recerca com a informació factual o numèrica, recollida per ser examinada i considerada com la base d'un raonament, d'una discussió o d'un càlcul.

Les dades poden ser estadístiques, resultats d'experiments, mesures, observacions resultants de l'estudi de camp, d'enquestes o d'entrevistes i imatges.

Entitats finançadores i dades de recerca

En el marc de l’Horitzó 2020, la Comissió Europea va iniciar l'any 2015 l'Open Research Data Pilot que requeria als projectes d’unes àrees concretes, l'elaboració d’un pla de gestió de dades i la publicació en accés obert de les dades.
Des del 2017, l’Open Research Data Pilot s’ha extès a totes les àrees dels projectes finançats per l’H2020 i, per tant, requereix la publicació en obert de les dades en tots els projectes. A més, cal que les dades siguin FAIR, és a dir que siguin trobables (Findable), accessibles (Accessible), interoperables (Interoperable) i reutilitzables (Reusable).
En la clàusula 29.3 del Model Grant Agreement es detallen els requisits legals que han de complir els projectes: 
  • Desenvolupar un Pla de Gestió de Dades - Data Management Plan (DMP).
  • Dipositar les dades de la recerca en un repositori el més aviat possible per garantir a qualsevol persona, el seu accés, mineria, explotació, reproducció i difusió emprant una llicència Creative Commons apropiada.
  • En el mateix dipòsit on es publiquen les dades proporcionar informació sobre les eines i els instruments (programes informàtics, etc.) necessaris per validar els resultats i quan sigui possible, oferir aquestes eines.
Els costos associats amb les dades, incloent la creació del DMP es consideren despeses elegibles en el projecte.

Més informació: 

 

Per a les accions finançades per l'European Research Council (ERC) consulteu:

Excepcions: Seguint els principis de la Comissió "as open as possible, as closed as necessary", es pot excloure la difusió en obert dels resultats del projecte per raons de seguretat, de privacitat, de protecció de dades personals o d'explotació comercial/industrial.  

Més informació:

Amb la finalitat d'impulsar l'accés a les dades d'investigació dels projectes I+D+i finançats, el Plan Estatal de Investigación Científica y Técnica y de Innovación 2017-2020 menciona incloure, amb caràcter optatiu:

Un pla de gestió de dades que s'haurà de dipositar en dipòsits institucionals, nacionals o internacionals un cop finalitzat el projecte i transcorregut el termini establert a les corresponents convocatòries, respectant sempre totes les situacions en les que les dades s'han de protegir per raons de confidencialitat, seguretat, protecció o quan sigui necessari per a l'explotació comercial dels resultats obtinguts.

Publicar dades en accés obert

La col·lecció Research Data d'UPCommons permet publicar, compartir, descriure i llicenciar dades de recerca en obert vinculades a una publicació (article de revista, ...) o a un projecte de recerca (H2020, ...):

  • Les dades publicades a UPCommons han de ser produïdes per la comunitat científica de la UPC.
  • UPCommons permet allotjar dades en qualsevol format. Seguint la política institucional sobre programari lliure, et recomanem que utilitzis formats oberts sempre que sigui possible.
  • A més del handle, UPCommons assigna un DOI a cada dataset.
  • Els fitxers poden tenir una mida màxima de 2GB. Per a fitxers més grans o per publicar diversos fitxers, contacta amb info.bibliotequesupc.edu.

 

Com publicar datasets a UPCommons:

  • A la comunitat Research Data, selecciona Diposita dades de recerca.

Introdueix les metadades:

  • Autor/s de les dades.

  • Departament/s i grup/s de recerca dels autor/s.

  • Títol, descripció i paraules-clau del dataset.

  • Any de creació.

  • Software per consultar les dades, si s'escau.

  • Codi de l'entitat finançadora o títol de la publicació associada a les dades.

  • Informació sobre llicències.

Amb cada dataset:

  • Afegiu un fitxer readme amb informació sobre les dades de recerca. El fitxer s'ha de guardar amb el nom "README_títol del dataset.txt".

La publicació no és immediata. Abans de fer-les públiques, els bibliotecaris revisen les metadades.

 

 Abans de publicar les dades de recerca:

  • Comprova que ets titular dels drets de difusió de les dades. Si no és així, necessites un permís de re-ús de les dades per part dels titulars d'aquestes.

  • Assegura't que les dades que vols publicar no estan subjectes a cap restricció per qüestions de confidencialitat, privacitat o copyright. Si les dades fan referència a persones (enquestes, ...), s'han de publicar anonimitzades o disposar del consentiment explícit de les persones que hi han participat. Per a més informació consulta els apartats: Drets d'autoria i Llicències.

 

A l'hora de triar un dipòsit on allotjar les dades, tingues en compte si el dipòsit:

  • Coincideix amb la disciplina de les dades del projecte.
  • La capacitat d'emmagatzematge és suficient.
  • Permet dipositar en el format desitjat i les diferents versions d'un mateix arxiu.
  • Es poden enllaçar les dades a les publicacions associades.
  • Disposa d'una política de preservació: còpies de seguretat, terminis de conservació, etc. 
  • Garanteix la interoperabilitat amb OpenAIRE, si les dades són d'un projecte europeu
  • Disposa d'un identificador persistent i únic (DOI o URN) per a cada conjunt de dades.
  • El dipòsit segueix directrius i certificacions de qualitat de dades com ara, ISO, DINI, Data Seal of Approval.
  • Les dades són fàcilment recuperables.
  • Permet escollir entre diferents llicències d'ús.
  • Permet la restricció d'accés a les dades (tancades, restringides o establir un període d'embargament).
  • Quins són els costos associats a l'ús del dipòsit.

El directori re3data.org et permet seleccionar entre molts dipòsits segons l'àmbit temàtic, la tipologia de dades, etc. 

També pots buscar repositoris de dades segons els principals àmbits de coneixement de la UPC:
Aeronàutica i espai Edificació Enginyeries Enginyeria química
Arquitectura Energies Enginyeria de la telecomunicació Física
Ciències de la salut Enginyeria agroalimentària Enginyeria dels materials Informàtica
Ciències de la visió Enginyeria biomèdica Enginyeria elèctrica Matemàtiques
Economia i organització d'empreses Enginyeria civil Enginyeria mecànica Urbanisme

 

  • Zenodo: dipòsit de dades de recerca desenvolupat pel CERN en el marc del projecte OpenAIRE. Si no trobes cap dipòsit que encaixi amb el teu projecte, pots utilitzar repositoris multidisciplinars.
  • Eudat (European Data Insfrastucture): projecte multi-institucional finançat pel programa H2020 de la UE.

 

Per a més informació consulta la taula comparativa dels dipòsits multidisciplinars.

 

Durant la recerca, et recomanem que organitzis i documentis les dades que generis i les preservis durant el període que estableixis, per exemple, entre 5 i 10 anys. Compartir les dades amb altres investigadors dipositant‐les en repositoris d’accés obert, comporta beneficis per a:

L’investigador i la seva institució:

  •    Emmagatzematge segur a llarg termini.
  •    Poder demostrar els resultats de la investigació.
  •    Fer visibles les dades i poder-les citar.
  •    Permetre la reutilització de les dades.
  •    Augmentar  les citacions i per tant l’impacte de la investigació.
  •    Establir col∙laboracions sobre temes relacionats.

Per a les entitats finançadores:

  •    Tenir localitzades les dades de la recerca finançada.
  •    Evitar duplicitats en la recollida de dades.
  •    Fer un ús més eficient de la recerca finançada amb fons públics.
  •    Augmentar el retorn de la inversió promovent la reutilització de dades.

Per a la ciència i la societat:

  •    Maximitzar la transparència.
  •    Millorar la qualitat en la verificació, la replicació i la confiança.
  •    Promoure la innovació a través de nous usos de les dades.
  •    Augmentar el valor social de la recerca.
  •    Complir amb els mandats a favor de l’accés obert.

Drets i llicències

Tal com es recull a les Recomanacions de la guia de publicacions de continguts docents (UdG):

"No disposen de protecció les informacions o dades en brut, com pot ser una llista de dades demogràfiques, un conjunt de registres meteorològics o una relació de coordenades UTM, si bé la seva incorporació o representació per mitjà d’una base de dades, o d’un plànol, o la seva presentació i interpretació en el marc d’un treball de recerca mereixeran protecció pel valor afegit que aquests materials o estudis proporcionen. Es reconeixen drets a aquests productes o estudis, però no a la informació que ha servit de base per elaborar-los".

Tot i que les dades en brut no tenen autoria i, per tant, no són objecte de propietat intel·lectual, cal tenir en compte que sí que ho són les bases de dades on aquestes apareixen. Tal i com estableix l'article 133 de la Llei de propietat intel·lectual i la Llei 5/1998 de 6 de març, d’incorporació al Dret espanyol de la Directiva 96/9/CE, del Parlament Europeu i del Consell, d’11 de març de 1996, sobre la  protecció jurídica de les bases de dades:

  • El dret "sui generis" sobre una base de dades protegeix la inversió substancial, avaluada qualitativa o quantitativament, que realitza el seu fabricant ja sigui de mitjans financers, inversió de temps, esforç, energia o altres de natura similar, per a l'obtenció, verificació o presentació del seu contingut.
  • Mitjançant aquest dret, el fabricant d'una base de dades pot prohibir l'extracció i/o reutilització de la totalitat o d'una part substancial del seu contingut sempre i quan l'obtenció, la verificació o la presentació d'aquest contingut representi una inversió substancial des del punt de vista quantitatiu o qualitatiu. Aquest dret podrà transferir-se, cedir-se o donar-se en llicència contractual.
  • Tampoc s'autoritza l'extracció i/o reutilització repetida o sistemàtica de parts no substancials del contingut de la base de dades, que suposin actes contraris a una explotació normal de la mateixa o que causin un perjudici injustificat als interessos legítims del seu fabricant.
  • El dret "sui generis" sobre la base de dades s'aplica sense perjudici dels possibles drets existents sobre el seu contingut (drets d'autor de les obres incloses o altres).

Per tant, la reutilització de dades pròpies o de tercers comporta la consideració dels següents aspectes:

  • Qui és el propietari de les dades?
  • Les dades es troben a una base de dades objecte de protecció?
  • Tens permisos per preservar les dades i permetre la seva reutilització?
  • Hi ha restriccions sobre les dades de tercers?
  • Existeix algun període d'embargament que limiti l'accés obert de les dades?
  • Quines llicències farà servir per facilitar la reutilització de les pròpies dades?

Tal i com recull la Comissió Europea al document Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020:

"as far as possible, projects must then take measures to enable for third parties to access, mine, exploit, reproduce and disseminate (free of charge for any user) this research data. One straightforward and effective way of doing this is to attach Creative Commons Licence (CC-BY or CC0 tool) to the data deposited (http://creativecommons.org/licenses/)."

     

 

Cal tenir en compte que les llicències de domini públic són el mitjà per oferir les dades de la forma més oberta possible ja que el llicenciador renuncia a tots els drets (fins on és possible amb la llei vigent aplicable).

També s'ha de considerar que la versió 4.0 de les llicències Creative Commons presenta algunes millores que poden ser d'interès en el cas de les dades de recerca:

  • Bases de dades: cobertura del dret "sui generis" de les bases de dades, excepte exclusió explícita del llicenciador.
  • Autoria: milllora dels procediment amb què un autor pot demanar la no menció de la seva autoria, tant en les reproduccions de la seva obra com en les obres derivades de la mateixa. A més, els usuaris de les obres poden reconèixer l'autoria de les obres emprades mitjançant un enllaç a una pàgina web on es detalli aquesta informació.
  • Interoperabilitat: maximització de la interoperabilitat entre les llicències CC i altres llicències.
  • Altres: "What’s New in 4.0".

Alex Ball, membre del Digital Curation Centre, ha elaborat la guia How to License Research Data, document que recull diversos aspectes que cal considerar quan s'atorga una llicència a les dades de recerca:

  • La majoria de projectes poden fer servir les llicències estàndards com les Creative Commons o Open Data Commons, però també es pot fer una llicència personalitzada segons la casuística de dades i sempre que es disposi de l'assessorament de professionals.
  • En casos en què cap de les llicències existents sigui plenament satisfactòria, es pot optar per la concessió de diverses llicències ("multiple licensing").
  • Les llicències Creative Commons tracten els datasets i les bases de dades com a conjunt, però no les dades individuals incloses (diferenciades de la bases de dades o col·lecció). Això pot resultar dificultós en alguns casos complexos, com les col·leccions de diverses obres objecte de drets d'autor.
  • Les bases de dades estan incloses entre les obres que es poden oferir en domini públic mitjançant la llicència CC0. En relació a les llicències Creative Commons restants, es recomana emprar la versió 4.0.
  • Existeixen altres llicències, en el marc del projecte Open Data Commons, que són específiques per a les bases de dades:
    • Open Data Commons Attribution License (ODC-BY): Llicència que permet a tercers copiar, distribuir i usar la base de dades, així com emprar-la per crear-ne nous continguts, bases de dades o col·leccions de bases de dades (sempre i quan es citi la base de dades original).
    • Open Data Commons Database License (ODbL): És la mateixa llicència que la ODC-BY però, en el cas de que es facin noves bases de dades derivades (no col·leccions de bases de dades ni altres possibles continguts derivats), cal atorgar-hi la mateixa llicència que la base de dades original. També permet l'aplicació de la tecnologia Digital Rights Management (DRM), tant a la base de dades original com a la derivada, sempre i quan s'ofereixi alternativament una còpia de la base de dades sense restriccions.
    • Open Data Commons Public Domain Dedication and License (PDDL): Llicència semblant a la CC0, però redactada específicament per a les bases de dades. Permet copiar, distribuir i usar la base de dades, així com crear-ne obres i bases de dades derivades, sense cap altra restricció.

Tal com es recull als preàmbuls d'aquestes llicències Open Data Commons:

  • ODC-BY i ODbL només abasten els drets sobre la base de dades, no sobre els continguts de la mateixa (imatges, material audiovisual, etc.). En aquest cas, els llicenciadors hauran d'emprar ODbl conjuntament amb altres llicències.
  • En canvi, PDDL es pot emprar per a les bases de dades o per als seus continguts (dades), tant de forma conjunta com individual.

Aspectes ètics i citació

Els aspectes ètics afecten les dades que es poden mostrar, el temps i l'anonimat de les persones implicades, respectant la dignitat i la integritat per garantir la privacitat i la confidencialitat.

Cal tenir en compte:

Per citar correctament les dades de recerca, segueix les pautes.

 

 


Darrera actualització: 02/10/2019