INVESTIGADORES

Datos de investigación FAIR

siguiendo las Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020, la Comisión Europea define los datos de investigación como información factual o numérica, recogida para ser examinada y considerada como la base de un razonamiento, de una discusión o de un cálculo.

Los datos pueden ser estadísticas, resultados de experimentos, medidas, observaciones resultantes del estudio de campo, de encuestas o de entrevistas e imágenes.

 

Principios FAIR

Los principios de datos FAIR, siglas en inglés de (Findable, Acesible, Iinteroperable, Reusable - Trobables, Acesibles, Iinteroperables y Reusables), publicados por primera vez en Datos científicos en 2016, son un conjunto de características que deben tener los objetos de datos (metadatos y datos), para poder ser recuperables y reutilizables por el ser humano y las máquinas.

Datos abiertos y datos FAIR:

  • Los datos abiertos pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona. Se encuentran sujetos, cuanto más, al requerimiento de atribución y de compartirse de la misma forma que aparecen. Fuente: Manual de datos abiertos
  • En cambio, por razones de seguridad, privacidad, protección de datos personales o de explotación comercial/industrial y siguiendo los principios de la Comisión Europea "as open as posible, as closed as necessary" los datos FAIR no tienen por qué ser abiertos pero sí los metadatos bajo una CCO o equivalente, en la medida en que se salvaguarden los intereses o limitaciones legítimas.

Agentes implicados

  • El personal investigador, los responsables de los repositorios y curadores de datos son claves para hacer posible estos principios.
  • Para el cumplimiento de los principios FAIR, deposite los datos de investigación en un repositorio de confianza como CORA-RDR y rellene tantos metadatos como sea posible con información de su dataset para que pueda ser encontrable fácilmente.  

Más información: 

 

Cómo hacer que los datos de investigación sean Finable  

  • F1 Los metadatos deben tener un identificador único globlal y persistente (handle, DOI, ...)
  • F2 Los datos se describen con metadatos enriquecidos
  • F3 Hay un metadato específico para el identificador permanente
  • F4 Los metadatos se registran o indexan en un motor de búsqueda

Consejos para el desempeño de F2

  • Incluir información descriptiva sobre el contexto y/o características de los datos. Más información

Cómo hacer que los datos de investigación sean Aaccesible

    • A1 Los metadatos se pueden recuperar por su identificador mediante un protocolo de comunicación estandarizados
      • A1.1 los protocolos deben ser abiertos, gratuitos y universalmente implementables.
      • A1.2 Cuando sea necesario por razones de privacidad, seguridad o intereses comerciales, el protocolo permitirá un sistema de autenticación y autorización a los datos
    • A2 Los metadatos deben ser accesibles incluso cuando los datos ya no están disponibles

    Más información

    Cómo hacer que los datos sean Ino operable

    • I1 Los metadatos utilizan un lenguaje formal, accesible, compartido y ampliamente aplicable para la representación del conocimiento
    • I2 Los metadatos utilizan un vocabulario FAIR (vocabularios controlados)
    • I3 Los metadatos incluyen referencias calificadas a otros metadatos (publicaciones y materiales relacionados) 

    Más información

    Cómo hacer que los datos sean Reusable

    • R1 Los metadatos se describen con una pluralidad de atributos precisos y relevantes
      • R1.1 Publicar datos y metadatos con una licencia de uso clara y accesible
      • R1.2 Utilizar criterios de procedencia (creación, atribución e historial de versiones) para asociar los metadatos a los datos durante su ciclo de vida
      • R1.3 Los estándares de datos y metadatos utilizados cumplen con los estándares comunes del área de conocimiento a que se refieren los datos

    Consejos para el desempeño R1

    Este concepto está relacionado con el principio F1 pero focalizado en cómo hace la búsqueda el usuario para decidir si los datos son de su interés

    • Describe el alcance de tus datos: ¿con qué fin se recogieron?
    • Cita limitaciones sobre los datos que otros deberían conocer
    • Especifica la fecha de generación/recogida de los datos, condiciones de laboratorio, quien preparó los datos, el nombre y la versión del software utilizado
    • ¿Los datos son en bruto o procesados?

    Consejos para el desempeño R1.2

    • Para que otros puedan reutilizar sus datos deben saber de dónde provienen, indicando esta información en R1
    • A quién citar y/o cómo desea que le reconozcan. Incluya una descripción del flujo de trabajo que llevó a sus datos: ¿quién los generó o recogió? ¿Cómo se ha procesado? ¿Se ha publicado antes?
    • ¿Contiene datos de otra persona que ha transformado o completado?

    Más información

    ¿Quieres saber si tus datos son FAIR?

    • Utiliza el programa desarrollado por EN (Data Archiving and Networked Services) y responde a las 12 preguntas del formulario para saber si tus datos son FAIR

    SATIFYD: herramienta de autoevaluación datos FAIR

    Publicar datos de investigación

    CORA. Repositorio de Datos de Investigación   

    • Se recomienda depositar los datos de investigación en CORA-RDR. Es un trusted repository específico para datos.
    • CORA-RDR es el repositorio de datos de las universidades catalanas y de los centros CERCA.
    • Los metadatos publicados en CORA-RDR se encuentran indexadas y por tanto encontrables en:
    • El personal investigador de la UPC puede publicar conjuntos de datos de investigación en modalidad FAIR de acuerdo con las directrices delESC.
    • El CSUCA y el CORA-RDR son proveedores oficiales de servicios dentro del EOSC, contribuyendo activamente al avance de la investigación, impulsando la reutilización de datos y promocionando los valores de la ciencia abierta en beneficio de la comunidad científica en general.
    • Antes de publicar el primer dataset en CORA-RDR es necesario registrarse siguiendo estas instrucciones e informe a info.biblioteques@upc. Edu para asignarle permisos de publicación. 
    • La publicación no es inmediata. Los curadores de datos de las bibliotecas de la UPC revisan los metadatos antes de publicar el dataset. 
    • Contacte con info.biblioteques@upc. Edu para publicar datasets superiores a 10GB.

    Con cada dataset:

    • Añada un archivo readme con información sobre los datos de búsqueda. El archivo debe guardarse con el nombre "Readme.txt".

    Descárguese las plantillas (utilice el idioma de los datos) y con el botón derecho del ratón haga "Guardar enlace como".

    Antes de publicar verifique que los datos siguen los principios FAIR 

    • Puede verificar con la guía rápida si dispone de toda la información de los datos para seguir los principios FAIR.

     

    UPCommons

    Se recomienda depositar datasets en UPCommons sólo si en su DMP ha indicado UPCommons como repositorio o bien los datasets forman parte de un proyecto que ya contiene datasets en UPCommons.

    La colección Research fecha d'UPCommons permite publicar, compartir, describir y llicenciar datos de investigación FAIR vinculados a una publicación oa un proyecto de investigación:

    • Los datos publicados en UPCommons deben ser producidos por la comunidad científica de la UPC.
    • UPCommons permite alojar datos en cualquier formato. Siguiendo la política institucional sobre software libre, Te recomendamos que utilices formatos abiertos siempre que sea posible.
    • Además del handle, UPCommons asigna un DOI a cada dataset.
    • Los ficheros pueden tener un tamaño máximo de 2GB. Para archivos mayores o para publicar varios archivos, contacta con info.bibliotequesupc.edu.

     

    Como publicar datasets a UPCommons:

    • En la comunidad Research fecha, Selecciona Deposita datos de investigación.

    Introduce los metadatos:

    • Autor/es de los datos.

    • Departamento/s y grupo/s de investigación del autor o autores.

    • Título, descripción y palabras clave del dataset.

    • Año de creación.

    • Software para consultar los datos, en su caso.

    • Código de la entidad financiadora o título de la publicación asociada a los datos.

    • Información sobre licencias.

    Con cada dataset:

    • Añadir un archivo readme con información sobre los datos de investigación. El archivo se guardará con el nombre "Readme_títol del dataset.txt".

    Descárguese las plantillas y con el botón derecho del ratón haga "Guardar enlace como".

    La publicación no es inmediata. Antes de hacerlas públicas, los bibliotecarios revisan los metadatos.

     

    Antes de publicar datos de investigación:

    • Comprueba que eres titular de los derechos de difusión de los datos. Si no es así, necesita un permiso de re-uso de los datos por parte de los titulares de estas.

    • Asegúrate que los datos que quieres publicar no están sujetos a ninguna restricción por cuestiones de confidencialidad, privacidad o copyright. Si los datos se refieren a personas (encuestas, ...), se publicarán anonimizados o debes disponer del consentimiento explícito de las personas que han participado. Para más información consulta los apartados: Copyright y Licencias.

     

    Además de CORA-RDR y deUPCommons, Puedes depositar los datos en otros repositorios. Ten en cuenta los siguientes criterios:

    • La capacidad de almacenamiento es suficiente.
    • Permite depositar en el formato deseado y las diferentes versiones de un mismo archivo.
    • Se pueden enlazar los datos a las publicaciones asociadas.
    • Dispone de una política de preservación: copias de seguridad, plazos de conservación, etc. 
    • Garantiza la interoperabilidad con OpenAIRE si los datos son de un proyecto europeo.
    • Dispone de un identificador persistente y único (DOI o URN) para cada conjunto de datos.
    • El depósito sigue directrices y certificaciones de calidad de datos como, ISO, DINI, Data Seal of Approval.
    • Los datos son fácilmente recuperables.
    • Permite escoger entre diferentes licencias de uso.
    • Permite la restricción de acceso a los datos (cerrados, restringidos o establecer un periodo de embargo).
    • Cuáles son los costes asociados al uso del depósito.
    • La disciplina de los datos del proyecto.

    El directorio re3data.org te permite seleccionar entre muchos depósitos según el ámbito temático, la tipología de datos, etc. 

    También puedes buscar repositorios de datos según los principales ámbitos de conocimiento de la UPC:
    Aeronáutica y espacio Edificación Ingenierías Ingeniería química
    Arquitectura Energías Ingeniería de la telecomunicación Física
    Ciencias de la salud Ingeniería agroalimentaria Ingeniería de los materiales Informática
    Ciencias de la visión Ingeniería biomédica Ingeniería eléctrica Matemáticas
    Economía y organización de empresas Ingeniería civil Ingeniería mecánica Urbanismo

     

    • Zenodo: depósito de datos de investigación desarrollado por el CERN en el marco del proyecto OpenAIRE. Si no encuentras ningún depósito que encaje con tu proyecto, puedes utilizar repositorios multidisciplinares.
    • Eudat (European Data Insfrastucture): proyecto multi-institucional financiado por el programa H2020 de la UE.

     

    Durante la búsqueda, te recomendamos que organices y documentes los datos que generes y los guardes durante el período que establezcas, por ejemplo, entre 5 y 10 años. Compartir los datos con otros investigadores depositándolos en repositorios de acceso abierto, conlleva beneficios para:

    El investigador y su institución:

    •    Almacenamiento seguro a largo plazo.
    •    Poder demostrar los resultados de la investigación.
    •    Hacer visibles los datos y poder citar.
    •    Permitir la reutilización de los datos.
    •    Aumentar las citaciones y por tanto el impacto de la investigación.
    •    Establecer colaboraciones sobre temas relacionados.

    Para las entidades financiadoras:

    •    Tener localizados los datos de la investigación financiada.
    •    Evitar duplicidades en la recogida de datos.
    •    Hacer un uso más eficiente de la investigación financiada con fondos públicos.
    •    Aumentar el retorno de la inversión promoviendo la reutilización de datos.

    Para la ciencia y la sociedad:

    •    Maximizar la transparencia.
    •    Mejorar la calidad en la verificación, la replicación y la confianza.
    •    Promover la innovación a través de nuevos usos de los datos.
    •    Aumentar el valor social de la investigación.
    •    Cumplir con los mandatos a favor del acceso abierto.

    Entidades financiadoras y datos de investigación

    De acuerdo con lo General Modelo Grant Agreement (Anexo 5, artículo 17 - Communication, Dissemination, Open Science and visibility), el personal investigador beneficiario de un proyecto debe: 

    • Gestionar los datos de investigación de forma responsable y de acuerdo con los principios FAIR: que se puedan buscar con facilidad, que sean accesibles, interoperables y reutilizables  
    • elaborar un Plan de Gestión de Datos (PDG), actualizándolo periódicamente. 
    • Depositar los datos en un repositorio de confianza tan pronto como sea posible
    • Asegurar el acceso abierto a los datos vía el repositorio, de acuerdo con el criterio "tan abierto como posible, tan cerrado como necesario" y con una licencia CC-BY o CC-0 o equivalente
    • Proporcionar información al repositorio sobre los resultados de la investigación y cualquier otra herramienta necesaria para validar los datos
    • Los metadatos de los datos de investigación deben ser abiertas y con una licencia CC-0 o equivalente
    En el marco del Horizonte 2020, la Comisión Europea inició en 2015 el Open Research Data Pilot que requería a los proyectos de unas áreas concretas, la elaboración de un plan de gestión de datos y la publicación en acceso abierto de los datos.
    Desde el 2017, el Open Research Data Pilot se ha extendido a todas las áreas de los proyectos financiados por el H2020 y, por tanto, requiere la publicación en abierto de los datos en todos los proyectos. Además, es necesario que los datos sean FAIR, es decir que sean localizables (Findable), accesibles (Accessible), interoperables (Interoperable) y reutilizables (Reusable).
    En la cláusula 29.3 del Modelo Grant Agreement se detallan los requisitos legales que deben cumplir los proyectos: 
    • Desarrollar un Plan de Gestión de Datos - Data Management Plan (DMP).
    • Depositar los datos de la investigación en un repositorio lo antes posible para garantizar a cualquier persona, su acceso, minería, explotación, reproducción y difusión utilizando una licencia Creative Commons apropiada.
    • En el mismo depósito donde se publican los datos proporcionar información sobre las herramientas y los instrumentos (programas informáticos, etc.) necesarios para validar los resultados y cuando sea posible, ofrecer estas herramientas.
    Los costes asociados con los datos, incluyendo la creación del DMP se consideran gastos elegibles en el proyecto.

    Más información: 

     

    Para las acciones financiadas por el European Research Council (ERC) consulte:

    Excepciones: Siguiendo los principios de la Comisión "as open as posible, as closed as necessary", se puede excluir la difusión en abierto de los resultados del proyecto por razones de seguridad, de privacidad, de protección de datos personales o de explotación comercial / industrial .  

    Más información:

    Con el fin de impulsar el acceso a los datos de investigación de los proyectos I+D+i financiados, las convocatorias derivadas del Plan Estatal de Investigación Científica y Técnica y de Innovación 2021-2023 menciona incluir:

    Un plan de gestión de datos que deberá depositarse en repositorios institucionales, nacionales o internacionales una vez finalizado el proyecto y transcurrido el plazo establecido en las correspondientes convocatorias, respetando siempre todas las situaciones en las que los datos se deben proteger por razones de confidencialidad, seguridad, protección o cuando sea necesario para la explotación comercial de los resultados obtenidos.

    La Ley 17/2022 de 5 de septiembre de la ciencia, la tecnología y la innovación, en su artículo 37, dispone que el personal investigador que participa en proyectos competitivos nacionales debe depositar:

    • Los datos asociados al artículo (supplementary fecha) en un repositorio de datos temático o multidisciplinar como CORA-RDR. Más información sobre cómo publicar datasets en CORA-RDR.

    Derechos y licencias de los datos de investigación

    Tal como se recoge en las Recomendaciones de la guía de publicaciones de contenidos docentes (UdG):

    "No disponen de protección las informaciones o datos en bruto, como puede ser una lista de datos demográficos, un conjunto de registros meteorológicos o una relación de coordenadas UTM, si bien su incorporación o representación por medio de una base de datos, o de un plano, o su presentación e interpretación en el marco de un trabajo de investigación merecerán protección por el valor añadido que estos materiales o estudios proporcionan. Se reconocen derechos a estos productos o estudios, pero no a la información que ha servido de base para su elaboración ".

    Aunque los datos en bruto no tienen autoría y, por tanto, no son objeto de propiedad intelectual, hay que tener en cuenta que sí lo son las bases de datos donde éstas aparecen. Tal y como establece el artículo 133 de la Ley de propiedad intelectual y la Ley 5/1998 de 6 de marzo, de incorporación al Derecho español de la Directiva 96/9 / CE, del Parlamento Europeo y del Consejo, de 11 de marzo de 1996, sobre la protección jurídica de las bases de datos:

    • El derecho "sui generis" sobre una base de datos protege la inversión sustancial, evaluada cualitativa o cuantitativamente, que realiza su fabricante ya sea de medios financieros, inversión de tiempo, esfuerzo, energía u otros de naturaleza similar, para la obtención, verificación o presentación de su contenido.
    • Mediante este derecho, el fabricante de una base de datos puede prohibir la extracción y / o reutilización de la totalidad o de una parte sustancial de su contenido siempre y cuando la obtención, la verificación o la presentación de este contenido represente una inversión sustancial desde el punto de vista cuantitativo o cualitativo. Este derecho podrá transferirse, cederse o darse en licencia contractual.
    • Tampoco se autoriza la extracción y/o reutilización repetida o sistemática de partes no sustanciales del contenido de la base de datos, que supongan actos contrarios a una explotación normal de la misma o que causen un perjuicio injustificado a los intereses legítimos de su fabricante.
    • El derecho "sui generis" sobre la base de datos se aplica sin perjuicio de los posibles derechos existentes sobre su contenido (derechos de autor de las obras incluidas u otros).

    Por tanto, la reutilización de datos propios o de terceros conlleva la consideración de los siguientes aspectos:

    • ¿Quién es el propietario de los datos?
    • ¿Los datos se encuentran en una base de datos objeto de protección?
    • ¿Tienes permisos para preservar los datos y permitir su reutilización?
    • ¿Hay restricciones sobre los datos de terceros?
    • ¿Existe algún periodo de embargo que limite el acceso abierto de los datos?
    • ¿Qué licencias utilizará para facilitar la reutilización de los propios datos?

    Tal y como recoge la Comisión Europea al documento Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020:

    "as far as possible, projects must then take measures to enable for third parties to access, mine, exploit, reproduce and disseminate (free of charge for any user) this research data. One straightforward and effective way of doing this is to attach Creative Commons LicenceCC-BY or CC0 tool) to the data deposited (http://creativecommons.org/licenses/). "

         

     

    Hay que tener en cuenta que las licencias de dominio público son el medio para ofrecer los datos de la forma más abierta posible ya que el llicenciador renuncia a todos los derechos (hasta donde es posible con la ley vigente aplicable).

    También se debe considerar que la versión 4.0 de las licencias Creative Commons presenta algunas mejoras que pueden ser de interés en el caso de los datos de investigación:

    • Bases de datos: cobertura del derecho "sui generis" de las bases de datos, excepto exclusión explícita del licenciador.
    • Autoría: mejora los procedimiento con que un autor puede pedir la no mención de su autoría, tanto en las reproducciones de su obra como en las obras derivadas de la misma. Además, los usuarios de las obras pueden reconocer la autoría de las obras utilizadas mediante un enlace a una página web donde se detalle esta información.
    • Interoperabilidad: maximización de la interoperabilidad entre las licencias CC y otras licencias.
    • Otros: "What’s New in 4.0".

    Alex Ball, miembro del Digital Curation Centre, ha elaborado la guía Cómo License Research Data, Documento que recoge varios aspectos a considerar cuando se otorga una licencia a los datos de investigación:

    • La mayoría de proyectos pueden utilizar las licencias estándares como las Creative Commons o Open Data Commons, pero también se puede hacer una licencia personalizada según la casuística de datos y siempre que se disponga del asesoramiento de profesionales.
    • En el caso que ninguna de las licencias existentes sea plenamente satisfactoria, se puede optar por la concesión de varias licencias ( "multiple licensing").
    • Las licencias Creative Commons tratan los datasets y las bases de datos como conjunto, pero no los datos individuales incluidas (diferenciadas de la bases de datos o colección). Esto puede resultar dificultoso en algunos casos complejos, como las colecciones de varias obras objeto de derechos de autor.
    • Las bases de datos están incluidas entre las obras que se pueden ofrecer en dominio público mediante la licencia CC0. En relación a las licencias Creative Commons restantes, se recomienda emplear la versión 4.0.
    • Existen otras licencias, en el marco del proyecto Open Data Commons, que son específicas para las bases de datos:
      • Open Data Commons Attribution License (ODC-BY): Licencia que permite a terceros copiar, distribuir y usar la base de datos, así como utilizarla para crear nuevos contenidos, bases de datos o colecciones de bases de datos (siempre y cuando se cite la base de datos original ).
      • Open Data Commons Database License (ODbL)Es la misma licencia que la ODC-BY pero, en el caso de que se hagan nuevas bases de datos derivados (no colecciones de bases de datos ni otros posibles contenidos derivados), debe otorgársele la misma licencia que la base de datos original. También permite la aplicación de la tecnología Digital Rights Management (DRM), tanto en la base de datos original como la derivada, siempre y cuando se ofrezca alternativamente una copia de la base de datos sin restricciones.
      • Open Data Commons Public Domain Dedication and License (PDDL): Licencia parecida a la CC0, pero redactada específicamente para las bases de datos. Permite copiar, distribuir y usar la base de datos, así como crear obras y bases de datos derivados, sin otra restricción.

    Tal y como se recoge en los preámbulos de estas licencias Open Data Commons:

    • ODC-BY i ODbL sólo abarcan los derechos sobre la base de datos, no sobre los contenidos de la misma (imágenes, material audiovisual, etc.). En este caso, los llicenciadors deberán usar ODbl conjuntamente con otras licencias.
    • En cambio, PDDL se puede emplear para las bases de datos o para sus contenidos (datos), tanto de forma conjunta como individual.

    Aspectos éticos y citación

    Los aspectos éticos afectan los datos que se pueden mostrar, el tiempo y el anonimato de las personas implicadas, respetando la dignidad y la integridad para garantizar la privacidad y la confidencialidad.

    Hay que tener en cuenta:

    Para citar correctamente los datos de investigación, sigue las pautas.

     

     


    Última actualización: 25 / 07 / 2024