Los datos pueden ser estadísticas, resultados de experimentos, medidas, observaciones resultantes del estudio de campo, de encuestas o de entrevistas e imágenes.
Los principios de datos FAIR, siglas en inglés de (Findable, Acesible, Iinteroperable, Reusable - Trobables, Acesibles, Iinteroperables y Reusables), publicados por primera vez en Datos científicos en 2016, son un conjunto de características que deben tener los objetos de datos (metadatos y datos), para poder ser recuperables y reutilizables por el ser humano y las máquinas.
Datos abiertos y datos FAIR:
Los datos abiertos pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona. Se encuentran sujetos, cuanto más, al requerimiento de atribución y de compartirse de la misma forma que aparecen. Fuente: Manual de datos abiertos
En cambio, por razones de seguridad, privacidad, protección de datos personales o de explotación comercial/industrial y siguiendo los principios de la Comisión Europea "as open as posible, as closed as necessary" los datos FAIR no tienen por qué ser abiertos pero sí los metadatos bajo una CCO o equivalente, en la medida en que se salvaguarden los intereses o limitaciones legítimas.
Agentes implicados
El personal investigador, los responsables de los repositorios y curadores de datos son claves para hacer posible estos principios.
Para el cumplimiento de los principios FAIR, deposite los datos de investigación en un repositorio de confianza como CORA-RDR y rellene tantos metadatos como sea posible con información de su dataset para que pueda ser encontrable fácilmente.
Cómo hacer que los datos de investigación sean Aaccesible
A1 Los metadatos se pueden recuperar por su identificador mediante un protocolo de comunicación estandarizados
A1.1 los protocolos deben ser abiertos, gratuitos y universalmente implementables.
A1.2 Cuando sea necesario por razones de privacidad, seguridad o intereses comerciales, el protocolo permitirá un sistema de autenticación y autorización a los datos
A2 Los metadatos deben ser accesibles incluso cuando los datos ya no están disponibles
R1 Los metadatos se describen con una pluralidad de atributos precisos y relevantes
R1.1 Publicar datos y metadatos con una licencia de uso clara y accesible
R1.2 Utilizar criterios de procedencia (creación, atribución e historial de versiones) para asociar los metadatos a los datos durante su ciclo de vida
R1.3 Los estándares de datos y metadatos utilizados cumplen con los estándares comunes del área de conocimiento a que se refieren los datos
Consejos para el desempeño R1
Este concepto está relacionado con el principio F1 pero focalizado en cómo hace la búsqueda el usuario para decidir si los datos son de su interés
Describe el alcance de tus datos: ¿con qué fin se recogieron?
Cita limitaciones sobre los datos que otros deberían conocer
Especifica la fecha de generación/recogida de los datos, condiciones de laboratorio, quien preparó los datos, el nombre y la versión del software utilizado
¿Los datos son en bruto o procesados?
Consejos para el desempeño R1.2
Para que otros puedan reutilizar sus datos deben saber de dónde provienen, indicando esta información en R1
A quién citar y/o cómo desea que le reconozcan. Incluya una descripción del flujo de trabajo que llevó a sus datos: ¿quién los generó o recogió? ¿Cómo se ha procesado? ¿Se ha publicado antes?
¿Contiene datos de otra persona que ha transformado o completado?
Utiliza el programa desarrollado por EN (Data Archiving and Networked Services) y responde a las 12 preguntas del formulario para saber si tus datos son FAIR
El personal investigador de la UPC puede publicar conjuntos de datos de investigación en modalidad FAIR de acuerdo con las directrices delESC.
El CSUCA y el CORA-RDR son proveedores oficiales de servicios dentro del EOSC, contribuyendo activamente al avance de la investigación, impulsando la reutilización de datos y promocionando los valores de la ciencia abierta en beneficio de la comunidad científica en general.
Antes de publicar el primer dataset en CORA-RDR es necesario registrarse siguiendo estas instrucciones e informe a info.biblioteques@upc. Edu para asignarle permisos de publicación.
La publicación no es inmediata. Los curadores de datos de las bibliotecas de la UPC revisan los metadatos antes de publicar el dataset.
Antes de publicar verifique que los datos siguen los principios FAIR
Puede verificar con la guía rápida si dispone de toda la información de los datos para seguir los principios FAIR.
UPCommons
Se recomienda depositar datasets en UPCommons sólo si en su DMP ha indicado UPCommons como repositorio o bien los datasets forman parte de un proyecto que ya contiene datasets en UPCommons.
La colección Research fecha d'UPCommons permite publicar, compartir, describir y llicenciar datos de investigación FAIR vinculados a una publicación oa un proyecto de investigación:
Los datos publicados en UPCommons deben ser producidos por la comunidad científica de la UPC.
UPCommons permite alojar datos en cualquier formato. Siguiendo la política institucional sobre software libre, Te recomendamos que utilices formatos abiertos siempre que sea posible.
Además del handle, UPCommons asigna un DOI a cada dataset.
Los ficheros pueden tener un tamaño máximo de 2GB. Para archivos mayores o para publicar varios archivos, contacta con info.bibliotequesupc.edu.
Como publicar datasets a UPCommons:
En la comunidad Research fecha, Selecciona Deposita datos de investigación.
Introduce los metadatos:
Autor/es de los datos.
Departamento/s y grupo/s de investigación del autor o autores.
Título, descripción y palabras clave del dataset.
Año de creación.
Software para consultar los datos, en su caso.
Código de la entidad financiadora o título de la publicación asociada a los datos.
Información sobre licencias.
Con cada dataset:
Añadir un archivo readme con información sobre los datos de investigación. El archivo se guardará con el nombre "Readme_títol del dataset.txt".
Descárguese las plantillas y con el botón derecho del ratón haga "Guardar enlace como".
La publicación no es inmediata. Antes de hacerlas públicas, los bibliotecarios revisan los metadatos.
Antes de publicar datos de investigación:
Comprueba que eres titular de los derechos de difusión de los datos. Si no es así, necesita un permiso de re-uso de los datos por parte de los titulares de estas.
Asegúrate que los datos que quieres publicar no están sujetos a ninguna restricción por cuestiones de confidencialidad, privacidad o copyright. Si los datos se refieren a personas (encuestas, ...), se publicarán anonimizados o debes disponer del consentimiento explícito de las personas que han participado. Para más información consulta los apartados: Copyright y Licencias.
Zenodo: depósito de datos de investigación desarrollado por el CERN en el marco del proyecto OpenAIRE. Si no encuentras ningún depósito que encaje con tu proyecto, puedes utilizar repositorios multidisciplinares.
Eudat (European Data Insfrastucture): proyecto multi-institucional financiado por el programa H2020 de la UE.
Durante la búsqueda, te recomendamos que organices y documentes los datos que generes y los guardes durante el período que establezcas, por ejemplo, entre 5 y 10 años. Compartir los datos con otros investigadores depositándolos en repositorios de acceso abierto, conlleva beneficios para:
El investigador y su institución:
Almacenamiento seguro a largo plazo.
Poder demostrar los resultados de la investigación.
Hacer visibles los datos y poder citar.
Permitir la reutilización de los datos.
Aumentar las citaciones y por tanto el impacto de la investigación.
Establecer colaboraciones sobre temas relacionados.
Para las entidades financiadoras:
Tener localizados los datos de la investigación financiada.
Evitar duplicidades en la recogida de datos.
Hacer un uso más eficiente de la investigación financiada con fondos públicos.
Aumentar el retorno de la inversión promoviendo la reutilización de datos.
Para la ciencia y la sociedad:
Maximizar la transparencia.
Mejorar la calidad en la verificación, la replicación y la confianza.
Promover la innovación a través de nuevos usos de los datos.
Aumentar el valor social de la investigación.
Cumplir con los mandatos a favor del acceso abierto.
De acuerdo con lo General Modelo Grant Agreement (Anexo 5, artículo 17 - Communication, Dissemination, Open Science and visibility), el personal investigador beneficiario de un proyecto debe:
Gestionar los datos de investigación de forma responsable y de acuerdo con los principios FAIR: que se puedan buscar con facilidad, que sean accesibles, interoperables y reutilizables
Asegurar el acceso abierto a los datos vía el repositorio, de acuerdo con el criterio "tan abierto como posible, tan cerrado como necesario" y con una licencia CC-BY o CC-0 o equivalente
Proporcionar información al repositorio sobre los resultados de la investigación y cualquier otra herramienta necesaria para validar los datos
Los metadatos de los datos de investigación deben ser abiertas y con una licencia CC-0 o equivalente
En el marco del Horizonte 2020, la Comisión Europea inició en 2015 el Open Research Data Pilot que requería a los proyectos de unas áreas concretas, la elaboración de un plan de gestión de datos y la publicación en acceso abierto de los datos.
Desde el 2017, el Open Research Data Pilot se ha extendido a todas las áreas de los proyectos financiados por el H2020 y, por tanto, requiere la publicación en abierto de los datos en todos los proyectos. Además, es necesario que los datos sean FAIR, es decir que sean localizables (Findable), accesibles (Accessible), interoperables (Interoperable) y reutilizables (Reusable).
En la cláusula 29.3 del Modelo Grant Agreement se detallan los requisitos legales que deben cumplir los proyectos:
Depositar los datos de la investigación en un repositorio lo antes posible para garantizar a cualquier persona, su acceso, minería, explotación, reproducción y difusión utilizando una licencia Creative Commons apropiada.
En el mismo depósito donde se publican los datos proporcionar información sobre las herramientas y los instrumentos (programas informáticos, etc.) necesarios para validar los resultados y cuando sea posible, ofrecer estas herramientas.
Los costes asociados con los datos, incluyendo la creación del DMP se consideran gastos elegibles en el proyecto.
Excepciones: Siguiendo los principios de la Comisión "as open as posible, as closed as necessary", se puede excluir la difusión en abierto de los resultados del proyecto por razones de seguridad, de privacidad, de protección de datos personales o de explotación comercial / industrial .
Un plan de gestión de datos que deberá depositarse en repositorios institucionales, nacionales o internacionales una vez finalizado el proyecto y transcurrido el plazo establecido en las correspondientes convocatorias, respetando siempre todas las situaciones en las que los datos se deben proteger por razones de confidencialidad, seguridad, protección o cuando sea necesario para la explotación comercial de los resultados obtenidos.
Los datos asociados al artículo (supplementary fecha) en un repositorio de datos temático o multidisciplinar como CORA-RDR. Más información sobre cómo publicar datasets en CORA-RDR.
Derechos y licencias de los datos de investigación
"No disponen de protección las informaciones o datos en bruto, como puede ser una lista de datos demográficos, un conjunto de registros meteorológicos o una relación de coordenadas UTM, si bien su incorporación o representación por medio de una base de datos, o de un plano, o su presentación e interpretación en el marco de un trabajo de investigación merecerán protección por el valor añadido que estos materiales o estudios proporcionan. Se reconocen derechos a estos productos o estudios, pero no a la información que ha servido de base para su elaboración ".
El derecho "sui generis" sobre una base de datos protege la inversión sustancial, evaluada cualitativa o cuantitativamente, que realiza su fabricante ya sea de medios financieros, inversión de tiempo, esfuerzo, energía u otros de naturaleza similar, para la obtención, verificación o presentación de su contenido.
Mediante este derecho, el fabricante de una base de datos puede prohibir la extracción y / o reutilización de la totalidad o de una parte sustancial de su contenido siempre y cuando la obtención, la verificación o la presentación de este contenido represente una inversión sustancial desde el punto de vista cuantitativo o cualitativo. Este derecho podrá transferirse, cederse o darse en licencia contractual.
Tampoco se autoriza la extracción y/o reutilización repetida o sistemática de partes no sustanciales del contenido de la base de datos, que supongan actos contrarios a una explotación normal de la misma o que causen un perjuicio injustificado a los intereses legítimos de su fabricante.
El derecho "sui generis" sobre la base de datos se aplica sin perjuicio de los posibles derechos existentes sobre su contenido (derechos de autor de las obras incluidas u otros).
Por tanto, la reutilización de datos propios o de terceros conlleva la consideración de los siguientes aspectos:
¿Quién es el propietario de los datos?
¿Los datos se encuentran en una base de datos objeto de protección?
¿Tienes permisos para preservar los datos y permitir su reutilización?
¿Hay restricciones sobre los datos de terceros?
¿Existe algún periodo de embargo que limite el acceso abierto de los datos?
¿Qué licencias utilizará para facilitar la reutilización de los propios datos?
"as far as possible, projects must then take measures to enable for third parties to access, mine, exploit, reproduce and disseminate (free of charge for any user) this research data. One straightforward and effective way of doing this is to attach Creative Commons LicenceCC-BY or CC0 tool) to the data deposited (http://creativecommons.org/licenses/). "
Hay que tener en cuenta que las licencias de dominio público son el medio para ofrecer los datos de la forma más abierta posible ya que el llicenciador renuncia a todos los derechos (hasta donde es posible con la ley vigente aplicable).
También se debe considerar que la versión 4.0 de las licencias Creative Commons presenta algunas mejoras que pueden ser de interés en el caso de los datos de investigación:
Bases de datos: cobertura del derecho "sui generis" de las bases de datos, excepto exclusión explícita del licenciador.
Autoría: mejora los procedimiento con que un autor puede pedir la no mención de su autoría, tanto en las reproducciones de su obra como en las obras derivadas de la misma. Además, los usuarios de las obras pueden reconocer la autoría de las obras utilizadas mediante un enlace a una página web donde se detalle esta información.
Interoperabilidad: maximización de la interoperabilidad entre las licencias CC y otras licencias.
Alex Ball, miembro del Digital Curation Centre, ha elaborado la guía Cómo License Research Data, Documento que recoge varios aspectos a considerar cuando se otorga una licencia a los datos de investigación:
La mayoría de proyectos pueden utilizar las licencias estándares como las Creative Commons o Open Data Commons, pero también se puede hacer una licencia personalizada según la casuística de datos y siempre que se disponga del asesoramiento de profesionales.
En el caso que ninguna de las licencias existentes sea plenamente satisfactoria, se puede optar por la concesión de varias licencias ( "multiple licensing").
Las licencias Creative Commons tratan los datasets y las bases de datos como conjunto, pero no los datos individuales incluidas (diferenciadas de la bases de datos o colección). Esto puede resultar dificultoso en algunos casos complejos, como las colecciones de varias obras objeto de derechos de autor.
Las bases de datos están incluidas entre las obras que se pueden ofrecer en dominio público mediante la licencia CC0. En relación a las licencias Creative Commons restantes, se recomienda emplear la versión 4.0.
Existen otras licencias, en el marco del proyecto Open Data Commons, que son específicas para las bases de datos:
Open Data Commons Attribution License (ODC-BY): Licencia que permite a terceros copiar, distribuir y usar la base de datos, así como utilizarla para crear nuevos contenidos, bases de datos o colecciones de bases de datos (siempre y cuando se cite la base de datos original ).
Open Data Commons Database License (ODbL)Es la misma licencia que la ODC-BY pero, en el caso de que se hagan nuevas bases de datos derivados (no colecciones de bases de datos ni otros posibles contenidos derivados), debe otorgársele la misma licencia que la base de datos original. También permite la aplicación de la tecnología Digital Rights Management (DRM), tanto en la base de datos original como la derivada, siempre y cuando se ofrezca alternativamente una copia de la base de datos sin restricciones.
Open Data Commons Public Domain Dedication and License (PDDL): Licencia parecida a la CC0, pero redactada específicamente para las bases de datos. Permite copiar, distribuir y usar la base de datos, así como crear obras y bases de datos derivados, sin otra restricción.
Tal y como se recoge en los preámbulos de estas licencias Open Data Commons:
ODC-BY i ODbL sólo abarcan los derechos sobre la base de datos, no sobre los contenidos de la misma (imágenes, material audiovisual, etc.). En este caso, los llicenciadors deberán usar ODbl conjuntamente con otras licencias.
En cambio, PDDL se puede emplear para las bases de datos o para sus contenidos (datos), tanto de forma conjunta como individual.
Los aspectos éticos afectan los datos que se pueden mostrar, el tiempo y el anonimato de las personas implicadas, respetando la dignidad y la integridad para garantizar la privacidad y la confidencialidad.
Escribe en la caja de búsqueda el término o términos sobre los que quieres encontrar información. Usa comillas para encontrar frases exactas.
Por defecto la búsqueda utiliza el operador AND, pero puede utilizar otros operadores (NOT y OR).
La búsqueda se hace en los campos: autor, título, materia, palabras claves, abstract, notas, ISSN, ISBN y DOI.
Para afinar los resultados de tu búsqueda, puedes ordenar los registros de la página de resultados y / o seleccionar o desactivar los diferentes filtros.