Skip to main content

Datos de investigación: gestión, datos abiertos...: INTRODUCCION

Guía diseñada para entender qué son los datos de investigación y herramientas para gestionarlos

Introducción

¿Qué son los datos de investigación?

Son "todo aquel material que sirve para certificar los resultados de la investigación que se realiza, que se han registrado durante ella y que se ha reconocido por la comunidad científica" (Torres–Salinas; Robinson–García; Cabezas–Clavijo, 2012), es decir, se trata de cualquier información reunida, utilizada o generada en la experimentación, observación, medición, simulación, cálculo, análisis, interpretación, estudio o cualquier otro proceso de indagación que sustente y justifique las aportaciones científicas que se difunden en las publicaciones de investigación. Se presentan en cualquier formato y soporte, por ejemplo:

  • Archivos numéricos, hojas de cálculo, tablas, etc.
  • Documentos de texto en distintas versiones.
  • Imágenes, gráficos, archivos de audio, vídeo, etc.
  • Código o registros de software, bases de datos, etc.
  • Datos geoespaciales, información georreferenciada.
 

Datos de investigación abiertos

Los datos abiertos son datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos, cuando más, al requerimiento de atribución y de compartirse de la misma manera en que aparecen.

La Royal Society (2012) define los datos abiertos como aquéllos que cumplen ciertos criterios, lo que se llama apertura inteligente/competitiva: son accesibles, usables, evaluados/certificados e inteligibles. Hacerlos disponibles no es siempre equivalente a abierto. La descripción asociada es la que permitirá que puedan ser reutilizados (Fernanda Peset).

Para resumir lo más importante:

  • Disponibilidad y acceso: la información debe estar disponible como un todo y a un costo razonable de reproducción, preferiblemente descargándola de internet. Además, la información debe estar disponible en una forma conveniente y modificable.
  • Reutilización y redistribución: los datos deben ser provistos bajo términos que permitan reutilizarlos y redistribuirlos, e incluso integrarlos con otros conjuntos de datos
  • Participación universal: todos deben poder utilizar, reutilizar y redistribuir la información. No debe haber discriminación alguna en términos de esfuerzo, personas o grupos.
  • Ver: Open Data Handbook en español

    Horizonte 2020. FAIR DATA

    El acrónimo FAIR data agrupa los cuatro principios que le dan significado, referidos a cualidades precisas y medibles debería tener toda publicación formal de datos:

    • Findable: se pueden encontrar, para lo que se acompañan de metadatos que identifican, describen y permiten localizar los datos.
    • Accessible: son accesibles, porque pueden recuperarse mediante protocolos estandarizados de comunicación y los metadatos persisten aun cuando los datos dejen de estar disponibles.
    • Interoperable: son interoperables, esto es, se presentan de forma que resultan aplicables e incluyen referencias a otros datos
    • Reusable: se pueden reutilizar, porque queda clara la procedencia de los datos y las condiciones de su reutilización.

    El interés de la aplicación de estos principios se refleja en su incorporación en el Programa Horizonte 2020 de Investigación e Innovación de la Unión Europea. Con el lema “tan abierto como sea posible, tan cerrado como sea necesario”, se busca equilibrar la apertura de los datos con la protección de la información científica, los derechos de comercialización y propiedad intelectual, la privacidad, la seguridad y cuestiones relativas a la conservación y gestión de los datos.

    Biblioteca de la Universidad de Extremadura