Saltar al contenido principal.

Escudo de la Junta de Castilla y León; Página de inicio

  • Suscripción por correo electrónico a noticias publicadas de Datos Abiertos
  • Contacto

Datos Abiertos de Castilla y León

Contenido principal. Saltar al inicio.

Buenas prácticas

A continuación se destacan las principales buenas prácticas que se han llevado a cabo en el portal de Datos Abiertos de la Junta de Castilla y León.

Publicar datos en formatos abiertos y estándares

Los conjuntos de datos expuestos para su reutilización pueden ser de dos tipos: datos en crudo o ficheros estáticos, que incluyen los datos en formato XML, CSV, etc., y datos “Linked Data”, expresados semánticamente siguiendo los principios de la Web Semántica o Web 3.0. Todos los conjuntos de datos del portal se ofrecen en formatos cien por cien estándar como los mencionados

Usar esquemas y vocabularios consensuados
  • En el portal de datos abiertos de la Junta de Castilla y León se apuesta por la reutilización y estandarización de vocabularios, de modo que siempre que es posible se utilizan vocabularios “oficiales” definidos previamente.
  • Para todos aquellos conjuntos de datos para los que todavía no se han desarrollado vocabularios “oficiales” se utilizan esquemas propios, aplicables a casi todos los casos y que recogen toda la información relevante en cada tipo de contenido, así como las relaciones que puedan darse entre ellos. Este catálogo de vocabularios propios se encuentran perfectamente descritos dentro del portal, permitiendo al usuario descargar documentos adicionales que expliquen al detalle los esquemas utilizados, lo que simplifica en gran medida su uso.
  • En la Junta de Castilla y León se ha apostado por realizar un esfuerzo en este sentido, que facilite al máximo la tarea al usuario y le permita una reutilización mucho más ágil.
Catálogo de datos bien estructurado
  • Para la gestión óptima de la información es necesario establecer un catálogo donde cada conjunto de datos (dataset) esté perfectamente definido mediante una ficha que recoja de forma estructurada toda la información relevante al mismo. De esta forma se facilita el acceso y la visualización de la información por parte de los agentes reutilizadores.
  • A través de estas fichas se puede acceder a cualquier información sobre los diferentes conjuntos de datos del catálogo, tal como la descripción, licencia, catalogación, frecuencias de actualización, formatos disponibles etc. Con este esquema de trabajo la Junta de Castilla y León facilita el uso de buscadores, la correcta clasificación de los datos y la creación de relaciones entre los propios conjuntos de datos.
  • Dentro de este esquema de trabajo se ha desarrollado un mecanismo para relacionar entradas del catálogo con otras que estén relacionadas entre sí por algún motivo. También se incorporan enlaces a portales web, facilitando la comprensión tanto por parte del agente reutilizador, como del ciudadano medio.
  • Por último, indicar que el catálogo de datos del portal se ofrece en formato DCAT, estándar utilizado a nivel nacional en la NTI y a nivel Europeo para la publicación de conjuntos de datos en el sector público.
Estructura de URI’s amigables, persistente y extensible
  • En el desarrollo del portal de datos abiertos de la Junta de Castilla y León se marcó como objetivo disponer de un esquema de URIs (Identificadores Uniformes de Recursos, en inglés Uniform Resource Identifiers) estable, persistente y extensible, de forma que se proporcione la base mínima necesaria para habilitar el mecanismo de Reutilización de la Información Pública en el Gobierno de Castilla y León.
     
  • Con la creación del esquema de URIs lo que se pretende es proporcionar un conjunto de identificadores comunes para los datos, de forma que se pueda hacer referencia a estos de forma única y fiable, requisito clave para facilitar su posterior reutilización.
     
  • La decisión de utilizar URIs en nuestro sistema se debe a que nos proporcionarán el mecanismo necesario para identificar de forma unívoca cualquier recurso y, al mismo tiempo, respetar los principios de la arquitectura de la World Wide Web, ya que constituyen parte activa de la misma. 
  • Algunas de las características deseadas, recogidas en las buenas prácticas para la utilización de URIs en la Web Semántica y que se han seguido a la hora de diseñar el esquema de URIs son las siguientes:
    • Utilizar siempre el protocolo HTTP para garantizar que los URIs pueden ser resueltas.
    • Utilizar una estructura de URIs consistente, extensible y persistente.
    • Crear URIs que, en la medida de lo posible, sean comprensibles y significativas.
    • No exponer información sobre la implementación técnica de los URIs (por ejemplo no utilizar las extensiones correspondientes a tecnologías como .php, .jsp, etc.)
       
  • Además, debido a las características específicas del proyecto, es necesario diseñar un esquema compatible con la implantación y la continuidad del mismo. Bajo este esquema, todos los URIs tendrán una estructura uniforme, que ofrecerá coherencia al sistema de representación de los recursos, cubrirá los principios básicos de construcción de las mismas y contendrá información intuitiva sobre la procedencia de la información.
     
  • Los URIs están formados básicamente por un dominio y una ruta, que a su vez está compuesta por distintas variables, que se detallan a continuación:
    • Tipo de URI: Identificará el tipo de un URI. Sus posibles valores serán:
      • Set – Identifica la URI a la ficha de un dataset.
      • Risp – Identifica URI’s de descarga de datos.
      • Voc – Identifica URI’s de vocabularios
      • Kos – Identifica URI’s de esquemas.
    • Idioma: Se incluyen las siglas de los diferentes idiomas en los que se ofrecen los datos.
    • Sector: Pretende ahondar en la temática relativa al recurso que se representa.
    • Conjunto de datos concreto: Cada uno de los sectores puede tener varios conjuntos de datos públicos. Para identificar estos conjuntos de datos específicos, se indicará un título descriptivo que haga referencia al conjunto de datos en cuestión, junto con un identificador único.
    • Formato: Extensión del conjunto de datos a descargar. Solo para las URIs de descarga.
Implicación de toda la organización
  • En el proyecto de datos abiertos de la Junta de Castilla y León se hace un gran esfuerzo por publicar los conjuntos de datos de mayor interés para su reutilización.
  • No obstante, se trata de un proyecto vivo, en constante actualización y renovación, de modo que desde su nacimiento en el 2012, ha sido constante la publicación de nuevos conjuntos de datos de interés.
  • Además, cualquier agente reutilizador puede solicitar los datos que considere necesarios para desarrollar su proyecto a través del formulario de Solicitud de apertura de datos
Compromiso de servicio, actualización y calidad del dato

Desde la Junta de Castilla y León se mantiene un claro compromiso para mantener la calidad y disponibilidad del servicio, así como la constante actualización del portal y del número de conjuntos de datos publicados en él.

Datos bajo condiciones de uso no restrictivas y comunes

La Junta de Castilla y León publica información de forma libre (sin restricciones de copyright, patentes u otros mecanismos de control) para que sea reutilizada, permitiendo que cualquier persona u organización pueda construir sobre ellos una nueva idea que resulte en nuevos datos, conocimientos, mejorar procesos, dar valor añadido a los existentes o incluso crear nuevos servicios.

Implicación de la ciudadanía
  • La Junta de Castilla y León está trabajando en la difusión de la cultura de datos abiertos, tanto con empresas del ámbito tecnológico como en la comunicación y charlas con centros formativos de la Comunidad.
  • Asimismo ha participado en diversas conferencias de ámbito nacional para compartir su experiencia