Siguiendo con el análisis de las Pautas para el desarrollo de políticas Open Data de la Sunlight Foundation, y después de repasar aquellas relacionadas con la planificación de la iniciativa, veremos ahora las pautas relacionadas con la selección de datos y su preparación previa a la publicación.
Selección y preparación de los Datos
Una adecuada selección y organización de la información que se va a publicar es también primordial para el éxito de la iniciativa, ya que el valor de una iniciativa Open Data está íntimamente ligado al de los datos expuestos. En las siguientes pautas se repasan algunas claves para realizar esa selección de forma adecuada.
Abierto por defecto
La Administración Pública genera una enorme cantidad de datos en su actividad diaria, pero tan sólo una mínima cantidad de los datos llega finalmente al público general.
Las Administraciones deberían pasar de una política pasiva, en la que es el público quien solicita la información, a una política activa en la que la publicación de toda la información disponible sea siempre la opción por defecto.
Por supuesto, la publicación estará siempre sujeta a las restricciones lógicas impuestas por motivos de seguridad, privacidad, etc.
Una política de apertura de la información por defecto es también un ejercicio lógico de transparencia y mejoraría la eficacia y eficiencia de la Administración en la prestación diaria de servicios a los ciudadanos.
Crear y mantener un inventario de la información disponible
En la gran mayoría de los casos, ni siquiera la propia Administración es consciente de toda la información y los datos que gestiona. Esto supone un problema considerable también de cara al público, ya que si no se es consciente de la existencia de los datos es probable que nunca se lleguen a necesitar.
Realizar un ejercicio previo de inventariado de toda la información existente es un recurso muy útil a la hora de planificar su posterior publicación y recibir feedback sobre el interés de la misma. Para que el inventario sea útil debe incluir una información mínima sobre cada conjunto de datos, tal como una descripción de los datos, la frecuencia aproximada de actualización, las tecnologías y formatos implicados o las posibles restricciones para su reutilización.
Seleccionar datos concretos
Las políticas de publicación de datos abiertos deberían incluir siempre una selección de conjuntos de datos específicos a publicar o, al menos, directrices detalladas para la selección de los datos y no limitarse a promover la publicación de datos prioritarios o datos de alto valor en general, ya que en ese caso se crean vacíos legales que seguro ralentizarán el afloramiento de los datos realmente útiles.
Identificadores únicos
La existencia de identificadores únicos y públicos para cada dato disponible es un requisito imprescindible para el tratamiento automatizado de la información. El diseño de un sistema de identificadores único y persistente que tenga en cuenta la variedad de datos, su ciclo de vida y las posibles modificaciones futuras de los mismos, debería ser considerado como un prerrequisito imprescindible para la publicación, ya que la definición de dicho sistema a posteriori con toda seguridad ocasionará problemas de persistencia y compatibilidad que revertirán en el trabajo de los potenciales reutilizadores.
Metadatos y documentación
Sin metadatos la información perdería gran parte de su valor al resultar mucho más complicada su explotación por ser necesario un tratamiento manual de la misma. Crear un esquema de metadatos extenso y apropiado, documentarlo y publicarlo es fundamental para el éxito de cualquier iniciativa.
Crear procedimientos que aseguren la calidad de los datos
El valor de los datos resulta directamente proporcional a la calidad de los mismos. Es por ello que deben establecerse los mecanismos y procedimientos necesarios para asegurar una mínima calidad de los datos y no confiar esta únicamente al escrutinio público, que si bien se ha comprobado que es un elemento válido para la mejora no debería ser la única herramienta disponible.
Datos en bruto
Independientemente de otras medidas complementarias que se puedan tomar para mejorar y facilitar el acceso a la información, como la publicación de APIs de acceso por ejemplo, siempre es interesante proporcionar como mínimo un acceso abierto y permanente a los conjuntos de datos en crudo (raw data) para garantizar el acceso completo a la información.
Pingback: Políticas Open Data | Carlos Iglesias' Web Whisperer