Implicaciones técnicas de las iniciativas Open Data

Continuamos con el análisis de las Pautas para el desarrollo de políticas Open Data de la Sunlight Foundation, y una vez vistos los aspectos relacionados con la planificación de la iniciativa y los relativos a la preparación de los datos veremos ahora las pautas que conllevarán ciertas implicaciones técnicas.

Cuestiones técnicas

Dado que el objetivo es utilizar Internet como herramienta facilitadora para la transparencia y la reutilización, en estas pautas se recogen algunos de los aspectos técnicos básicos que hay que tener en consideración a la hora de promover una política de datos abiertos eficiente y sostenible desde el plano técnico.

Archivado electrónico

Todavía hoy en día gran parte de los datos de la Administración se generan en formatos no electrónicos quedando así abocados al olvido independientemente de su publicación o no. El archivado electrónico de toda la información debería ser la opción obligatoria por defecto y estar regulado de forma legislativa.

Digitalización y distribución de los materiales históricos

El volumen de datos históricos almacenados a lo largo de los años de forma no digital es sustancialmente mayor que los datos digitalizados disponibles en la actualidad. El valor potencial de dicha información histórica es muy alto, por lo que deben promoverse también políticas específicas para una digitalización progresiva que permita su posterior apertura por medios electrónicos.

Actualización continua y periódica

Los datos son entidades vivas que cambian constantemente y si no se actualizan de forma periódica perderán rápidamente su valor. Los procedimientos e infraestructuras de catalogación e inventariado deberán estar planificadas de forma que la información se pueda actualizar en tiempo real con una periodicidad adecuada para cada caso concreto.

Persistencia

Mantener una alta fiabilidad en los mecanismos de persistencia de los datos que se publiquen será un factor crítico si queremos que se pueda desarrollar un ecosistema capaz de explotar dichos datos. La persistencia tendrá que tenerse especialmente en cuenta en cuanto a los mecanismos de publicación, actualización, versionado y archivado se refiere.

Para conseguir ese objetivo de persistencia en la Web se utiliza el sistema de identificación global denominado URI (Uniform Resource Identifier o Identificador Uniforme de Recursos). Gracias a dicho mecanismo, combinado ciertas buenas prácticas en su uso, conseguiremos fácilmente la persistencia deseada.

Formatos Abiertos

La utilización de formatos abiertos y estándares es un requisito ineludible para garantizar la interoperabilidad de las iniciativas. Si utilizamos formatos propietarios estaremos creando una coraza en torno a los datos que dificultará el posterior acceso a los mismos.

Proporcionar APIs

Proporcionar APIs (Application programming interface o Interfaz de Programación de Aplicaciones) que faciliten el trabajo de aquellos que quieran explotar los datos de forma programática es una buena práctica que sin lugar a dudas facilitará y fomentará la reutilización.

Sin embargo, diseñar APIs útiles para Open Data no es siempre una tarea fácil, ya que, además de las implicaciones técnicas implícitas a cualquier API, para que resulten eficaces dichas APIs deberán ser diseñadas teniendo en cuenta no sólo las necesidades de los desarrolladores, sino también todos los potenciales casos de uso existentes para la explotación.

Es por ello que la existencia de APIs de libre utilización no debería nunca sustituir la publicación de todos los datos en bruto, sino complementarla.

Crear portales específicos Open Data

Los portales Open Data que centralizan el acceso a la información y la complementan proporcionando metainformación y otra documentación relacionada son una herramienta cuyos beneficios para el fomento de la reutilización están ya más que probados. Por ejemplo en España un 45% de los datos reutilizados por las empresas proviene de portales específicos open data.

Además, los portales han ido evolucionando hacia plataformas abiertas completas que recogen también el feedback de los usuarios de los datos, dando así un paso más en la cadena de valor de la transparencia y la reutilización.

Open source

Si bien no es un requisito imprescindible para el fomento de la reutilización de datos, la publicación en formato código abierto de las herramientas que se han utilizado para el desarrollo de las distintas iniciativas sí puede resultar un elemento favorecedor creando un efecto de red que sirva para reducir el nivel de entrada y facilitar la proliferación de nuevas iniciativas que se aprovechen de los recursos proporcionados por las anteriores.