Los retos pendientes del Open Data en España

Este artículo fue publicado primero en Open Data @ CTIC.

La semana pasada tuvo lugar el encuentro de iniciativas Open Data en España, organizado por el proyecto Aporta, en el que se debatió sobre los desafíos organizativos y técnicos existentes, así como las iniciativas de negocio basadas en Open Data y su potencial como canal de comunicación con el ciudadano.

Gracias a la comunicación surgida entre los participantes de las distintas mesas temáticas, el público y a través también de otros canales como Twitter, pudimos asistir a un interesante debate en el que se repasó el estado general del Open Data en España, así como los principales retos pendientes que ya se vienen debatiendo en la propia comunidad desde hace algún tiempo.

A continuación os exponemos lo que creemos que son las conclusiones más destacadas del encuentro:

El papel de la Administración

La Administración va superando poco a poco su obsesión por la posesión de los datos y ha comenzado a asumir que los datos no le pertenecen y que su papel se limita al de una mera gestora de la información. Pocos dudan ya de que abrir los datos contribuye a mejorarlos, corregir errores, incrementar la interoperabilidad y crear valor añadido gracias a cruzar distintas fuentes de información. El debate dentro de la Administración se centra ahora en otros aspectos, como por ejemplo la preocupación por las posibles consecuencias que deriven del uso de datos que contienen errores y la responsabilidad que eso conlleva.

Debemos tamibén ser cuidadosos con que la Administración no se convierta en un competidor privilegiado de la empresa privada, y para ello no debería encargarse de la explotación directa de los datos, ni de la tecnología necesaria para realizar dicha explotación, sino tan solo de su adecuada exposición al público a través de los medios más convenientes. Sin embargo, esto abre también el debate de hasta qué punto algunos servicios públicos básicos podrían o deberían delegarse en la empresa privada.

Ahora toca afianzar las iniciativas y asegurar su supervivencia para no queden en una mera moda pasajera, incluyendo la apertura de datos como otro nuevo canal permanente de comunicación con el ciudadano y haciendo de la reutilización un valor rentable para todos.

Los aspectos técnicos

Todavía hoy en día se detecta una gran dificultad para ejercer la labor del infomediario, debido principalmente a la baja calidad de los datos y la falta de preparación para su reutilización. La diversidad de vocabularios y la proliferación de formatos difíciles de tratar de forma automatizada consume también una gran parte de los recursos en las iniciativas sin aportar ningún valor añadido.

Existe unanimidad en cuanto a la importancia de la armonización en las iniciativas, la utilización de suficiente metainformación para poder valorar adecuadamente los datos y la creación de estándares al respecto para conseguir unificar y documentar vocabularios en las áreas donde todavía no existen. Con todo ello conseguiríamos que el potencial de reutilización fuese mayor y ampliar el mercado.

Tampoco hay que perder de vista que el Open Data necesita de una aproximación integral, y no únicamente desde una perspectiva técnica. Los retos técnicos son en general menores que los conceptuales, ya que el camino a seguir está hoy en día más claro en la parte técnica con respecto a otros aspectos organizativos, conceptuales, políticos y de evangelización.

Debemos sin embargo también tener en cuenta que, si bien con respecto a la transparencia lo fundamental es el volumen de información abierto, en cuanto a la reutilización es también primordial contar con una buena base tecnológica. Es por ello que resulta muy importante también llegar a un compromiso adecuado entre la inmediatez de las iniciativas raw data y la potencia ofrecida por el Linked Data, llegando a un equilibrio que permita la sostenibilidad a largo plazo.

Por tanto, no podemos obviar los problemas técnicos y debemos darles solución, cuestión que en general no es trivial porque no partimos de cero, sino de sistemas de información pre-existentes que originalmente no estaban pensados para ser expuestos. Esto conlleva un trabajo adicional además de tener que afrontar otros retos relacionados con la automatización de los procesos, la robustez y escalabilidad de los sistemas, la actualización de la información, etc.

El sector de los infomediarios

Si bien la Administración todavía no está completamente preparada para la reutilización, da la impresión de que el sector empresarial tampoco lo está.

El sector de los infomediarios en España está actualmente muy focalizado hacia nichos concretosrelacionados con sectores como geografía, economía, jurídico, consultoría, etc. Se echan en falta nuevas iniciativas que ayuden a ampliar el rango de sectores y abrir nuevas líneas de negocio a partir de los nichos de mercado que quedan todavía por cubrir gracias a la apertura de información y a la transparencia.

Las empresas reutilizadoras juegan un papel fundamental en la cadena de generación de valor y es imprescindible contar con ellas, pero para ello debemos modificar la visión actual del modelo de negocio un tanto anticuada y distinta a la que podemos encontrarnos fuera del país, olvidándonos cuanto antes de vender datos y pasar a vender servicios.

Los dispositivos móviles y la Web única jugarán también un papel importante, no solo como herramientas de consumo, sino también como un medio fundamental de generación de datos por parte de la ciudadanía, pasando esta a desempeñar también un papel activo y no solo como consumidora.

También hay que tener en cuenta que el desarrollo de aplicaciones es tan sólo una parte del potencial delOpen Data, y que existen otras vías de negocio todavía por explorar como la publicidad, los servicios de suscripción, la transformación de los datos, etc.

Finalmente, existen también algunos aspectos que lastran las posibilidad de generación de negocio por parte de los infomediarios, como por ejemplo la falta de definición y claridad en el contexto legal o la posiblidad de que se impongan tasas para el acceso a los datos. Una mayor claridad y unificación en los términos de las licencias y un modelo de retorno de inversión que no se basara en la imposición de tasas ayudarían a la evolución positiva del sector.

Los beneficios para la ciudadanía

Quizás el reto más importante sea cómo hacer llegar realmente al ciudadano los beneficios de la apertura de datos ya que si fuese consciente de los potenciales beneficios demandará Open Data de forma natural. La difusión y formación desde la base es por tanto fundamental y necesaria tanto de forma interna como externa. Otro factor importante es la escucha activa para identificar los intereses de ciudadanos einfomediarios.

La gente entiende mejor el open data a través de aplicaciones concretas y es por ello que iniciativas del tipo de AbreDatos, si bien tienen un potencial limitado a la hora de generar negocio entorno al Open Data, sí constituyen un buen escaparate de cara al público y un componente demostrador de cara a la ciudadanía que les ayuda a ser conscientes de los beneficios. No obstante, no podemos estancarnos ahí, y debemos promoverpolíticas completas de participación, difusión y fomento del consumo que involucren a todos los agentes.

La información liberada y su potencial utilidad es también un factor primordial de cara a atraer la atención del público. Existen datos muy interesantes y demandados por la sociedad que siguen sin publicarse, como por ejemplo información relacionada con la seguridad ciudadana, el turismo, tráfico y transporte público o agendas de eventos.

No obstante, también hay una sensación general de que nadie tiene muy claro cuáles son los datos realmente útiles y dónde están, de ahí la tendencia hacia políticas raw data hoy en día, con la intención de dar a conocer lo antes posible cuál es la información disponible. Una política de transparencia activa ayudaría a facilitar esta labor fundamental de identificación, y en este aspecto también juegan un papel fundamental loscatálogos de datos a la hora de facilitar la localización de la información.

El futuro próximo del Open Data en España

En los próximos días, semanas y meses seguiremos viendo nuevos proyectos y muchas y excitantes novedades sobre la materia, como la publicación de un estudio del sector infomediario realizado por el ONTSIque nos ofrecerá importantes datos, nuevos proyectos interesantes en materia de estadística, un campo en el que la reutilización es muy importante, y el nuevo portal de reutilización nacional de España –  datos.gob.es – que cuenta con la participación de nuestro equipo Open Data @ CTIC.

Podemos pues concluir que España cuenta con una comunidad Open Data activa y cada vez más madura que justifica su posición destacada entre las iniciativas internacionales y los retos a los que nos enfrentamos son similares a los de otras iniciativas y comunidades con grados de madurez similares, por lo que debemos seguir evolucionando para superarlos.

Del eGovernment al Linked Government Data

Una visión histórica sobre la gestión de la información en el sector público.
Este artículo fue publicado primero en BOLETIC en colaboración con Jose Manuel Alonso.

A lo largo de los años, los organismos e instituciones públicas han ido produciendo, archivando y distribuyendo una gran cantidad y variedad de información en el transcurso diario de sus actividades. El reto permanente para las Administraciones consiste en aplicar planes de actuación que sigan los estándares y prácticas adecuadas para conseguir que toda esa información gubernamental sea fácil de encontrar, esté siempre a mano, y sea accesible, comprensible y usable, para así conseguir que las personas puedan interactuar con sus Administraciones de la forma más eficaz y eficiente posible.

En este artículo haremos un breve recorrido histórico sobre la gestión de la información en el sector público, desde los orígenes de la eAdministración hasta llegar a las tendencias actuales y futuras de la mano del Linked Government Data.

Unos inicios no muy lejanos.

Desde la aparición de las nuevas tecnologías de la información y la comunicación, la Administración ha estado esforzándose por utilizar estas herramientas para encontrar medios cada vez más eficaces a la hora de dar servicio a los ciudadanos. La idea de que la Administración hiciera uso de la Web y sus tecnologías asociadas nació a finales de la década de los 90 y se culminó a principios de la década siguiente como una extensión de la tendencias dominantes por aquella época (eComercio, eConocimiento, eServicio, etc.), lo que dio lugar a que se acuñase también el término de eAdministración (eGovernment o eGov en inglés).

En aquel momento, la Web era una tecnología incipiente que estaba dando sus primeros pasos y aún funcionaba de una forma bastante caótica. Se hablaba de estos términos y se divulgaban con la esperanza de crear interés y, a la larga, un negocio a través de este nuevo medio.

Fue durante ese mismo periodo cuando las Administraciones comenzaron a darse cuenta de las oportunidades que estas tecnologías podrían suponer también a nivel interno para mejorar su organización y sus actividades, buscando el mismo nivel de eficiencia y los mismos enfoques utilizados por otros sectores para mejorar y divulgar su información y servicios.

Situación actual

Las Administraciones se han esforzado durante esta última década en proporcionar más información y mejores servicios a sus usuarios finales, llevando a cabo grandes esfuerzos en los ámbitos de la política, los recursos, la tecnología y las capacidades.

La explosión y desarrollo de la Web, así como las tecnologías y prácticas asociadas a ella, han ofrecido a las Administraciones lo que quizás es su mejor oportunidad para hacer realidad el objetivo de ofrecer información y servicios a la vez que se satisface la demanda por parte de los ciudadanos de una contribución e interacción cada vez mayores.

Sin embargo, en general, las Administraciones todavía no han comprendido por completo el impacto y la oportunidad que supone la Web para ellas ni cómo incorporarla y adaptarla correctamente a sus sistemas de trabajo, por lo que los objetivos de mejora de servicio, eficiencia, transparencia y participación no se han visto todavía cumplidos en la medida de lo esperado.

Por otro lado, el cambio de paradigma y la descentralización aportada por la denominada Web 2.0 no ha hecho otra cosa que acrecentar y complicar los desafíos que deben superar las Administraciones, ya que en general se han visto sorprendidas y desconcertadas por este nuevo paradigma, con el problema añadido de la carencia general de estrategias claras para el tratamiento de la información por parte de las instituciones gubernamentales.

Nuevos tiempos, nuevos modelos

Hoy en día, inmersos como nos encontramos en plena transición hacía la economía del conocimiento, todo el mundo asume como natural que ciertos datos procedentes de las Administraciones deben ser compartidos, fáciles de localizar, accesibles y manipulables por todo aquel que lo desee.

Ahora también, y gracias a la tecnologías emergentes que ofrece la Web, como es el caso de la Web Semántica, las Administraciones tienen a su disposición nuevas formas de comunicación con los ciudadanos que les brindan la oportunidad de abrir sus puertas, ayudando a entender, explicar, informar y divulgar grandes cantidades y tipos de información para su uso, interés y comprensión.

Semantic Web at W3CPor tanto, en la actualidad existen todos los ingredientes necesarios para que la Administración electrónica consiga que los ciudadanos puedan acceder a la información y los servicios gubernamentales en sus propios términos. Además, compartir esos datos e información gubernamental con el público hace que se establezca una relación más abierta y transparente con los ciudadanos, dando lugar a un nuevo modelo de Administración, la Administración Abierta (Open Government en inglés).

Los pioneros del Open Government

Dos son las iniciativas que a nivel mundial, y en un ejercicio de transparencia sin precedentes, iniciaron el camino hacia modelos de Gobierno más abiertos en los que el objetivo es utilizar las ventajas que ofrecen las tecnologías de la Web para destronar el secretismo que se había instaurado por defecto, pasando la Administración a cumplir un papel de simple gestor de la información en lugar de considerarse el propietario de la misma como había sucedido hasta el momento.

Barack Obama y Gordon Brown

Estados Unidos

A través de la figura de Barack Obama, que impulsó mediante una directiva de Gobierno Abierto la creación de un sistema de transparencia, participación pública y colaboración, con el convencimiento de que dicha estrategia fortalecerá la democracia y promoverá la eficiencia y efectividad en el Gobierno.

Los pilares de la estrategia USA se basan en la publicación online de la Información Gubernamental, la mejora en la calidad de dicha información, la promoción e institucionalización de una cultura de Gobierno Abierto y la creación de un Framework común que le de soporte.

Reino Unido

Mediante la figura de Gordon Brown, y posteriormente David Cameron, ha iniciado también un proceso de apertura mediante la publicación de la información que obra en poder de la Administración, con el objetivo de ayudar a los ciudadanos a entender cómo funciona el gobierno y cómo se llevan a cabo las distintas políticas.

La principal motivación en el caso del Reino Unido es el convencimiento de que esta información pública de fácil acceso ayudará a que los ciudadanos puedan tomar mejores decisiones y realizar sugerencias sobre las políticas de Gobierno basadas en la información recibida.

El punto común: Open Goverment Data

Ambas iniciativas comparten el objetivo común de publicar los conjuntos de datos de los que dispone la Administración en un ejercicio de transparencia por el que esa información vuelve a sus verdaderos dueños – la ciudadanía – creando al mismo tiempo procesos más eficientes de funcionamiento interno y externo que mejoren las operaciones e intercambios dentro de la propia Administración.

Así pues, las iniciativas pioneras de Gobierno Abierto se basaron en un mismo concepto, el Open Government Data (OGD), o lo que es lo mismo, la publicación de la información que obra en poder de las distintas Agencias de la Administración, haciéndola accesible a todo el mundo. Si bien existen varias definiciones de OGD, la más ampliamente aceptada es la que sigue las siguientes premisas:

  1. La información tiene que ser completa.
  2. Los datos deben provenir directamente de la fuente, sin transformación alguna.
  3. La publicación debe realizarse a tiempo para preservar el valor de la información.
  4. La información tiene que estar disponible para el mayor número de usuarios posibles.
  5. Los datos deben presentar una estructura mínima que permita su tratamiento automatizado
  6. La publicación tiene que estar libre de discriminación y disponible para cualquiera.
  7. Los formatos de publicación deben ser no propietarios.
  8. La información debe estar libre de restricciones de copyright o patentes. [según una versión más reciente: o ser reutilizable mediante licencias de tipo “atribución” – n.b.]

Estrategias diferentes: Datos en crudo vs. Linked data

Si bien ambas iniciativas comparten el objetivo común de facilitar el acceso a la información, facilitar la interoperabilidad y permitir su reutilización, la estrategia a seguir difiere en un aspecto fundamental ya que, mientras la iniciativa USA bajo la dirección estratégica de Vivek Kundra se centró inicialmente en la publicación de la mayor cantidad de información en el menor plazo posible, volcando la información en crudo tal y como está disponible, en el caso de UK se realiza un tratamiento previo de los datos parar reducir los esfuerzos necesarios en su posterior reutilización.

Raw Data now! vs. Linked Government Data

Para ello, el Gobierno de UK, que cuenta con el asesoramiento del inventor de la Web – Tim Berners-Lee, apostó por las tecnologías de la Web Semántica para modelar la información y establecer relaciones explícitas entre los distintos conjuntos de datos siguiendo los principios de los Datos Enlazados (o Linked Data):

  • Utilizar URIs para la identificaciónde los distintos elementos de información.
  • Hacer que las URIs de identificación resuelvan a través del protocolo HTTP.
  • Proporcionar información útil cuando se resuelve una URI de identificación.
  • Añadir enlaces a otra información para que se puedan descubrir nuevos elementos.

Linked Data

Es sabido que, gracias a la integración de información que ofrecen los datos enlazados y en formatos abiertos, es posible explotar nuevas vías para encontrar datos relevantes y pertinentes para sus necesidades a través de búsquedas, consultas, interfaces o herramientas.

El futuro: Linked Government Data

Muchas son ya las iniciativas que a nivel mundial han seguido el ejemplo de las pioneras pero, todas ellas, incluido el caso de USA, tienden en la actualidad a converger hacia la aplicación de los conceptos del Linked Data al Open Government, en lo que ya se denomina Linked Government Data.

Public Dataset Catalogs Faceted BrowserGracias a la utilización de las tecnologías de la Web Semántica, los Datos enlazados y el seguimiento de los principios generales de la Arquitectura Web, las Administraciones pueden ahora publicar conjuntos de datos que utilizarán vocabularios y metadatos de dominio específicos y ofrecerán al mismo tiempo interfaces de consulta comunes y transparentes para el acceso a la información, sin necesidad de que dichos interfaces hayan sido predefinidos, pasando así de la información legible para las máquinas a información que puede ser relacionada por las máquinas.

Estas características son las que hacen del Linked Government Data una herramienta perfecta para favorecer enormemente la reutilización de información por parte de terceras personas de formas completamente nuevas e impredecibles, al proporcionarnos un modelo de datos flexible que permite integrar fácilmente la información proveniente de distintas fuentes.

Linked Open Data cloud

Objetivo cinco estrellas

En cualquier proyecto de apertura de información no deberíamos limitarnos a buscar soluciones para compartir datos, sino que debemos buscar soluciones eficaces y eficientes, soluciones robustas que tengan en cuenta los principios de modularidad, redundancia mínima, escalabilidad e interoperabilidad entre otras buenas prácticas.

Es por ello que debemos siempre debemos intentar seguir una estrategia gradual orientada a llegar al máximo nivel dentro de la clasificación de las cinco estrellas para la publicación de Linked Open Data:

★                     Publicar la información (en cualquier formato) utilizando licencias abiertas.

★★                  Utilizar formatos de datos estructurados para proporcionar la información.

★★★                Evitar formatos propietarios para la representación de los datos.

★★★★             Utilizar URIs como identificación para que los datos se puedan referenciar.

★★★★★          Enlazar los datos con otros para añadir contexto.

Siguiendo una estrategia de este tipo se conseguirán finalmente los mayores beneficios, tanto para los publicadores de la información como para los consumidores finales.

Los desafíos pendientes

Hasta el momento se han puesto sobre la mesa muchas preguntas y la mayoría de proyectos existentes sólo han ofrecido respuestas parciales a algunas de ellas.

¿Cómo se deben modificar y adaptar las políticas, los procedimientos y las leyes de forma que haya cabida para el Open Data?

¿Cómo pueden garantizar las Administraciones que la fidelidad y la esencia fundamental de la información se mantienen intactas?

¿Existe alguna forma de publicar los datos sacados de los sistemas e infraestructuras desfasadas a través de la Web?

Desde nuestra experiencia podemos afirmar sin lugar a dudas que hoy en día disponemos de las herramientas y tecnologías necesarias para llevar a cabo una estrategia Linked Government Data con éxito, sin embargo, no existen todavía respuestas únicas y concretas para muchas de estas preguntas, ya que el Linked Government Data es actualmente una ciencia joven y hay algunas lecciones que todavía están por aprender mientras que los proyectos maduran y se siguen desarrollando.

Arquitectura de un sistema Linked Government Data

No obstante, en todos ellos ha quedado demostrado que lograr una Administración Abierta no es una tarea fácil, debido principalmente a los desafíos a los que deben enfrentarse las Administraciones a la hora de recopilar, gestionar y compartir la información. Entre estos desafíos podemos encontrar:

  • Impulso de las estrategias a todos los niveles ya que, tal como afirma Tim Berners-Lee, para que tenga éxito es necesario que la iniciativa se desarrolle simultáneamente tanto al más alto nivel de Gobierno como en los mandos intermedios y en la sociedad civil.
  • Existencia de políticas desfasadas que no se corresponden con la realidad social y tecnológica actual, con los consiguientes desafíos legales que se plantean y las dificultades para proporcionar una atención adecuada a los ciudadanos.
  • Cultura burocrática muy lenta, siendo necesario realizar cambios en los procedimientos para que se ajusten a la nueva realidad.
  • Limitaciones presupuestarias y de personal, no pudiendo siempre responder a las inversiones necesarias para llevar a cabo los proyectos de apertura de información y la capacitación necesaria para el personal que los gestione.
  • Desafíos tecnológicos a la hora de compartir la información, debido al carácter innovador de los proyectos y la complejidad que aporta la amplitud del ámbito de actuación.
  • Sensación de pérdida de control de la información, que pueda dar lugar a problemas de autenticidad en la procedencia de los datos, privacidad o seguridad nacional debido a la exposición inoportuna de la información o la falta de calidad de la misma.

A pesar de todo lo anterior, los beneficios de la apertura de la información son siempre mayores que los problemas que se plantean, ya que la publicación de los datos provenientes del sector público en formatos abiertos fomentará el discurso civil, proporcionará un mayor bienestar social y conseguirá un uso más eficiente de los recursos públicos.

Iniciativas Open DataEs por ello que cada vez son también más las iniciativas que surgen a nivel de la Administración nacional, y con las que trabajamos mano a mano para ofrecer soluciones a los problemas y desafíos pendientes con el objetivo de seguir sumando éxitos del Open Data en la Administración Pública.