Calidad e Interoperabilidad de los datos

No hay mejor forma de empezar el año que con una nueva edición del encuentro anual Aporta sobre el estado de la reutilización de los datos públicos en España, organizado por el Ministerio de Industria, Energía y Turismo, el Ministerio de Hacienda y Administraciones Públicas y la Entidad Pública Red.es.

Encuentro Aporta

Este año el encuentro estuvo dedicado al valor de los datos abiertos y contó también con la novedad de incorporar un foro sectorial sobre los datos de turismo. Además, tuve el placer y privilegio de compartir mesa con Antonio Rodriguez (Jefe del Área de Infraestructura GIS en el Instituto Geográfico Nacional de España), Aleida Alcaide (Consejera Técnica del Ministerio de Hacienda y Administraciones Públicas) y Jose Luis Roda (Profesor titular de la Universidad de la Laguna) como moderador de una sesión con un tema de lo más interesante: la Calidad e Interoperabilidad de los datos.

Sesión de Calidad e Interoperabilidad de los datos

El planteamiento que realicé como hilo conductor de la mesa seguía tres premisas básicas que me gustaría compartir:

1 – Los problemas de calidad e interoperabilidad no son una novedad de los datos abiertos

La calidad de los datos y la interoperabilidad son dos retos importantes que no son nuevos en absoluto y llevan con nosotros desde el inicio de las TIC e incluso mucho antes. Ahora sin embargo, gracias a la proliferación de iniciativas de datos abiertos, los datos están cada vez más expuestos y los reutilizadores comienzan a verlos con nuevas y diferentes perspectivas distintas a las originales. Los datos son puestos a prueba, se analizan, se visualizan y se buscan nuevas utilidades y servicios que hacen aflorar también nuevos problemas no detectados hasta el momento, aumentando al mismo tiempo el grado de exigencia de calidad.

Quien piense que sus datos no tienen ningún problema es que no los ha mirado nunca con suficiente detenimiento.

Todo analista de datos experimentado ha aprendido a convivir con cierto grado de error e incertidumbre en los datos como parte natural e inevitable del proceso; y también han aprendido a planificar los proyectos adecuadamente incluyendo el esfuerzo y los procedimientos necesarios para el tratamiento de esos errores.

2 – La calidad total de los datos es una “quimera” que debemos perseguir

Sin embargo, al contrario que los analistas, los “propietarios” o gestores de los datos sienten habitualmente una cierta resistencia natural a la aceptación de los errores, mucho más cuando ahora son expuestos “públicamente”. Debido a ello necesitan cierto periodo de aceptación y durante la última reunión del comité de dirección del Open Data Institute, Tim Berners-Lee comparaba este proceso con las 5 etapas del trauma descritas por el modelo Kübler-Ross:

Modelo Kubler-Ross
  1. Negación: Los datos no pueden estar mal, el problema tiene que estar en otro sitio.
  2. Ira: ¿Quién es el responsable y por qué no nos habíamos dado cuenta hasta ahora?
  3. Regateo o Negociación: ¿Podemos ignorar y ocultar los fallos de alguna manera?
  4. Depresión: En realidad estos datos están tan mal que no servirán para nada. Sería mejor dejarlo.
  5. Aceptación: De acuerdo, sabemos que hay un problema. Documentémoslo y describamos el alcance y las limitaciones.

Una vez superadas las etapas anteriores es necesaria la transición hacia una etapa adicional de “Esperanza” en la que finalmente nos damos cuenta de que, gracias a que los datos están ahora más expuestos, podemos contar también con más ayuda, mejores herramientas y canales de feedback para poder corregir los problemas y usarlos en nuestro beneficio para mejorar la calidad final.

3 – Las tres vertientes de la interoperabilidad.

Podemos descomponer la problemática de la interoperabilidad de los datos en tres componentes principales.

Interoperabilidad Técnica

Interoperabilidad Técnica

En este nivel hablamos de infraestructuras, protocolos y tecnologías utilizadas para compartir datos de forma común para que los sistemas puedan hablar entre sí.

Este punto generalmente no suele resultar especialmente conflictivo, al contar ya con una base de infraestructuras y tecnologías en Internet y la Web suficientemente maduras y adecuadas para este fin. No obstante la creación de frameworks específicos y adecuados para cubrir las necesidades de este tipo de proyectos puede ayudar a facilitar considerablemente el uso y aprovechamiento de los datos. Un ejemplo en esta línea sería el proyecto Europeo FI-WARE que explota el concepto cada vez más extendido de las Open APIs.

Interoperabilidad Semántica

Interoperabilidad SemánticaAquí nos centramos en que los sistemas sean capaces no únicamente de hablar, sino de entenderse entre ellos. Está vertiente se encuentra a medio camino entre la parte más técnica y la más humana, y será la capa encargada de facilitar los estándares adecuados para la representación de los datos y la información, de forma que pueda analizarse e intercambiarse automáticamente, pero al mismo tiempo mantenga también su capacidad de poder ser comunicada a las personas de forma comprensible para ellos.

Interoperabilidad Sintáctica o Humana

Interoperabilidad SintácticaEste último componente se centra en las personas que tienen que llegar a acuerdos y convenios para “hablar el mismo idioma”¿Qué es el Open Data? ¿Qué principios sigue? ¿Cómo se hace “bien”? ¿Qué datos hay que abrir? ¿Con qué estándar y en qué formato? ¿Qué modelo deben seguir unos determinados datos? ¿Sirve un único modelo para todo el mundo?

Poner a todo el mundo de acuerdo para dar respuesta común a estas preguntas es quizás el reto más grande, y más difícil será aún cuanto más global es el objetivo, ya que a los retos propios del Open Data tenemos que unir aquellos relacionados con el Big Data o la Internacionalización (en ambas vertientes: globalización y localización) y el reto del Broad Data.

En esta parte se están centrando actualmente múltiples grupos de trabajo en organizaciones tan diversas como el G8, el Grupo del Open Data del Open Government Partnership, la iniciativa de Interoperabilidad de la Comisión Europea, la Global Open Data Initiative, la actividad de Datos del W3C, etc.

Calidad e interoperabilidad en tres casos de uso.

Las intervenciones de mis compañeros de mesa se centraron en explicar la necesidad y los beneficios de las acciones para asegurar la calidad e interoperabilidad de los datos en tres casos de uso distintos y a cada cual más interesante: La directiva Inspire, la actualización de la Directiva Europea de Reutilización de la Información y el proyecto Open Data Canarias.

Sus intervenciones y la del resto de las mesas del encuentro, así como entrevistas y otros materiales audiovisuales pueden consultarse en el mini-site temático SpainESData.

Comunidades Open Data en España

Un signo distintivo de la madurez que están alcanzando alguna de las iniciativas Open Data en nuestro país es la proliferación de varias comunidades Open Data que nacen con el objetivo de promover el interés ciudadano por los datos abiertos y su reutilización como fuente de creación de valor social y económica, lo que hace que sean un factor determinante para el éxito de cualquier iniciativa.

OpenData Sevilla

Pionera en España como grupo Open Data organizado, se inició de forma espontánea y casi en paralelo al nacimiento de la iniciativa Open Data de la Junta de Andalucía. Formado por un grupo de gente con muchas ganas de hacer cosas como demuestra la organización del I Encuentro Opendata Sevilla celebrado a su nacimiento en Noviembre del 2011 y la gran variedad de actividades de difusión y proyectos ciudadanos en los que han participado en su escaso año de vida.

Open Data SevillaEn la actualidad se encuentran plenamente inmersos en la organización de las II Jornadas Gobierno Abierto y Opendata Sevilla, a celebrar el próximo viernes y sábado 23 y 24 de Noviembre con un programa muy interesante que lo colocan entre los mejores eventos de nuestro país y que aplica una fórmula a imitar, compaginando teoría y práctica, y demostrando que para hacer cosas útiles lo más importante es tener ganas e interés.

Datos.gob.es

Plataforma que da soporte a la iniciativa de Reutilización de la Información del Sector Público de carácter nacional y el Catálogo de Información Pública de la Administración General del Estado.datos.gob.es Reutiliza la Información PúblicaDesde el sitio web y el canal de Twitter asociado se proporciona información general, materiales formativos y noticias de actualidad sobre la reutilización de la información del sector público, ofreciendo recursos prácticos, informativos y divulgativos de utilidad para el desarrollo de productos y servicios de alto valor social y económico. A todo esto hay que sumar el ya tradicional Encuentro Aporta, que se ha convertido ya en la cita anual de referencia para las iniciativas Open Data en España.

Además, esta iniciativa se encarga también de dar soporte a los organismos de la AGE y ayudarles a llevar a cabo sus estrategias de reutilización, además de brindarles un punto de encuentro abierto a la colaboración y participación y un servicio que recoge las sugerencias de mejora aportadas por todos los actores implicados.

Comunidad Open Data y RISP en GNOSS

Comunidad de Trabajo Open Data en España en la que se discuten temas relacionados con la apertura de datos de la administración pública y sobre su reutilización. Un grupo abierto a la participación online de cualquiera que tenga interés en la materia, coordinado por la Oficina Española del W3C y con el apoyo de varias de las iniciativas RISP actualmente en marcha en España.

Open Data y RISPEste grupo funciona como un foro de intercambio de opiniones y aprovechamiento de sinergias entre los distintos publicadores de información, con el objetivo de intentar optimizar la inversión de recursos mediante la colaboración. Entre sus actuaciones destaca la participación en la elaboración del decálogo Open Data.

OKF España

Uno de los grupos locales de la Open Knowledge Foundation que están emergiendo y que actualmente se encuentra en proceso de formación, aspirando a convertirse en capítulo oficial de la organización líder a nivel mundial en difusión del Open Data y el Open Knowledge en general.

OKFN Local: EspañaPese a que se encuentra todavía en una etapa temprana de constitución, entre las áreas de trabajo previstas se encuentran algunas tan diversas como el Gobierno Abierto, las Ciencias Abiertas, el Periodismo de Datos o las Ciudades Inteligentes y el Internet de las Cosas, así como la organización de eventos a nivel nacional, la traducción de guías y documentos al español y la colaboración con otras iniciativas a nivel mundial.

Catalunya Dades

Un grupo que engloba a los distintos actores implicados en la iniciativa Open Data de Cataluña: administraciones, universidades, empresas, desarrolladores y distintos sectores profesionales relacionados con la comunicación, la tecnología o el conocimiento abierto.

Catalunya DadesEl objetivo que persigue es la participación de la sociedad en los procesos de generación de valor que surjan a partir del conocimiento proporcionado por los Datos Abiertos. Entre sus próximas actuaciones se encuentra la formación en Open Data.

Aragón

Aún cuando la iniciativa Open Data de Aragón se encuentra todavía en estado de desarrollo, ya cuentan con algunos primeros pasos muy significativos e inteligentemente orientados.

Si tuviésemos que destacar un aspecto que distinga ya desde un principio a esta iniciativa es la búsqueda de colaboración y formación de comunidad junto a las empresas y los ciudadanos desde los comienzos como ayuda para la definición de la propia estrategia a seguir.

¿Quién quiere ser el último?

Si bien es cierto que todavía queda mucho camino por recorrer para alcanzar la madurez del Open Data en este país, el crecimiento y la mejora de la comunidad entorno al Open Data es una de las vías claramente necesarias. Ahora tendremos que ver si esta proliferación de comunidades será capaz de dar lugar a una colaboración más efectiva y abierta que beneficie al conjunto de iniciativas o a una división de esfuerzos y confrontación de intereses que las penalice en contra de los propios principios que deberían perseguir.

Muy pocos años atrás la duda era saber quién sería el último en sumarse a las iniciativas Open Data en nuestro país, en el punto en el que nos encontramos actualmente parece que la pregunta es quién será el último en contar con una comunidad que sostenga y le de sentido a esa iniciativa Open Data en marcha.

Sin tecnología (y sin tecnólogos) tampoco habría ni Open Data ni Gobierno Abierto

La reciente publicación de Cesar Calderón en su blog, que recomiendo leer antes de lo que viene a continuación, me ha hecho reflexionar a mí también sobre la corriente anti-tecnológica que últimamente viene apareciendo en cualquier debate sobre Open Data o Gobierno Abierto y que produce también algunos fenómenos extraños.

Aunque nunca está de más reiterar la importancia del compromiso y la voluntad política como punto clave e imprescindible para una iniciativa Open Data o de Gobierno Abierto en general, lo que no acabo de entender es qué puede aportar de malo una brillante construcción técnica en cuanto al éxito de la iniciativa o al compromiso de sus promotores, y menos todavía el tono negativo o incluso a veces rozando el sarcasmo que me parece percibir al respecto.

No se equivoquen, la absoluta totalidad de iniciativas exitosas de Open Government, Open Data, participación y transparencia tienen un mismo origen, la política, y un medio común, la tecnología, como herramienta que facilita una transparencia, colaboración, participación y reutilización efectivas.

Y para demostrarlo podemos utilizar los mismos tres ejemplos mencionados como iniciativas de referencia – Obama en USA, Patxi en Euskadi y Cameron en UK – que han estado asociados siempre a sus respectivas brillantes soluciones técnicas, desde la plataforma abierta de Open Government que se utiliza en USA y que ahora está también disponible para su reutilización por otras iniciativas gracias a la Open Government Platform, hasta el recientemente renovado data.gov.uk referente a nivel mundial en casi todos los sentidos, pasando como no por el portal de Apertura de Datos públicos del Gobierno Vasco, que ha sido posible gracias al aprovechamiento de la sólida base técnica previamente existente en la infraestructura Web de Euskadi. Todo eso por no hablar de la reciente apuesta de Obama por las APIs como vía de futuro para la sostenibilidad del Open Data, o la forma en la que desde el Reino Unido se ha ido abriendo camino con las tecnologías de la Web Semántica y el Linked Data como apuesta de futuro para los Datos Abiertos, vía a la que recientemente se ha unido también la Comisión Europea.

Por otro lado, es realmente difícil que si no existe un verdadero compromiso político se realice la apuesta necesaria para llevar a cabo una solución técnica adecuada. Esto da lugar a que en la gran mayoría de las ocasiones la existencia de una solución técnica brillante sea por pura lógica un claro indicativo del compromiso político previamente establecido, es decir, dicha solución técnica surge normalmente como consecuencia del compromiso. De hecho, aquellos casos en los que el compromiso político no existe realmente muchas veces se pueden detectar con facilidad gracias a que se suelen materializar a través de soluciones técnicas pobres e inadecuadas, incapaces a todas luces de sostener un proyecto que se hubiese conceptualizado como algo duradero.

Por tanto yo diría que si bien el compromiso político es el verdadero habilitador, la solución técnica es el posibilitador final capaz de hacer una iniciativa sostenible a lo largo del tiempo, y no olvidemos que si no fuera por la plataforma abierta que nos ofrece Internet no estaríamos problabemente hablando de las iniciativas de Open Data o Gobierno Abierto a las que sirve de soporte imprescindible.

De esta forma, un político que no sepa hacer un uso adecuado de la tecnología que tiene a su disposición está dando el primer paso hacia la insostenibilidad de cualquier iniciativa de reutilización de la información. De igual modo que una comunidad de Gobierno Abierto y Open Data que no es capaz de trabajar unida está dando grandes zancadas hacia su autodestrucción, y todo por no saber respetar, apreciar y valorar en su justa medida el trabajo de los distintos implicados, ya sean grandes políticos de nueva generación, brillantes tecnólogos o visionarios del Gobierno Abierto.

State of the art on Open Data in Spain

This article was first published in Spanish.

Last week we assisted to a new edition of the Open Data initiatives meeting in Spain in which the state of openness of information in the country was discussed through a travel across the existing initiatives.

Government Envision

In similar way to the conclusions of the recent European Digital Agenda meeting, it was made quite clear that Open Data is an important area of future, since reuse is considered one of the principal axes on the road to an efficient and top-quality Public Management and for a more democratic management through which citizens get reconnected with.

Sharing data with citizens and businesses is also a tool for transparency and to foster economic activity, as well as a logical exercise in which the focus of information management will go back to the citizens, who are the natural owners. Thanks to the promotion of the future Spanish Law on Transparency, cost savings, an improved transparency and increased competitiveness are also expected, as well as the creation of new services.

Return of Investment

The debate opened with the question of why we are not reaching yet the economic return predicted by the MEPSIR and other similar studies. The conclusion seems to be that it is necessary to stimulate the market, which at times seems somewhat lethargic, and put more emphasis on citizens’ needs when prioritizing what must be opened first.

It is considered that a number of sensitive data (crime, health, etc.), to whose publication might be more reluctant the Administration, might be precisely those that have greater potential for value creation, however it is estimated that turnover for the data already available, such as cadastral records, official bulletins and more, is currently around 200 million Euros.

The Figures of Open Data in Spain

Data from the 2012 infomediary sector characterization study in Spain that will be published by ONTSI in the next days show us a universe of 150 companies that generate between 3,700 and 4,000 skilled and quality jobs.

With a total turnover of between 330 and 550 million € and the cultural sector contributing 10% of total, if we also consider the potential synergies between Open Data and the digital content industry, business figures could reach € 50,000 million, that is 5% of GDP in Spain.

Another interesting fact is that 87% of the data reused by businesses comes from Central Government and 45% from dedicated Open Data portals, being those confirmed as a useful mechanism to encourage reuse. From these figures one can conclude that there is still much room for growth, not only with the release of new data, but also by adding other regional and local Government initiatives.

Social Value and the Culture of Data

General sensation is that social value of Open Data is low at present due to the type of data that is being opened, but we must also take into account that barriers between social and economic value is rather diffuse.

One of the greatest barriers for the penetration of Open Data in society that has been detected on a recurring basis is the poor culture of data in the country.

To overcome this barrier the Open Data should be a natural part of the administrative procedure itself. The information should be reusable by default and that should be its natural state, giving public information back to the society which is its natural owner. The opening of data should be considered as a normal, everyday act and not an exception. That would be the best way to create a real culture of data.

The most open is not who more data publish, but who closes the least – Ivan Sanchez.

Citizens should be able to use the data that is necessary to generate value in a day-to-day basis, but require that information and make good use of it is also a citizenship responsibility. You need to create a continuous cycle of awareness, training and release of data, together with closer actions that make possible to generate true stories from data.

On the other hand, if you do not know about the existence of some data, the need is likely to never come. So, you also have to be proactive in publishing, or at least make an exercise of make an inventory of the data and publish the results, as in the case of Navarre. To give more visibility to data also helps.

If I had asked people what they wanted, they would have said faster horses – Henry Ford.

Open Data Community in Spain

Spain can also be considered one of the leading European Open Data countries with a large number of initiatives underway and a very active community. Proof of this is the intense online debate that took place in a complementary way to the meeting. There are also some interesting initiatives emerging from the Spanish community that have had great success, as the Open Data Decalogue. However, there is a general feeling of weak organization, slow advance and the existence of different tendencies.

You could say that, compared with the rest of Europe, Spain is not misplaced, so we should not be alarmist. But, given the current position of the country, the aim should be to aspire to be part of the leadership. For that we need to improve the community weaknesses and unify initiatives, a big challenge that remains unresolved also at the European level.

Standardization and normalization

Although the technology component is not the most important within an Open Data initiative, it is a recurrent topic every year, which is logical because we must not forget that Internet has been the facilitator of Open Data, and that the previous openness and participation initiatives have failed due to lack of sustainability.

We wouldn’t be talking about Open Data without the open platform that bring us Internet.

It is considered that we still miss the right tools to manage data properly and that right now current initiatives are too focused on open data portals exclusively. The origin of the problem might be that Public Services have not been planned to share data efficiently, although there are some initiatives, like the case of GenCat which, in a similar way to the new U.S. openness policy, are making good progress towards an ideal open-by-default model through a policy of unified APIs open to the public.

Standardization is also key to progress. Collaboration mechanisms between the Administration, Private Businesses and Citizens should be enabled to create or adopt common standards in areas such as vocabularies, access methods or data sets priorities. In this normalization process interoperability is a key factor, so the use of standards to ensure technological neutrality is essential.

We need also to stress again the importance of metadata, as the whole Open Data idea is based on the possibility of a suitable automated information processing. When data is not being well described its value will be much more limited. Special mention in this field for the simple, creative and functional approach of the Canarian Institute of Statistics that use their own metadata to provide information on user profiles potentially interested in the information.

Legislation is also making progress, but slowly, and although the approval of the PSI Royal Decree has implied a real improvement, and excessive bureaucracy and unclear legislation is still perceived and must also keep evolving.

A final nice thought to keep in mind:

Data are the raw material of the Information Society, we live in a Society of Information and sharing Open Data in this context equals to spread welfare – Marc Garriga

El estado del Open Data en España

Ayer se celebró una nueva edición del encuentro de iniciativas Open Data en España en la que, una vez más, se debatió sobre el estado de la apertura de la información en nuestro país y las iniciativas existentes.

La visión de la Administración

Al igual que en las conclusiones de la reciente Agenda Digital Europea, queda claro que el Open Data es un sector de gran futuro, ya que la reutilización se considera uno de los ejes principales en el camino hacia una administración eficiente y de calidad, así como para una gestión más democrática mediante la cual se consiga reconectar con los ciudadanos.

Compartir datos con los ciudadanos y empresas es también una herramienta de transparencia y creación de actividad económica, así como un ejercicio lógico en el que el foco de la gestión de la información pasaría de la Administración a los ciudadanos, que son los propietarios naturales. Gracias a la futura ley de transparencia, se espera también un ahorro de costes, una mejora de la transparencia, un aumento de la competitividad y la creación de nuevos servicios.

El retorno económico

El debate se abrió con la duda de por qué no llega el retorno económico pronosticado por el MEPSIR y otros estudios de referencia. La conclusión parece ser que es necesario estimular un mercado, que en ocasiones parece algo aletargado y poner más énfasis en las necesidades finales de los ciudadanos a la hora de priorizar qué es lo que se debe abrir.

Se considera que existen una serie de datos más sensibles o comprometidos (delincuencia, sanidad, etc.) a cuya publicación podría ser  más reticente la Administración y que son precisamente los que tienen un potencial mayor de generación de valor, sin embargo se estima que el volumen de negocio para los datos ya disponibles, tales como catastro, registros, boletines, etc., es en la actualidad en torno a los 200 millones de euros.

Las cifras del Open Data en España

Los datos adelantados del estudio de caracterización del sector infomediario en España que el ONTSI publicará próximamente nos muestran un universo de 150 empresas que generan entre 3.700 y 4.000 puestos de trabajo cualificados y de calidad.

La facturación total es de entre 330 y 550 millones de €, de los que el sector cultural aporta aproximadamente un 10% del total. Si además consideramos las potenciales sinergias entre la industria de los contenidos digitales y el Open Data, las cifras de negocio podrían llegar a unos 50.000 millones de €, lo que supondría un 5% del PIB en España.

Otro dato interesante es que un 87% de los datos reutilizados por las empresas proviene de la Administración Central y un 45% de portales específicos open data, quedando confirmados como un mecanismo útil para fomentar la reutilización. De estas cifras se puede concluir que existe todavía mucho margen de crecimiento, ya no solo con la liberación de nuevos datos, sino también con la incorporación de otras Administraciones regionales y locales.

El valor social y la cultura del dato.

Existe la sensación de que el valor social del Open Data se considera escaso en la actualidad debido a la tipología de los datos que se abren, aunque también hay que tener en cuenta que la barrera entre el valor social y valor económico es más bien difusa.

Una de las grandes barreras para la penetración del Open Data en la sociedad que se viene detectando de forma recurrente es la escasa cultura del dato existente en el país.

Para superar esta barrera el Open Data debería formar parte natural del propio procedimiento administrativo. La información debería ser reutilizable por defecto y ese debería ser su estado natural, devolviendo la información pública a la sociedad que es su propietaria natural. La apertura de datos debería ser considerada como un acto normal y cotidiano y no una excepción, esa sería la mejor manera de crear una cultura de los datos.

No es más abierto el que más abre, sino el que menos cierra – Iván Sánchez.

Los ciudadanos deberían poder utilizar los datos que fuesen necesarios para generar valor en el día a día, pero exigir los datos y hacer uso de ellos es una responsabilidad también de la ciudadanía. Es necesario crear un ciclo continuo de sensibilización, formación y liberación de datos, junto a acciones más cercanas que nos ayuden a generar verdaderas historias a partir de los datos.

Si hubiese preguntado a la gente qué querían me hubieran dicho que un caballo más rápido – Henry Ford.

Por otro lado, si no se conoce la existencia de los datos es probable que nunca se lleguen a necesitar, por lo que también es necesario ser proactivo en la publicación o, al menos, realizar un ejercicio de catalogación sobre los datos disponibles y dar a conocer el resultado como en el caso de Navarra. Dar más visibilidad a los datos, también ayuda.

La Comunidad RISP en España

España se puede considerar uno de los referentes europeos en materia de Open Data con un alto número de iniciativas en marcha y una comunidad muy activa. Como prueba de ello está el intenso debate online que ha tenido lugar de forma complementaria al encuentro. También existen algunas iniciativas interesantes surgidas de la propia comunidad y que han tenido gran acogida, como el decálogo Open Data. Sin embargo, existe una sensación generalizada de poca organización, avance lento y la existencia de diferentes corrientes.

Se podría decir que, en comparación con el resto de Europa, España no está mal situada, por lo que no debemos ser catastrofistas, pero dada la posición actual del país, el objetivo debería ser aspirar a estar en el liderazgo, mejorar los aspectos más débiles de la comunidad y unificar las iniciativas, que por otro lado es el gran reto pendiente a nivel Europeo.

Estandarización y normalización

Aunque el componente tecnológico no es el de mayor peso específico dentro de las iniciativas Open Data, si es un tema recurrente y se volvió a hablar de tecnología, cosa lógica por otro lado ya que no debemos olvidar que el gran facilitador del Open Data ha sido Internet, y que las iniciativa de apertura y participación previas a la era Internet han fracasado por falta de sostenibilidad.

Si no fuera por la plataforma abierta que nos ofrece Internet no estaríamos hablando de Open Data.

En general, se considera que todavía faltan las herramientas adecuadas para gestionar los datos y que en la actualidad las iniciativas están demasiado focalizadas hacia los portales open data en exclusiva. El problema de origen puede ser que la Administración no está planificada para compartir los datos hacia fuera con eficiencia, aunque existen iniciativas con el caso de la GenCat, que de forma similar a la nueva política de apertura de EEUU, evolucionan hacia un modelo ideal de abierto por defecto a través de una política de APIs unificadas y abiertas al público.

La normalización es también un aspecto fundamental para avanzar, es necesario habilitar mecanismos de colaboración entre el sector público, empresas y ciudadanos que nos permitan establecer o adoptar estándares comunes en campos como vocabularios, métodos de acceso o conjuntos de datos prioritarios. En este proceso de normalización la interoperabilidad es un factor clave, por lo que el uso de estándares que garanticen una neutralidad tecnológica será fundamental.

Destacar una vez más la importancia de los metadatos, ya que todo el sistema Open Data se basa en la posibilidad de un adecuado tratamiento automatizado de la información, por lo que si los datos no están bien descritos su valor será mucho más limitado. Mención especial en este campo para la solución simple, creativa y funcional que aplica el Instituto Canario de Estadística al utilizar los propios metadatos para proporcionar información sobre los perfiles de usuario potencialmente interesados en la información.

La legislación progresa también lentamente y, aunque la aprobación del RD de reutilización ha supuesto una mejora, todavía se percibe una burocracia excesiva y una legislación poco clara que debe ir también evolucionando.

Para terminar, una bonita reflexión a tener en cuenta:

Los datos son la materia prima de la Sociedad de la Información, vivimos en la sociedad del dato y abrir datos en ese contexto significa repartir riqueza – Marc Garriga

El año en el que el Open Government se hizo adulto

Este artículo fue publicado primero en el antiguo blog del proyecto Aporta, ahora transformado en datos.gob.es.

A lo largo del 2010 hemos asistido a una auténtica explosión de los proyectos Open Data en la Administración pública, tanto en España como a nivel mundial. Podemos afirmar sin lugar a dudas ese fue el año en que el Open Government se extendió a lo largo del mundo y que, en la actualidad, el compromiso y la voluntad de apertura existen, están presentes y se extienden.

El nacimiento

2010 fue pues el año de los orígenes, el año en el que surgieron muchas iniciativas locales, regionales, nacionales y supranacionales, que se fueron sumando a las pioneras de USA y UK y otras iniciativas de referencia como el catálogo del Banco Mundial, para ir formando poco a poco una comunidad Open Government Data global y activa.

Estas iniciativas pioneras que sirvieron de revulsivo siguen en el punto de mira de todos a la hora de marcar el camino a seguir, sin embargo cada nueva iniciativa tiende también a dejar su propia impronta y diferenciarse, cuestión lógica por otra parte en cualquier proceso de innovación asociado al uso de tecnologías incipientes.

La madurez

Sin embargo, y dado que el ecosistema del Open Data está alcanzado ya un cierto grado de madurez, ahora es el momento adecuado para replantearse las bases de los proyectos e ir evolucionando poco a poco desde la fiebre del raw data now! hacia modelos más sólidos y compatibles entre sí que sean además capaces de mantenerse a lo largo del tiempo.

Este año 2011 se prevé que sea el año de la consolidación, maduración y extensión de los proyectos, así pues, es hora de volver a repasar los principios y objetivos del Open Government y recapacitar acerca de varias cuestiones y desafíos pendientes ya que, en la actualidad, son todavía muchas las dudas que se plantean sobre cómo llevar a cabo una iniciativa de Open Government exitosa, tanto desde el punto de vista estratégico como tecnológico.

Los retos

Alguno de los grandes retos y necesidades a los que nos enfrentamos y sobre los que ya se está debatiendo desde la propia comunidad son:

  • Desarrollar más y mejores herramientas que nos ayuden en las etapas de identificación, representación, transformación, publicación y reutilización de la información.
  • Adoptar soluciones estándar comunes que aseguren la apertura, reutilización e interoperabilidad de los datos más allá del proyecto mediante el que se publican.
  • Adaptar las políticas, procedimientos y leyes para dar cabida a los aspectos legales específicos de una iniciativa Open Data.
  • Garantizar la calidad, procedencia, y fidelidad de la información, así como el mantenimiento de su carácter abierto a lo largo de toda la cadena de valor que generan los reutilizadores.
  • Mejorar la participación ciudadana y de los reutilizadores, analizando y comprendiendo en detalle sus necesidades en cuanto a consumo de datos.
  • Fomentar el desarrollo de servicios realmente útiles que estén centrados en las verdaderas necesidades de los usuarios y no únicamente en cuestiones estéticas.
  • Elaborar métricas que nos ayuden a estimar los beneficios reales de las iniciativas y el grado de satisfacción de los ciudadanos.

Desafortunadamente, todavía no contamos con todas las respuestas aunque el trabajo diario, y experiencias como la vivida con nuestro proyecto conjunto con la Web Foundation, nos ayudan a realizar un ejercicio de reflexión que ha sido muy útil para comprender mejor cuáles son las motivaciones que hay detrás de los proyectos Open Data y cómo funcionan.

Todas estas cuestiones serán sin duda temas muy interesantes a tratar muy pronto en el “Encuentro de iniciativas Open Data en España”, cuya temática este año son los “Retos y soluciones” del Open Data, lo que lo convierte en un foro muy interesante para compartir experiencias y buscar soluciones comunes.

El objetivo

Entre todos, y con el apoyo del trabajo cada vez más intenso en la materia por parte de instituciones como el W3C, podemos convertir el Open Data no solo en un saludable ejercicio de transparencia, sino en una cadena de valor añadido capaz de generar riqueza y prosperidad para todo el mundo.

Desde la iniciativa Open Data de la Fundación CTIC seguiremos trabajando y desarrollando nuestra metodología, así como nuevos productos para dar respuesta a los retos pendientes con la ilusión de ver día a día cómo surgen nuevas iniciativas, cómo maduran las ya existentes y quizás comenzar a ver más iniciativas y más maduras, no solo desde las administraciones, sino también desde los ciudadanos y la empresa privada y a lo largo de todos los países.

Como el propio Tim Berners-Lee dice:

Esto no ha hecho más que empezar