No hay mejor forma de empezar el año que con una nueva edición del encuentro anual Aporta sobre el estado de la reutilización de los datos públicos en España, organizado por el Ministerio de Industria, Energía y Turismo, el Ministerio de Hacienda y Administraciones Públicas y la Entidad Pública Red.es.
Este año el encuentro estuvo dedicado al valor de los datos abiertos y contó también con la novedad de incorporar un foro sectorial sobre los datos de turismo. Además, tuve el placer y privilegio de compartir mesa con Antonio Rodriguez (Jefe del Área de Infraestructura GIS en el Instituto Geográfico Nacional de España), Aleida Alcaide (Consejera Técnica del Ministerio de Hacienda y Administraciones Públicas) y Jose Luis Roda (Profesor titular de la Universidad de la Laguna) como moderador de una sesión con un tema de lo más interesante: la Calidad e Interoperabilidad de los datos.
El planteamiento que realicé como hilo conductor de la mesa seguía tres premisas básicas que me gustaría compartir:
1 – Los problemas de calidad e interoperabilidad no son una novedad de los datos abiertos
La calidad de los datos y la interoperabilidad son dos retos importantes que no son nuevos en absoluto y llevan con nosotros desde el inicio de las TIC e incluso mucho antes. Ahora sin embargo, gracias a la proliferación de iniciativas de datos abiertos, los datos están cada vez más expuestos y los reutilizadores comienzan a verlos con nuevas y diferentes perspectivas distintas a las originales. Los datos son puestos a prueba, se analizan, se visualizan y se buscan nuevas utilidades y servicios que hacen aflorar también nuevos problemas no detectados hasta el momento, aumentando al mismo tiempo el grado de exigencia de calidad.
Quien piense que sus datos no tienen ningún problema es que no los ha mirado nunca con suficiente detenimiento.
Todo analista de datos experimentado ha aprendido a convivir con cierto grado de error e incertidumbre en los datos como parte natural e inevitable del proceso; y también han aprendido a planificar los proyectos adecuadamente incluyendo el esfuerzo y los procedimientos necesarios para el tratamiento de esos errores.
2 – La calidad total de los datos es una “quimera” que debemos perseguir
Sin embargo, al contrario que los analistas, los “propietarios” o gestores de los datos sienten habitualmente una cierta resistencia natural a la aceptación de los errores, mucho más cuando ahora son expuestos “públicamente”. Debido a ello necesitan cierto periodo de aceptación y durante la última reunión del comité de dirección del Open Data Institute, Tim Berners-Lee comparaba este proceso con las 5 etapas del trauma descritas por el modelo Kübler-Ross:
- Negación: Los datos no pueden estar mal, el problema tiene que estar en otro sitio.
- Ira: ¿Quién es el responsable y por qué no nos habíamos dado cuenta hasta ahora?
- Regateo o Negociación: ¿Podemos ignorar y ocultar los fallos de alguna manera?
- Depresión: En realidad estos datos están tan mal que no servirán para nada. Sería mejor dejarlo.
- Aceptación: De acuerdo, sabemos que hay un problema. Documentémoslo y describamos el alcance y las limitaciones.
Una vez superadas las etapas anteriores es necesaria la transición hacia una etapa adicional de “Esperanza” en la que finalmente nos damos cuenta de que, gracias a que los datos están ahora más expuestos, podemos contar también con más ayuda, mejores herramientas y canales de feedback para poder corregir los problemas y usarlos en nuestro beneficio para mejorar la calidad final.
3 – Las tres vertientes de la interoperabilidad.
Podemos descomponer la problemática de la interoperabilidad de los datos en tres componentes principales.
Interoperabilidad Técnica
En este nivel hablamos de infraestructuras, protocolos y tecnologías utilizadas para compartir datos de forma común para que los sistemas puedan hablar entre sí.
Este punto generalmente no suele resultar especialmente conflictivo, al contar ya con una base de infraestructuras y tecnologías en Internet y la Web suficientemente maduras y adecuadas para este fin. No obstante la creación de frameworks específicos y adecuados para cubrir las necesidades de este tipo de proyectos puede ayudar a facilitar considerablemente el uso y aprovechamiento de los datos. Un ejemplo en esta línea sería el proyecto Europeo FI-WARE que explota el concepto cada vez más extendido de las Open APIs.
Interoperabilidad Semántica
Aquí nos centramos en que los sistemas sean capaces no únicamente de hablar, sino de entenderse entre ellos. Está vertiente se encuentra a medio camino entre la parte más técnica y la más humana, y será la capa encargada de facilitar los estándares adecuados para la representación de los datos y la información, de forma que pueda analizarse e intercambiarse automáticamente, pero al mismo tiempo mantenga también su capacidad de poder ser comunicada a las personas de forma comprensible para ellos.
Interoperabilidad Sintáctica o Humana
Este último componente se centra en las personas que tienen que llegar a acuerdos y convenios para “hablar el mismo idioma” – ¿Qué es el Open Data? ¿Qué principios sigue? ¿Cómo se hace “bien”? ¿Qué datos hay que abrir? ¿Con qué estándar y en qué formato? ¿Qué modelo deben seguir unos determinados datos? ¿Sirve un único modelo para todo el mundo?
Poner a todo el mundo de acuerdo para dar respuesta común a estas preguntas es quizás el reto más grande, y más difícil será aún cuanto más global es el objetivo, ya que a los retos propios del Open Data tenemos que unir aquellos relacionados con el Big Data o la Internacionalización (en ambas vertientes: globalización y localización) y el reto del Broad Data.
En esta parte se están centrando actualmente múltiples grupos de trabajo en organizaciones tan diversas como el G8, el Grupo del Open Data del Open Government Partnership, la iniciativa de Interoperabilidad de la Comisión Europea, la Global Open Data Initiative, la actividad de Datos del W3C, etc.
Calidad e interoperabilidad en tres casos de uso.
Las intervenciones de mis compañeros de mesa se centraron en explicar la necesidad y los beneficios de las acciones para asegurar la calidad e interoperabilidad de los datos en tres casos de uso distintos y a cada cual más interesante: La directiva Inspire, la actualización de la Directiva Europea de Reutilización de la Información y el proyecto Open Data Canarias.
Sus intervenciones y la del resto de las mesas del encuentro, así como entrevistas y otros materiales audiovisuales pueden consultarse en el mini-site temático SpainESData.
Emprender con datos – retos y oportunidades: Open Data, Big Data, Linked Data
La posibilidad de que tanto los ciudadanos como las empresas puedan acceder y utilizar a cada vez un mayor volumen y variedad de datos, gracias al auge del Open Data, Big Data y Linked Data, está permitiendo el nacimiento de un nuevo modelo de negocio basado en la creación de productos y servicios de valor añadido a partir de esa información.
Son ya varios los estudios económicos a nivel internacional que indican que las estimaciones del volumen potencial de negocio en torno a los datos en los próximos años son muy elevadas, entorno a los 200 billones de euros en toda Europa, pudiendo llegar a los 50.000 millones de euros sólo en España (el 5% del PIB nacional) si tenemos en cuenta también las potenciales sinergias con la industria de los contenidos digitales. Además la industria de los datos generará alrededor de 5 millones de puestos de trabajo en los próximos años.
Por eso, y en colaboración con la iniciativa Oviedo Emprende, hemos organizado unas jornadas en las que hablaremos de los retos y oportunidades para los emprendedores que trabajan con datos en las que reuniremos a especialistas en el área con varios emprendedores que ya están utilizando los datos como materia prima en sus proyectos de formas muy variadas para debatir sobre las posibilidades de negocio utilizando los datos como materia prima.
En primer lugar conoceremos las últimas tendencias y oportunidades en torno a los datos:
- Open Data, modelos de negocio, tendencias y oportunidades – Carlos Iglesias, Experto Open Data y Consultor TIC Independiente.
- Startups y emprendedores – Marco Laucelli, responsable de ISVs & Startups en IBM.
- Investigación, transferencia de conocimiento, innovación abierta e internacionalización en el mundo de los datos – Sergio García, Director de I+D+i en Treelogic.
- Linked Open Data, un mundo de posibilidades – Jose Emilio Labra, Investigador principal del grupo WESO (Web Semantics Oviedo) y Profesor Asociado del Departamento de Informática de la Universidad de Oviedo.
A continuación conoceremos de primera mano varias experiencias prácticas por parte de algunos “emprendedores de los datos”:
- Olivier Duperray, CEO de Open Coast.
- Daniel Pardo, Fundador de TerceroB.com.
- Luis Polo, CEO de Tabul.ae.
- Daniel Tamas y Lucica Ibanescu, de RBORN y creadores de AsturPlaya.es.
- ¿Qué modelos de negocio se pueden plantear en torno a los datos?
- ¿Qué otros servicios de valor añadido se pueden explotar alrededor de los datos
- ¿Qué problemas existen a la hora de acceder y explotar a los datos?
- ¿Qué datos son los más útiles? ¿Cuáles se echan de menos?
- ¿Cuál es el grado actual de colaboración de la administración?
- ¿Es fácil reutilizar los datos actualmente? ¿Qué haría falta para que fuese más fácil?
- Servicios o datos ¿Qué quieren realmente los usuarios?
¡Reserva ya tu plaza para participar!
Participación en el plan de Apertura de Datos y Reutilización de Navarra
Con el fin de impulsar la reutilización, y tras dos años de funcionamiento de la iniciativa Open Data Navarra, se propone la realización de un Plan de Apertura de Datos y Reutilización que maximice el valor de la información pública y en el que todo el mundo puede participar.
En primer lugar quiero dar mi enhorabuena a Navarra por ser una de las Comunidades Autónomas que siguen impulsando y apostando por la apertura de datos y la reutilización, y especialmente por apostar además por la participación desde el principio.
En cuanto a mi aportación, dado que la iniciativa Open Data de Navarra no parte de cero, sino que cuenta ya con cierto recorrido, lo lógico sería centrar el plan actual en definir el modelo de madurez que se le quiere dar al proyecto, estableciendo las actuaciones necesarias para:
- Analizar la situación actual de partida en base a las etapas y actuaciones que generalmente deben llevarse a cabo en una iniciativa Open Data, poniendo especial énfasis en las fortalezas y debilidades.
- Ampliar, mejorar y diversificar la oferta de datos actualmente disponible.
- Mejorar los procesos de publicación de datos, poniendo especial énfasis en la sostenibilidad de la iniciativa a lo largo del tiempo.
- Fomentar y mejorar la explotación de los datos por parte de los principales agentes reutilizadores: desde la propia administración hasta las empresas pasando por la universidad, el tejido asociativo, etc.
- Fomentar el desarrollo económico y las iniciativas emprendedoras en las que el Open Data sea protagonista parcial o totalmente.
- Establecer sinergias entre el Open Data y otras actuaciones cercanas, como el Open Government y las Smart Cities.
Aunque el primer paso lógico sería hacer ese análisis de partida, viendo la situación actual de la iniciativa de Navarra cabe pensar ya de antemano y a grandes rasgos en algunas sugerencias para actuaciones de mejora que parecen razonables en cada uno de los ejes principales:
Estrategia
Revisar, orientar y escalar para que en base a la situación de partida podamos definir un modelo de madurez adecuado que nos permita cumplir los objetivos deseados, teniendo en cuenta también la nueva Directiva Europea de Reutilización de la Información en el Sector Público, cuyas directrices deberán incorporar los países miembros a lo largo de los próximos meses.
Deben tenerse también en cuenta, e incluirse dentro de la estrategia, todas las cuestiones presupuestarias, normativas y organizativas necesarias para garantizar su viabilidad económica y de recursos.
Soporte
Fomentar la interoperabilidad semántica y sintáctica de los datos definiendo sistemas de referencia e identificadores globales y comunes, utilizando vocabularios y estándares adecuados, así como documentando suficientemente los datos y los procedimientos (tanto internos como externos).
Priorizar la publicación de la información según su utilidad y su posible efecto de escala en base a otra información ya publicada o recomendada por otras iniciativas nacionales e internacionales de referencia como las próximas pautas sobra la publicación de datos de la Comisión Europea o los datos de alto valor propuestos por el Open Data Charter.
Tecnología
Asegurar la sostenibilidad de la infraestructura tecnológica de publicación. Adaptarse a las recomendaciones del esquema nacional de interoperabilidad y la norma técnica de interoperabilidad de reutilización de recursos de información, así como al perfil de aplicación DCAT-AP para la interoperabilidad de portales de datos europeos.
Plantearse una evolución escalable hacia una estrategia de “Open APIs” mediante la cual los sistemas de la administración estén preparados para compartir sus datos por defecto. Desarrollar y/o adoptar herramientas y toolkits que faciliten la transformación y publicación de los datos minimizando esfuerzos.
Participación, Colaboración y Explotación
Establecer líneas de colaboración y apoyo mutuo con otras iniciativas para la coordinación de objetivos y la optimización de recursos. La colaboración debe establecerse a todos los niveles, desde lo local a lo global:
- Ayuntamientos de la región.
- Iniciativa nacional de datos abiertos.
- Iniciativas de otras comunidades autónomas.
- Proyectos europeos.
- Otras iniciativas globales.
Establecer lazos y actuaciones comunes con el tejido reutilizador de la región (empresas y emprendedores, universidades y centros de investigación, centros de formación, ciudadanía, etc.)
Fomentar la reutilización de forma activa y continuada, utilizando los medios más adecuados en cada caso para su correcta difusión y evolucionando hacia acciones de colaboración con mayor sostenibilidad y continuidad, colaborando activamente con distintos reutilizadores en proyectos conjuntos desde su misma gestación y buscando cubrir las necesidades de ambas partes.
Próximos pasos
Evidentemente, el siguiente paso lógico debería ser traducir estas líneas generales en actuaciones concretas. Aquí las posibilidades son múltiples, desde actuaciones aisladas orientadas a obtener resultados inmediatos para alguno de los objetivos:
- Desarrollo de apps temáticas.
- Procesos para la transformación y publicación en masa de datos para ampliar el catálogo.
- Enriquecimiento de datos con otros conjuntos externos.
- Toolkits para facilitar la visualización y comparación.
- Etc.
Hasta proyectos de evolución o colaboración más complejos con resultados a medio-largo plazo:
- Infraestructuras Open API.
- Incubadoras Open Data.
- Proyectos multi-sectoriales.
- Marketplaces de datos y aplicaciones.
- Planes de participación y formación de comunidades para la colaboración ciudadana.
- etc.
La elección final dependerá siempre del análisis de situación actual, de los objetivos perseguidos y de los medios con los que se cuente para llevarlas a cabo.
Open Data: de la transparencia al negocio
Esta es la entrevista que me hicieron para el artículo sobre las posibilidades de negocio del Open Data en el último número de la revista Fundetec y publicada también en Infotics.
La posibilidad de que tanto los ciudadanos como las empresas puedan acceder y utilizar los datos almacenados por las administraciones está permitiendo el nacimiento de un nuevo modelo de negocio basado en la creación de productos y servicios de valor añadido a partir de esta información pública.
Los expertos afirman que brindan un sinfín de posibilidades a los usuarios y desarrolladores para crear múltiples aplicaciones y negocios en la red.
P1 – ¿ Nos podía concretar alguna de esas posibilidades?
Desde mi punto de vista el verdadero potencial reside en el hecho de que por mucho que se intente no creo que haya nadie capaz de concretar esas posibilidades, y eso es debido a que el concepto de la innovación aplicado al Open Data se basa principalmente en dos premisas:
- El principio de las muchas mentes:
“La mejor forma de explotar tus datos se le ocurrirá siempre a otro” – Jo Walsh y Rufus Pollock.
- La Ley de Joy:
“No importa quien seas, la personas más brillantes trabajan siempre para otros” – Bill Joy.
Sumando ambas premisas es cuando nos damos cuenta de que las posibilidades residen precisamente en unir la apertura de los datos con la creatividad de aquellos que los vayan a combinar y transformar para poder ser utilizados. No existen fórmulas mágicas, la clave fundamental sigue siendo la misma de siempre, pensar en cuáles son las necesidades de las personas y buscar la mejor manera posible de poder satisfacerlas, la única diferencia es que ahora tenemos la oportunidad de poder acceder cada día a más datos y a nuevas fuentes como las que proporcionan las redes sensoriales de las Smart Cities, lo que multiplica las posibilidades.
P2 – En este momento en España ¿Cuáles son las principales iniciativas y fuentes de datos en abierto disponibles?
En España contamos ya con unas veinte iniciativas a todos los niveles. A nivel nacional tenemos no sólo el Catálogo Nacional de Datos, sino también con cierto marco legislativo, una serie de planes estratégicos en desarrollo, guías prácticas, un marco de interoperabilidad para la reutilización de recursos de la información y otras medidas de apoyo con el objetivo de conseguir que el número de conjuntos de datos disponibles vaya aumentando gradualmente tanto en cantidad como en calidad.
A nivel regional existen también múltiples iniciativas, desde las pioneras en Euskadi, Asturias o Cataluña hasta la más reciente en Aragón, y a nivel local ciudades como Zaragoza y Gijón fueron las encargadas de abrir un camino al que se han ido sumando otras como las recién incorporadas Pamplona y Terrassa.
Pero lo más importante es que el Open Data sigue muy vivo y no hay prácticamente un mes en el que no se anuncie otra iniciativa. En lo poco que llevamos de año ya llevamos cuatro nuevas iniciativas y seguiremos sumando, porque estoy convencido que este será el año de las iniciativas en las ciudades y comenzaremos a ver cada vez más a lo largo del mundo.
P3 – ¿Cómo y para qué pueden utilizar las empresas estos datos?
Todas las empresas utilizan datos en mayor o menor medida para su actividad diaria. La variedad de datos y su potencial es tan grande que el límite en cuanto a sus posibilidades de aplicación lo pone únicamente la imaginación.
Algunos datos son de aplicación más transversal, como la Información Geográfica y la Meteorología, y por tanto pueden ser de utilidad prácticamente para cualquier empresa o negocio. Otros datos pueden tener nichos de explotación mucho más específicos como por ejemplo los datos relacionados con la sanidad o las investigaciones clínicas, pero aun así al tratar cuestiones de claro interés público pueden dar lugar también a servicios con un mercado potencial muy amplio.
P4 – ¿Cuáles son los datos más utilizados y a partir de ellos qué servicios están surgiendo?
Los datos que suscitan un mayor interés suelen ser aquellos relacionados con Información Geográfica y Cartografía, Información Económica, Jurídica y Legal, Estadística y Sociodemografía, Transportes, Sanidad, Educación, Empleo, Seguridad, etc.
Sin embargo, no todos están siempre disponibles, así que dependiendo del país y el caso concreto los datos más utilizados pueden ser unos u otros. En principio, los datos relacionados con la Información Geográfica son con diferencia los más demandados y al mismo tiempo los más utilizados a nivel global, a lo que contribuye sin duda que las estimaciones indican que aproximadamente un 80% de las decisiones que deben tomar tanto las autoridades públicas como las grandes empresas cuentan con un componente geoespacial. Por otro lado ese éxito es debido también en buena parte a la directiva INSPIRE, que ha conseguido proporcionar un marco común para las infraestructuras del ámbito geoespacial a nivel Europeo, dando así lugar al caldo de cultivo ideal para el éxito en la reutilización.
P5 – ¿Es difícil usarlos?
Conseguir que los datos estén disponibles, y que además se publiquen bajo unas condiciones de uso que permitan su reutilización es ya un gran paso. Sin embargo, en muchos casos el tratamiento de los datos resulta un proceso bastante más costoso de lo que sería razonable debido a que no se publican de la forma adecuada. Esto da lugar a que se tenga que invertir tiempo y recursos en su tratamiento que serían mucho más productivos si se utilizasen para el análisis posterior, que es la parte del proceso donde realmente se genera valor.
Utilizar formatos que sean legibles por las máquinas, adoptar vocabularios estandarizados para los datos y documentarlos adecuadamente son acciones imprescindibles para facilitar la reutilización, eliminar barreras de entrada a nuevas empresas para que puedan crear sus productos o servicios y conseguir que exista un mercado de datos vivo y dinámico.
P6 – ¿Hay que tener conocimientos específicos o una base tecnológica para utilizarlos?
La gran variedad de datos existente, las posibilidades que ofrecen los múltiples formatos disponibles y la proliferación de herramientas que facilitan o incluso automatizan en parte su tratamiento hacen que hoy en día prácticamente cualquiera pueda experimentar con los datos si se lo propone y le dedica un poco de tiempo.
Por supuesto, cuanto más complejos sean los datos o el análisis que queramos realizar sobre ellos mayores serán también los conocimientos específicos que debemos tener para poder sacarles partido, y es ahí donde surge la necesidad de todo un mercado especializado de intermediarios de datos o infomediarios.
No hay que olvidar que el análisis y tratamiento de los datos es toda una ciencia por sí misma, que de hecho se viene denominando “Data Science”, y que implica la participación de múltiples y variados perfiles para poder exprimirle todo el jugo a los datos, desde profesionales de las matemáticas y la estadística hasta especialistas en algoritmos de tratamiento de datos o expertos en su visualización, pasando por supuesto por las personas capacitadas para el estudio de la materia específica que se esté analizando en cada caso, ya sea sanidad, educación, transportes, etc.,
Y es que no es lo mismo hacer una aplicación para móvil que nos indique cuáles son las farmacias de guardia que proponerse realizar un estudio sobre el genoma humano por ejemplo. Aunque en ambos casos estaremos creando nuevos productos y servicios útiles para la sociedad y basados en el Open Data, los conocimientos requeridos, los medios necesarios para llevarlos a cabo y los beneficios obtenidos en uno y otro caso serán obviamente muy distintos.
P7 – En este momento ¿Qué número de empresas han desarrollado en nuestro país algún servicio a partir de estos datos públicos?
Ese es un dato que es difícil de estimar, debido a que no se cuenta con ningún censo oficial de referencia, y el hecho de que nuestro registro mercantil sea un conjunto de datos completamente cerrado tampoco ayuda a facilitar este tipo de análisis.
En el caso de España se suele tomar como referencia el estudio del sector infomediario realizado por el ONTSI, que en su última edición realizó un censo de más de 150 empresas en el sector. Sin embargo, mi propia experiencia me indica que es mucho más que probable que la realidad del mercado sea considerablemente mayor, ya que el censo utilizado no es exhaustivo y existe todo un mercado paralelo de actividades relacionadas con los datos que actualmente no se recogen y que es difícil de cuantificar.
Por otro lado, nos encontramos en una fase en la que el mercado está todavía tomando forma, y una vez se empiecen a poner en marcha medidas adicionales que aporten mayor seguridad y sostenibilidad al sector, como por ejemplo la unificación de las licencias de uso o la aplicación de compromisos de servicio que garanticen la disponibilidad de los datos y eliminen la incertidumbre para los emprendedores que quieran montar sus servicios sobre unos determinados datos.
P8 – ¿Qué volumen de negocio generan?
Se han realizado varios estudios a nivel internacional al respecto y, aunque las cifras no siempre coinciden, lo que sí que tienen todos en común es que las estimaciones son siempre optimistas y los volúmenes de negocio son realmente considerables.
En el caso de España nuevamente podemos tomar como referencia inicial el estudio del ONTSI que hace unas estimaciones de un volumen de negocio de unos 500 millones de euros para el conjunto del sector. Sin embargo es más que probable que la realidad del mercado sea considerablemente mayor, ya que al hecho de que el censo de empresas no sea exhaustivo hay que sumarle que no se exploran en profundidad posibles sinergias con otros sectores. Por ejemplo, la Asociación Multisectorial de la Información (ASEDIE) hace unas estimaciones de cifras de negocio en torno a 50.000 millones de euros si tenemos en cuenta también las potenciales sinergias entre el Open Data y la industria de los contenidos digitales, lo que podría llegar a suponer hasta un 5% del PIB nacional.
Además, en muchos casos los modelos de negocio todavía no están claramente definidos y se siguen explorando las posibilidades, por lo que a medida que el mercado vaya alcanzado también una mayor madurez en ese sentido es previsible que eso se haga notar también en el volumen de negocio.
Por supuesto, e independientemente de todas estas cifras económicas, tampoco podemos olvidar que gracias al Open Data se generan también otra serie de valores intangibles para la sociedad como mejoras en la transparencia del Gobierno y la participación de los ciudadanos.
P9 – Territorialmente ¿En qué Comunidad Autónoma hay un mayor grado de reutilización de esta información o mayor número de empresas?
Dado que Internet y las Nuevas Tecnologías son los habilitadores que facilitan las tareas de compartir y analizar grandes cantidades de información es un hecho que las empresas cuya base de negocio consiste en la reutilización de datos suelen tener también un componente tecnológico considerable. Como es lógico entonces, se detecta también una mayor concentración de empresas reutilizadoras allí donde también se encuentra una mayor concentración de empresas con estas características, es decir principalmente Madrid y Cataluña.
En cuanto a los lugares dónde se puede concentrar más la reutilización yo diría que el interés por los datos es global y por tanto no creo que exista tal concentración, si bien como es evidente en cada caso el grado de reutilización será directamente proporcional a la cantidad de información disponible, el valor de los datos publicados y el ecosistema de reutilizadores que se forme a su alrededor. Si tenemos en cuenta esas tres variables quizás podamos destacar nuevamente a Cataluña, puesto que cuenta ya con un gran número de iniciativas que publican algunos datos realmente interesantes y con un completo ecosistema de reutilización vivo, activo y coordinado, elementos que en su conjunto a día de hoy no encontramos todavía en ninguna otra región.
P10 – La Comisión Europea ha estrenado este año su nuevo portal de datos abiertos en el que quiere que participen todos sus organismos ¿Puede suponer esto el definitivo impulso para este sector de contenidos que llaman infomediario?
El portal que recientemente ha publicado la Comisión Europea para facilitar el acceso a la información de sus propias instituciones es un nuevo paso hacia delante dentro de la política global que lleva ya a cabo desde hace algunos años para fomentar la reutilización de la información de los organismos públicos.
Dentro de esa misma política de promoción del Open Data en el ámbito Europeo, está previsto también que este mismo año salga a concurso un nuevo portal pan-europeo en el que los distintos países miembro puedan federar sus datos formando así un macrocatálogo de información pública a nivel europeo, así como con otras medidas que incluyen acciones para la publicación de más conjuntos de datos y el fomento de las tecnologías de datos enlazados o la difusión y sensibilización en el sector público a través de la renovación de la ePSI Platform.
Desde luego todas estas medidas son pasos positivos para el impulso de la economía en torno al Open Data, ya que supondrán una mayor disponibilidad de datos de alto valor y en un formato que facilite su explotación, pero en mi opinión el impulso más importante y puede que definitivo será la puesta en marcha de la Incubadora Open Data Europea, que de forma similar al trabajo realizado por el Open Data Institute en el Reino Unido, trabajará para facilitar a las empresas los datos que necesitan y los medios para poder llevar a cabo sus proyectos. Espero que algún día podamos ver esos mismos modelos replicados también en España, puesto que creo que las medidas relacionadas con el Gobierno Abierto y el Open Data incluidas en la Agenda Digital van por el camino correcto, pero echo también en falta otras actuaciones que las complementen.
Actualización – Desde la realización de esta entrevista se han producido un par de novedades importantes que tienen mucho que ver con lo que en ella se comenta:
- La revisión de la Directiva Europea de Reutilización de la Información del Sector Público.
- El anuncio de que el programa Open Data Support se hará cargo de llevar a la práctica el federador de datos a nivel Europeo utilizando el estándar de interoperabilidad DCAT-AP.
Interoperabilidad de los catálogos Open Data Europeos
Se acaba de abrir el plazo de comentarios y revisión pública del borrador de la especificación para el perfil de Aplicación de DCAT destinado a mejorar la interoperabilidad de Catálogos Open Data en la Unión Europea.
El perfil de aplicación de DCAT para portales Open Data Europeos (DCAT-AP) es una especificación para describir mediante metadatos los conjuntos de datos del sector público, de forma que se esas descripciones puedan ser compartidas entre diferentes catálogos o agregadas en un único punto de acceso común. La especificación forma parte del programa ISA de soluciones de interoperabilidad para Administraciones públicas Europeas de la Comisión Europea, dentro de la iniciativa Joinup de interoperabilidad semántica.
DCAT-AP toma como base principal el Vocabulario de Catálogos de Datos (DCAT) – estándar definido por el W3C que ya está siendo utilizando en varios Catálogos tanto en España como en Europa – así como otros vocabularios de referencia como ADMS o Dublin Core. Los objetivos principales de la especificación son:
- Identificar los elementos esenciales de DCAT para el contexto Europeo.
- Identificar los vocabularios comunes que se utilizarán como referencia en el contexto Europeo.
- Identificar el conjunto mínimo de metadatos para el intercambio de información entre catálogos Open Data en Europa.
DCAT-AP indica los metadatos mínimos necesarios para cumplir con las necesidades de los catálogos Open Data proporcionando así un mecanismo de interoperabilidad semántica con otras aplicaciones. Es también importante destacar que, si bien DCAT-AP está desarrollado bajo el modelo de RDF, la intención es definir únicamente el formato de intercambio y no el entorno operativo del catálogo, por lo cual también podrá ser utilizado en entornos que no implementen una solución Linked Data completa.
- Otros perfiles de aplicación – entre los que se incluye la Norma Técnica de Interoperabilidad de Reutilización de recursos de la información – y modelos de descripción de conjuntos de datos que están siendo ya utilizados en Europa y que han servido como input para este trabajo.
- Diferentes escenarios y casos de uso de ejemplo para la aplicación de DCAT-AP.
- Vocabularios de referencia propuestos para su utilización de forma conjunta con el perfil de aplicación.
- Aspectos de accesibilidad y multilingüismo que se deberán tener en cuenta.
- Cuestiones relacionadas con el entorno de despliegue de DCAT-AP.
Participa
La definición de DCAT-AP se lleva a cabo a través del consenso de un grupo internacional de expertos que participan en distintas iniciativas Open Data de la Unión Europea. No obstante, el Vocabulario se encuentra ahora en fase de revisión pública durante las próximas cuatro semanas y es muy importante que todos los interesados revisen la especificación y comenten sus impresiones para entre todos poder conseguir la máxima interoperabilidad tanto por parte de los proveedores de datos como de los potenciales consumidores.
También se puede consultar el historial de las distintas cuestiones que se han ido debatiendo a lo largo del desarrollo del perfil de aplicación.
Nueva Directiva Europea de Reutilización de la Información del Sector Público
Recientemente el Comité de Representantes de los países miembro de la Unión Europea ha dado su visto bueno a la actualización de la Directiva de Reutilización de la Información del Sector Público. Aunque todavía habrá que esperar al trámite de su aprobación por el Parlamento Europeo en Junio, es de esperar que no se produzcan cambios ni retrasos significativos.
En general la nueva Directiva supone un avance respecto a la directiva anterior del 2003 y un nuevo paso adelante en la estrategia Open Data de la Unión Europea, destacando la intención general de la actualización:
“Una vez implementada la nueva Directiva establecerá un derecho legítimo sobre la reutilización de la información pública que no estaba presente en la Directiva del 2003” – Neelie Kroes, Vicepresidenta de la Unión Europea.
No obstante, tras un primer análisis inicial por parte de la comunidad parece que sigue también habiendo algunos puntos mejorables, por ejemplo:
- Existe la posibilidad de cargar costes marginales en el tratamiento de los datos y mantener otros modelos adicionales de ingresos mediante tasas cuando sean de aplicación en casos concretos con normativas propias.
- En general se permite la aplicación de cualquier tipo de tasas, siempre que se justifique y se aplique de forma transparente, ignorando los efectos negativos que la aplicación de tasas tiene sobre la reutilización o los beneficios indirectos adicionales que una mayor apertura de los datos puede proporcionar.
- Los formatos abiertos y legibles por máquinas serán obligatorios, pero siempre que sea posible y apropiado. Un matiz que sin duda dará lugar a distintas interpretaciones que permitan saltarse la regla general.
- Se mantienen los acuerdos exclusivos de explotación de los datos siempre que sean por el bien del interés público. Lo que en la práctica supone la posibilidad de perpetuar estos acuerdos.
En cualquier caso, también existen puntos muy positivos, como la garantía de que los documentos afectados por las libertad de información deben ser no únicamente accesibles, sino también reutilizables, las mejoras sustanciales en los mecanismos de reclamación para garantizar su independencia, la promoción de licencias únicas, automatizables y estándar para todos los organismos dentro de un mismo estado miembro o la ampliación de la directiva al ámbito cultural.
Por tanto, y aunque tengamos todavía un par de años de transposición por delante una vez aprobada por el Parlamento, en general la Directiva supone un nuevo avance del Open Data en la Agenda Digital Europea, y por tanto bienvenida sea. Estaremos pendientes también de cómo se lleva a cabo la transposición de la Directiva en el caso de España y el impacto que tendrá sobre la actual Ley de Reutilización del Sector Público.
Interoperabilidad y Reutilización de Recursos de la Información
Recientemente se ha publicado la norma técnica de interoperabilidad de reutilización de recursos de la información en España, en la que he tenido el privilegio de poder participar, y que forma parte del Esquema Nacional de Interoperabilidad. La publicación de esta norma supone un hito importante, ya que en ella se establecen las condiciones comunes sobre selección, identificación, descripción, formato, condiciones de uso y puesta a disposición de los documentos y recursos de información elaborados o custodiados por el sector público.
El objetivo de esta norma es facilitar y garantizar el proceso de reutilización de la información de carácter público procedente de las Administraciones públicas en todos los niveles, asegurando la persistencia de la información, el uso de formatos así como los términos y condiciones de uso adecuados.
La norma ha sido diseñada teniendo en cuenta en todo momento los principios del Open Government Data e incluye instrucciones detalladas sobre:
- El esquema de identificadores únicos para los datos que exponen públicamente.
- Metadatos de los documentos y recursos de información catalogados.
- Taxonomía de sectores primarios donde se especifican los temas relacionados a cada uno de ellos.
- Identificadores correspondientes a los recursos geográficos del territorio español.
También está disponible una guía de aplicación de la Norma con el objetivo de servir como herramienta de apoyo para la aplicación e implementación de lo dispuesto en la misma.
[Actualización: Se han publicado también algunas correcciones al documento original de la Norma Técnica de Interoperabilidad]
Cien años de evolución en la comunicación entre Gobierno y ciudadanos
Un 15 de marzo de 1913, hace ya 100 años, el presidente Woodrow Wilson celebró la primera rueda de prensa en la Casa Blanca, todo un hito en la historia de la democracia y de la comunicación entre el gobierno y los ciudadanos.
Varias décadas después en 1955, Eisenhower permitió que las cámaras grabaran por primera vez una rueda de prensa presidencial.
Fue Kennedy en 1961 quien dio un nuevo paso adelante al ofrecer la primera rueda de prensa de un presidente en directo por la televisión, cambiando para siempre las reglas de la comunicación entre el Gobierno y los ciudadanos. El directo tuvo dos efectos inmediatos, los presidentes tenían que prepararse mucho más ante una rueda de prensa, pero también hizo posible que se pudieran comunicarse de una forma más directa con los ciudadanos.
Hoy en día las nuevas tecnologías están volviendo a revolucionar la forma en la que los políticos se comunican con los ciudadanos, lo que nos deja una pregunta muy interesante:
¿Cómo será la comunicación entre los gobiernos y los ciudadanos en el futuro?
Quizás llegue el día en el que la transparencia y la rendición de cuentas no se articulen a través de actos puntuales, sino que la apertura se convertiría en el estado natural de los gobiernos. Afortunadamente no habrá que esperar otros cien años para la próxima revolución en la comunicación entre gobierno y ciudadanos, esa revolución se llama Open Data, ya ha comenzado y nuevamente parte de los Estados Unidos.
El 21 de Enero de 2009, y en su primer día de mandato, el presidente Obama firmó un memorando sobre Transparencia y Gobierno Abierto, dando lugar a una nueva era de Gobierno Abierto y Responsable dirigido a acercar el Gobierno a los ciudadanos.
En Septiembre de 2011 se publica la declaración de Gobierno Abierto y queda formalmente constituido el Open Government Partnership, promovido por los Gobiernos de Estados Unidos y otros siete países, con el compromiso de aumentar la disponibilidad de información sobre las actividades gubernamentales, apoyar la participación ciudadana, aplicar los más altos grados de integridad profesional en los gobiernos y aumentar el acceso a las nuevas tecnologías para la apertura y la rendición de cuentas.
A día de hoy 58 países se han adherido ya a la sociedad por el Gobierno Abierto y sus principios, y ese número sigue aumentando día a día. Entre los compromisos adoptados por los países destaca uno mayoritariamente: el Open Data.
Continuará…
El mapa de la Transparencia en España
Ayer se hicieron públicos los resultados para este año del índice de transparencia de la Comunidades Autónomas en España elaborado por Transparencia Internacional con el que se busca un doble objetivo: evaluar el nivel de transparencia de los Gobiernos de las diferentes Comunidades Autónomas y, al mismo tiempo, impulsar la apertura de la información por parte de las instituciones.
Lo primero es felicitar a las Comunidades Autónomas que encabezan la clasificación: La Rioja, que consigue mantenerse en lo alto de la lista y, en especial, Euskadi, que gracias a su estrategia de Gobierno Abierto y Open Data ha conseguido dar un salto cualitativo y posicionarse en el primer lugar de la tabla, confirmándose así como iniciativa de referencia en la materia.
Cabe destacar también la mejora de Cantabria, que supone la mayor subida de todas las Comunidades Autónomas y, aunque algunas Comunidades como Murcia, Cataluña o Madrid han registrado bajadas significativas, la nota positiva es que todas superan el aprobado (50) y la media crece significativamente (+8,39) respecto al último estudio del 2010, lo que hace también que esas bajadas en la clasificación sean en parte motivadas por el estancamiento ante una mejora general.
puesto | comunidad autónoma | 2012 | 2010 | variación |
1 | País Vasco | 97,5 | 57,5 | +13 ⇧ |
1 | La Rioja | 97,5 | 83,8 | +2 ⇧ |
3 | Cantabria | 95,0 | 53,8 | +14 ⇧ |
4 | Andalucía | 92,5 | 87,5 | -3 ⇩ |
5 | Navarra | 91,3 | 80,0 | +1 ⇧ |
6 | Castilla y León | 90,0 | 73,8 | +2 ⇧ |
6 | Galicia | 90,0 | 87,5 | -5 ⇩ |
8 | Extremadura | 87,5 | 81,3 | -3 ⇩ |
9 | Baleares | 83,8 | 56,3 | +6 ⇧ |
10 | Cataluña | 78,8 | 82,5 | -6 ⇩ |
11 | Aragón | 75,0 | 70,0 | -2 ⇩ |
12 | Madrid | 72,5 | 80,0 | -6 ⇩ |
13 | Asturias | 66,3 | 67,5 | -2 ⇩ |
14 | Canarias | 63,8 | 66,3 | -2 ⇩ |
14 | Valencia | 63,8 | 56,3 | +1 ⇧ |
16 | Castilla la Mancha | 58,8 | 62,5 | -3 ⇩ |
17 | Murcia | 55,0 | 70,0 | -8 ⇩ |
media | 79,95 | 71,56 | +8,39 ⇧ |
Sin duda son buenas noticias para el avance del Open Data y, sobre todo, del Gobierno Abierto y la Transparencia, sin embargo todavía hay camino por recorrer, mejorando no solo la cantidad de información disponible, sino también su encontrabilidad, ya que si hacemos el ejercicio de buscar la información correspondiente a cada uno de los 80 indicadores evaluados en alguno de los portales al azar veremos que en varios casos no resulta nada fácil.
Por eso, echando un vistazo a la metodología seguida para el análisis me hubiera gustado también saber más sobre las dificultades que han podido tener para encontrar la información buscada en primer término y cómo de grande podría ser la diferencia respecto al total de información finalmente proporcionada por cada Comunidad Autónoma, porque si la información está ahí pero nadie puede encontrarla tendríamos también un grave problema de transparencia.
La crisis pasa factura, pero el Open Data sigue avanzando en España
A lo largo de este año hemos visto algunos pasos atrás en cuanto al Open Data y la Reutilización de la Información en el Sector Público en nuestro país, por ejemplo el cierre de algunas iniciativas como Extremadura Reutiliza u Open Data Córdoba, aunque sin duda alguna el caso más sonado ha sido el anuncio de la Agencia Estatal de Meteorología (AEMET) respecto al cierre del servicio gratuito de acceso a ciertos datos mediante FTP, pasando en la actualidad a ser un servicio de pago, lo que ha dado lugar a una reacción unánime de rechazo por parte de la comunidad Open Data en España.
Estas noticias suponen claramente un paso atrás en las expectativas Open Data nacionales aunque, tal y como comenta Jorge Campanillas en su blog, la medida tomada por la AEMET es lícita y ajustada a la ley, pero desde luego discutible en cuanto a visión y oportunidad, ya que la imposición de tasas restringe claramente el acceso a los datos públicos, a la vez que resta eficacia y eficiencia en el acceso.
Es cierto que la gratuidad de la información, aún siendo algo plenamente recomendable, no está contemplada como uno de los principios básicos del Open Government Data, y que el Open Data cuesta tiempo y trabajo, y por tanto dinero, pero la cuestión en este caso es ¿por qué optar por ofrecer de forma abierta unos servicios de gran demanda y utilidad para luego pasar a un modelo de pago por acceso?.
A todas luces parece deberse a una mala estrategia que responde principalmente a motivos de sostenibilidad económica derivados de la complicada situación económica y social que estamos atravesando y que también puede haber afectado a las otras iniciativas que se han quedado por el camino. No obstante, dar prioridad a las cuentas a corto plazo y no pararse a pensar en la factura que eso pasará al desarrollo económico futuro no parece a priori una buena inversión.
El Open Data sigue adelante
A pesar de todo, y aunque el contexto actual esté afectando y puede hacer que surjan algunas dudas sobre la viabilidad de las iniciativas, todo parece indicar que el Open Data está aquí para quedarse, y que hay más motivos para el optimismo que para el pesimismo, como por ejemplo:
- La iniciativa Extremadura Reutiliza, que se ha visto afectada también por la renovación de las infraestructuras Web generales del Gobierno de Extremadura, volverá con toda probabilidad en el futuro renovada y con más fuerza como parte de la estrategia de la Agenda Digital Extremeña.
- Tenemos muchas nuevas e interesantes iniciativas en preparación que verán la luz próximamente, como el Open Data de Aragón, Dato Abierto La Rioja y los avances en la materia de Canarias a nivel autonómico, o la reciente incorporación de Sabadell y el anuncio del portal Open Data de Málaga a nivel local.
@ingenia_es pondrá en marcha el portal #OpenData de #Malaga. Datos de la #smartcity para el desarrollo económico y la transparencia #red
— Carlos Bentabol (@cbentabol) noviembre 15, 2012
- La iniciativa nacional sigue evolucionando. Empiezan a aflorar los primeros Planes RISP de Ministerios y Organismos en cumplimiento de los requisitos establecidos por el Real Decreto 1495/2011 y, además, se está desarrollando la infraestructura que permitirá federar esos datos con el catálogo nacional.
- Surgen nuevos proyectos innovadores que buscan aprovechar al máximo las posibilidades de desarrollo económico que ofrece el Open Data, como el OpenData Lab Gijón.
- Alguna iniciativas pionera y de referencia siguen presentando novedades, como Open Data Barcelona, que se reimpulsa y renueva con objetivos más ambiciosos en cuanto a publicación, reutilización y desarrollo económico u Open Data Euskadi que, según anunció en las Jornadas Open Data de Sevilla, está trabajando en la versión 2 de su iniciativa, que incluirá novedades tan llamativas como el plan de generalización para la reutilización de cualquier activo público (incluyendo datos, aplicaciones, documentos, etc.)
- Las Comunidades entorno al Open Data no paran de expandirse y crecer, tanto en número como en calidad.
Y para seguir avanzando recordemos que el Open Data no es cuestión de publicar algunos datos en bruto y realizar un par de hackatones con ellos, ya que una iniciativa sostenible implica un viaje largo y sin atajos que se debe recorrer paso a paso sobre los cimientos sólidos que proporciona una estrategia coherente.