The G20 Open Data Plan against corruption

The G20 Leaders established the Anti-Corruption Working Group (ACWG) at the Toronto Summit in 2010 in recognition of the significant negative impact of corruption on economic growth, trade and development. The work of the ACWG has been guided by two-year action plans that include commitments by G20 countries to ratify and implement the United Nations Convention against Corruption. Still, at the end of 2014, corruption continues to represent a significant threat to global growth and financial stability.

The ACWG recognizes that promoting greater transparency and integrity in the public sector is essential to preventing the misuse or diversion of public funds, which can have a significant negative impact on economic growth and development. The G20 must continue to lead by example in this area by ensuring that government agencies, policies, and officials model international best practices for public transparency and integrity.

For that, the new 2015-16 G20 Anti-Corruption Implementation Plan that has just been ratified in the last Leader’s summit in Brisbane includes different areas of action with specific commitments, including several focused on Open Data. More specifically:

The ACWG has identified open data, public procurement, whistleblower protections, immunities from prosecution, fiscal and budget transparency, and standards for public officials as main issues affecting the public sector transparency and integrity which merit particular attention in 2015-16.

What’s the problem?

Open data initiatives play an important role in promoting public sector transparency and accountability, and can also have significant benefits for the private sector. In particular, open data helps businesses to assess risks and opportunities in different markets so they can make better investment decisions. Open data also gives citizens better visibility of the flow of public money across borders, and enhances public debate on the use of public money.

The G20 value add

Building on open data initiatives developed in other fora (e.g. the G8 Open Data principles), the G20 will lead by example in promoting and implementing international best practices on open data.

Links to the G20 broader agenda

Open data has important benefits for the wider G20 agenda, for example, with regard to investment by empowering the private sector to make better investments decisions.

Specific commitments in the current G20 implementation plan

  1. The ACWG will prepare a G20 compendium of good practices and lessons learned on open data and its application in the fight against corruption.
  2. The ACWG will prepare G20 Open Data Principles, including identifying areas or sectors where their application is particularly useful and taking into account different national legal frameworks.
  3. G20 countries will complete self assessments of their open data frameworks and initiatives, with reference to the G20 Open Data Principles, and consider next steps.

Calidad e Interoperabilidad de los datos

No hay mejor forma de empezar el año que con una nueva edición del encuentro anual Aporta sobre el estado de la reutilización de los datos públicos en España, organizado por el Ministerio de Industria, Energía y Turismo, el Ministerio de Hacienda y Administraciones Públicas y la Entidad Pública Red.es.

Encuentro Aporta

Este año el encuentro estuvo dedicado al valor de los datos abiertos y contó también con la novedad de incorporar un foro sectorial sobre los datos de turismo. Además, tuve el placer y privilegio de compartir mesa con Antonio Rodriguez (Jefe del Área de Infraestructura GIS en el Instituto Geográfico Nacional de España), Aleida Alcaide (Consejera Técnica del Ministerio de Hacienda y Administraciones Públicas) y Jose Luis Roda (Profesor titular de la Universidad de la Laguna) como moderador de una sesión con un tema de lo más interesante: la Calidad e Interoperabilidad de los datos.

Sesión de Calidad e Interoperabilidad de los datos

El planteamiento que realicé como hilo conductor de la mesa seguía tres premisas básicas que me gustaría compartir:

1 – Los problemas de calidad e interoperabilidad no son una novedad de los datos abiertos

La calidad de los datos y la interoperabilidad son dos retos importantes que no son nuevos en absoluto y llevan con nosotros desde el inicio de las TIC e incluso mucho antes. Ahora sin embargo, gracias a la proliferación de iniciativas de datos abiertos, los datos están cada vez más expuestos y los reutilizadores comienzan a verlos con nuevas y diferentes perspectivas distintas a las originales. Los datos son puestos a prueba, se analizan, se visualizan y se buscan nuevas utilidades y servicios que hacen aflorar también nuevos problemas no detectados hasta el momento, aumentando al mismo tiempo el grado de exigencia de calidad.

Quien piense que sus datos no tienen ningún problema es que no los ha mirado nunca con suficiente detenimiento.

Todo analista de datos experimentado ha aprendido a convivir con cierto grado de error e incertidumbre en los datos como parte natural e inevitable del proceso; y también han aprendido a planificar los proyectos adecuadamente incluyendo el esfuerzo y los procedimientos necesarios para el tratamiento de esos errores.

2 – La calidad total de los datos es una “quimera” que debemos perseguir

Sin embargo, al contrario que los analistas, los “propietarios” o gestores de los datos sienten habitualmente una cierta resistencia natural a la aceptación de los errores, mucho más cuando ahora son expuestos “públicamente”. Debido a ello necesitan cierto periodo de aceptación y durante la última reunión del comité de dirección del Open Data Institute, Tim Berners-Lee comparaba este proceso con las 5 etapas del trauma descritas por el modelo Kübler-Ross:

Modelo Kubler-Ross
  1. Negación: Los datos no pueden estar mal, el problema tiene que estar en otro sitio.
  2. Ira: ¿Quién es el responsable y por qué no nos habíamos dado cuenta hasta ahora?
  3. Regateo o Negociación: ¿Podemos ignorar y ocultar los fallos de alguna manera?
  4. Depresión: En realidad estos datos están tan mal que no servirán para nada. Sería mejor dejarlo.
  5. Aceptación: De acuerdo, sabemos que hay un problema. Documentémoslo y describamos el alcance y las limitaciones.

Una vez superadas las etapas anteriores es necesaria la transición hacia una etapa adicional de “Esperanza” en la que finalmente nos damos cuenta de que, gracias a que los datos están ahora más expuestos, podemos contar también con más ayuda, mejores herramientas y canales de feedback para poder corregir los problemas y usarlos en nuestro beneficio para mejorar la calidad final.

3 – Las tres vertientes de la interoperabilidad.

Podemos descomponer la problemática de la interoperabilidad de los datos en tres componentes principales.

Interoperabilidad Técnica

Interoperabilidad Técnica

En este nivel hablamos de infraestructuras, protocolos y tecnologías utilizadas para compartir datos de forma común para que los sistemas puedan hablar entre sí.

Este punto generalmente no suele resultar especialmente conflictivo, al contar ya con una base de infraestructuras y tecnologías en Internet y la Web suficientemente maduras y adecuadas para este fin. No obstante la creación de frameworks específicos y adecuados para cubrir las necesidades de este tipo de proyectos puede ayudar a facilitar considerablemente el uso y aprovechamiento de los datos. Un ejemplo en esta línea sería el proyecto Europeo FI-WARE que explota el concepto cada vez más extendido de las Open APIs.

Interoperabilidad Semántica

Interoperabilidad SemánticaAquí nos centramos en que los sistemas sean capaces no únicamente de hablar, sino de entenderse entre ellos. Está vertiente se encuentra a medio camino entre la parte más técnica y la más humana, y será la capa encargada de facilitar los estándares adecuados para la representación de los datos y la información, de forma que pueda analizarse e intercambiarse automáticamente, pero al mismo tiempo mantenga también su capacidad de poder ser comunicada a las personas de forma comprensible para ellos.

Interoperabilidad Sintáctica o Humana

Interoperabilidad SintácticaEste último componente se centra en las personas que tienen que llegar a acuerdos y convenios para “hablar el mismo idioma”¿Qué es el Open Data? ¿Qué principios sigue? ¿Cómo se hace “bien”? ¿Qué datos hay que abrir? ¿Con qué estándar y en qué formato? ¿Qué modelo deben seguir unos determinados datos? ¿Sirve un único modelo para todo el mundo?

Poner a todo el mundo de acuerdo para dar respuesta común a estas preguntas es quizás el reto más grande, y más difícil será aún cuanto más global es el objetivo, ya que a los retos propios del Open Data tenemos que unir aquellos relacionados con el Big Data o la Internacionalización (en ambas vertientes: globalización y localización) y el reto del Broad Data.

En esta parte se están centrando actualmente múltiples grupos de trabajo en organizaciones tan diversas como el G8, el Grupo del Open Data del Open Government Partnership, la iniciativa de Interoperabilidad de la Comisión Europea, la Global Open Data Initiative, la actividad de Datos del W3C, etc.

Calidad e interoperabilidad en tres casos de uso.

Las intervenciones de mis compañeros de mesa se centraron en explicar la necesidad y los beneficios de las acciones para asegurar la calidad e interoperabilidad de los datos en tres casos de uso distintos y a cada cual más interesante: La directiva Inspire, la actualización de la Directiva Europea de Reutilización de la Información y el proyecto Open Data Canarias.

Sus intervenciones y la del resto de las mesas del encuentro, así como entrevistas y otros materiales audiovisuales pueden consultarse en el mini-site temático SpainESData.

The new Open Government Partnership Open Data Working Group

Governments are increasingly creating new open data initiatives and they are the most popular Open Government Partnership commitment so far. Still, the potential of Open Data and its implications for governance are only starting to be articulated.

The mission of the OGP Open Data Working Group is to hold the promise of radically transforming the way government and societies work together to analyze and solve challenges; helping OGP governments implement their commitments and develop more ambitious and innovative action plans related to open data.

Open Government Partnership

More specifically, the new Open Data Working Group aims to:

  • Serve as a guiding voice on open data issues to help OGP governments implement their action plans and develop ambitious new commitments.
  • Increase awareness of open government data issues across the OGP.
  • Amplify and broaden the evidence base for open data reforms.
  • Gather and strengthen existing resources.
  • Engage with the broader global open data community.

Participation in the group is open to all OGP countries and civil society organizations working on open data issues. I was invited to participate on behalf of OpenKratio, a citizens’ group that promote Open Government and Open Data values within the society and the only Spanish representation in the group so far.

OpenKratio.org

The working group first convened on the side of the OGP Summit in London last October. Topics that were discussed during the meeting included:

  1. Open Data measurement – the need to better understand the impacts of open data.
  2. Capacity building – what’s yet to be done and were are the gaps.
  3. Data standards – how to cross-link between information silos to achieve greater impact.
  4. Developing and implementing stronger open data commitments – is there a need for a common set of principles?

There was also a formal launch in a public event as part of the really interesting OGP summit general agenda, which included several high-level participants from governments and civil society, such as Tim Berners-Lee (Founding Director of the Web Foundation; President and Co-Founder of the Open Data Institute) and Beth Noveck (Professor of The Gov Lab, New York University).

This panel explored the current reality of open data implementation, drawing upon early findings from the Open Data Barometer study, and how to move faster to close the gap between rhetoric and reality to unlock the real potential of open data.

The group is currently working on a more specific concept note that will drive the group work in the future on the basis of the feedback and input from the first meeting. Stay tuned for the next steps of the Group during the following months.

Emprender con datos – retos y oportunidades: Open Data, Big Data, Linked Data

La posibilidad de que tanto los ciudadanos como las empresas puedan acceder y utilizar a cada vez un mayor volumen y variedad de datos, gracias al auge del Open Data, Big Data y Linked Data, está permitiendo el nacimiento de un nuevo modelo de negocio basado en la creación de productos y servicios de valor añadido a partir de esa información.

Jornadas emprender con datos. 25 Noviembre. http://www.coworkingtaluderia.es/

Son ya varios los estudios económicos a nivel internacional que indican que las estimaciones del volumen potencial de negocio en torno a los datos en los próximos años son muy elevadas, entorno a los 200 billones de euros en toda Europa, pudiendo llegar a los 50.000 millones de euros sólo en España (el 5% del PIB nacional) si tenemos en cuenta también las potenciales sinergias con la industria de los contenidos digitales. Además la industria de los datos generará alrededor de 5 millones de puestos de trabajo en los próximos años.

Por eso, y en colaboración con la iniciativa Oviedo Emprende, hemos organizado unas jornadas en las que hablaremos de los retos y oportunidades para los emprendedores que trabajan con datos en las que reuniremos a especialistas en el área con varios emprendedores que ya están utilizando los datos como materia prima en sus proyectos de formas muy variadas para debatir sobre las posibilidades de negocio utilizando los datos como materia prima.

En primer lugar conoceremos las últimas tendencias y oportunidades en torno a los datos:

  • Open Data, modelos de negocio, tendencias y oportunidades – Carlos Iglesias, Experto Open Data y Consultor TIC Independiente.
  • Startups y emprendedores – Marco Laucelli, responsable de ISVs & Startups en IBM.
  • Investigación, transferencia de conocimiento, innovación abierta e internacionalización en el mundo de los datos – Sergio García, Director de I+D+i en Treelogic.
  • Linked Open Data, un mundo de posibilidades – Jose Emilio Labra, Investigador principal del grupo WESO (Web Semantics Oviedo) y Profesor Asociado del Departamento de Informática de la Universidad de Oviedo.

A continuación conoceremos de primera mano varias experiencias prácticas por parte de algunos “emprendedores de los datos”:

Y durante el debate final se plantearán y se intentará dar respuesta a preguntas cómo:
  • ¿Qué modelos de negocio se pueden plantear en torno a los datos?
  • ¿Qué otros servicios de valor añadido se pueden explotar alrededor de los datos
  • ¿Qué problemas existen a la hora de acceder y explotar a los datos?
  • ¿Qué datos son los más útiles? ¿Cuáles se echan de menos?
  • ¿Cuál es el grado actual de colaboración de la administración?
  • ¿Es fácil reutilizar los datos actualmente? ¿Qué haría falta para que fuese más fácil?
  • Servicios o datos ¿Qué quieren realmente los usuarios?

¡Reserva ya tu plaza para participar!

Participación en el plan de Apertura de Datos y Reutilización de Navarra

Con el fin de impulsar la reutilización, y tras dos años de funcionamiento de la iniciativa Open Data Navarra, se propone la realización de un Plan de Apertura de Datos y Reutilización que maximice el valor de la información pública y en el que todo el mundo puede participar.

En primer lugar quiero dar mi enhorabuena a Navarra por ser una de las Comunidades Autónomas que siguen impulsando y apostando por la apertura de datos y la reutilización, y especialmente por apostar además por la participación desde el principio.

En cuanto a mi aportación, dado que la iniciativa Open Data de Navarra no parte de cero, sino que cuenta ya con cierto recorrido, lo lógico sería centrar el plan actual en definir el modelo de madurez que se le quiere dar al proyecto, estableciendo las actuaciones necesarias para:

Aunque el primer paso lógico sería hacer ese análisis de partida, viendo la situación actual de la iniciativa de Navarra cabe pensar ya de antemano y a grandes rasgos en algunas sugerencias para actuaciones de mejora que parecen razonables en cada uno de los ejes principales:

Estrategia

Revisar, orientar y escalar para que en base a la situación de partida podamos definir un modelo de madurez adecuado que nos permita cumplir los objetivos deseados, teniendo en cuenta también la nueva Directiva Europea de Reutilización de la Información en el Sector Público, cuyas directrices deberán incorporar los países miembros a lo largo de los próximos meses.

Deben tenerse también en cuenta, e incluirse dentro de la estrategia, todas las cuestiones presupuestarias, normativas y organizativas necesarias para garantizar su viabilidad económica y de recursos.

Soporte

Fomentar la interoperabilidad semántica y sintáctica de los datos definiendo sistemas de referencia e identificadores globales y comunes, utilizando vocabularios y estándares adecuados, así como documentando suficientemente los datos y los procedimientos (tanto internos como externos).

Priorizar la publicación de la información según su utilidad y su posible efecto de escala en base a otra información ya publicada o recomendada por otras iniciativas nacionales e internacionales de referencia como las próximas pautas sobra la publicación de datos de la Comisión Europea o los datos de alto valor propuestos por el Open Data Charter.

Tecnología

Asegurar la sostenibilidad de la infraestructura tecnológica de publicación. Adaptarse a las recomendaciones del esquema nacional de interoperabilidad y la norma técnica de interoperabilidad de reutilización de recursos de información, así como al perfil de aplicación DCAT-AP para la interoperabilidad de portales de datos europeos.

Plantearse una evolución escalable hacia una estrategia de “Open APIs” mediante la cual los sistemas de la administración estén preparados para compartir sus datos por defecto. Desarrollar y/o adoptar herramientas y toolkits que faciliten la transformación y publicación de los datos minimizando esfuerzos.

Participación, Colaboración y Explotación

Establecer líneas de colaboración y apoyo mutuo con otras iniciativas para la coordinación de objetivos y la optimización de recursos. La colaboración debe establecerse a todos los niveles, desde lo local a lo global:

Establecer lazos y actuaciones comunes con el tejido reutilizador de la región (empresas y emprendedores, universidades y centros de investigación, centros de formación, ciudadanía, etc.)

Fomentar la reutilización de forma activa y continuada, utilizando los medios más adecuados en cada caso para su correcta difusión y evolucionando hacia acciones de colaboración con mayor sostenibilidad y continuidad, colaborando activamente con distintos reutilizadores en proyectos conjuntos desde su misma gestación y buscando cubrir las necesidades de ambas partes.

Próximos pasos

Evidentemente, el siguiente paso lógico debería ser traducir estas líneas generales en actuaciones concretas. Aquí las posibilidades son múltiples, desde actuaciones aisladas orientadas a obtener resultados inmediatos para alguno de los objetivos:

  • Desarrollo de apps temáticas.
  • Procesos para la transformación y publicación en masa de datos para ampliar el catálogo.
  • Enriquecimiento de datos con otros conjuntos externos.
  • Toolkits para facilitar la visualización y comparación.
  • Etc.

Hasta proyectos de evolución o colaboración más complejos con resultados a medio-largo plazo:

  • Infraestructuras Open API.
  • Incubadoras Open Data.
  • Proyectos multi-sectoriales.
  • Marketplaces de datos y aplicaciones.
  • Planes de participación y formación de comunidades para la colaboración ciudadana.
  • etc.

La elección final dependerá siempre del análisis de situación actual, de los objetivos perseguidos y de los medios con los que se cuente para llevarlas a cabo.

 

Open Data: de la transparencia al negocio

Esta es la entrevista que me hicieron para el artículo sobre las posibilidades de negocio del Open Data en el último número de la revista Fundetec y publicada también en Infotics.

La posibilidad de que tanto los ciudadanos como las empresas puedan acceder y utilizar los datos almacenados por las administraciones está permitiendo el nacimiento de un nuevo modelo de negocio basado en la creación de productos y servicios de valor añadido a partir de esta información pública.

Open Data: la transparencia hecha negocio en la revista Fundetec

Los expertos afirman que brindan un sinfín de posibilidades a los usuarios y desarrolladores para crear múltiples aplicaciones y negocios en la red.

P1 – ¿ Nos podía concretar alguna de esas posibilidades?

Desde mi punto de vista el verdadero potencial reside en el hecho de que por mucho que se intente no creo que haya nadie capaz de concretar esas posibilidades, y eso es debido a que el concepto de la innovación aplicado al Open Data se basa principalmente en dos premisas:

  • El principio de las muchas mentes:

“La mejor forma de explotar tus datos se le ocurrirá siempre a otro” – Jo Walsh y Rufus Pollock.

  • La Ley de Joy:

“No importa quien seas, la personas más brillantes trabajan siempre para otros” – Bill Joy.

Sumando ambas premisas es cuando nos damos cuenta de que las posibilidades residen precisamente en unir la apertura de los datos con la creatividad de aquellos que los vayan a combinar y transformar para poder ser utilizados. No existen fórmulas mágicas, la clave fundamental sigue siendo la misma de siempre, pensar en cuáles son las necesidades de las personas y buscar la mejor manera posible de poder satisfacerlas, la única diferencia es que ahora tenemos la oportunidad de poder acceder cada día a más datos y a nuevas fuentes como las que proporcionan las redes sensoriales de las Smart Cities, lo que multiplica las posibilidades.

P2 – En este momento en España ¿Cuáles son  las principales iniciativas y fuentes de datos en abierto disponibles?

En España contamos ya con unas veinte iniciativas a todos los niveles. A nivel nacional tenemos no sólo el Catálogo Nacional de Datos, sino también con cierto marco legislativo, una serie de planes estratégicos en desarrollo, guías prácticas, un marco de interoperabilidad para la reutilización de recursos de la información y otras medidas de apoyo con el objetivo de conseguir que el número de conjuntos de datos disponibles vaya aumentando gradualmente tanto en cantidad como en calidad.

A nivel regional existen también múltiples iniciativas, desde las pioneras en Euskadi, Asturias o Cataluña hasta la más reciente en Aragón, y a nivel local ciudades como Zaragoza y Gijón fueron las encargadas de abrir un camino al que se han ido sumando otras como las recién incorporadas Pamplona y Terrassa.

Pero lo más importante es que el Open Data sigue muy vivo y no hay prácticamente un mes en el que no se anuncie otra iniciativa. En lo poco que llevamos de año ya llevamos cuatro nuevas iniciativas y seguiremos sumando, porque estoy convencido que este será el año de las iniciativas en las ciudades y comenzaremos a ver cada vez más a lo largo del mundo.

P3 – ¿Cómo y para qué pueden utilizar las empresas estos datos?

Todas las empresas utilizan datos en mayor o menor medida para su actividad diaria. La variedad de datos y su potencial es tan grande que el límite en cuanto a sus posibilidades de aplicación lo pone únicamente la imaginación.

Algunos datos son de aplicación más transversal, como la Información Geográfica y la Meteorología, y por tanto pueden ser de utilidad prácticamente para cualquier empresa o negocio. Otros datos pueden tener nichos de explotación mucho más específicos como por ejemplo los datos relacionados con la sanidad o las investigaciones clínicas, pero aun así al tratar cuestiones de claro interés público pueden dar lugar también a servicios con un mercado potencial muy amplio.

P4 – ¿Cuáles son los datos más utilizados y a partir de ellos qué servicios están surgiendo?

Los datos que suscitan un mayor interés suelen ser aquellos relacionados con Información Geográfica y Cartografía, Información Económica, Jurídica y Legal, Estadística y Sociodemografía, Transportes, Sanidad, Educación, Empleo, Seguridad, etc.

Sin embargo, no todos están siempre disponibles, así que dependiendo del país y el caso concreto los datos más utilizados pueden ser unos u otros. En principio, los datos relacionados con la Información Geográfica son con diferencia los más demandados y al mismo tiempo los más utilizados a nivel global, a lo que contribuye sin duda que las estimaciones indican que aproximadamente un 80% de las decisiones que deben tomar tanto las autoridades públicas como las grandes empresas cuentan con un componente geoespacial. Por otro lado ese éxito es debido también en buena parte a la directiva INSPIRE, que ha conseguido proporcionar un marco común para las infraestructuras del ámbito geoespacial a nivel Europeo, dando así lugar al caldo de cultivo ideal para el éxito en la reutilización.

P5 – ¿Es difícil usarlos?

Conseguir que los datos estén disponibles, y que además se publiquen bajo unas condiciones de uso que permitan su reutilización es ya un gran paso. Sin embargo, en muchos casos el tratamiento de los datos resulta un proceso bastante más costoso de lo que sería razonable debido a que no se publican de la forma adecuada. Esto da lugar a que se tenga que invertir tiempo y recursos en su tratamiento que serían mucho más productivos si se utilizasen para el análisis posterior, que es la parte del proceso donde realmente se genera valor.

Utilizar formatos que sean legibles por las máquinas, adoptar vocabularios estandarizados para los datos y documentarlos adecuadamente son acciones imprescindibles para facilitar la reutilización, eliminar barreras de entrada a nuevas empresas para que puedan crear sus productos o servicios y conseguir que exista un mercado de datos vivo y dinámico.

P6 – ¿Hay que tener conocimientos específicos o una base tecnológica para utilizarlos?

La gran variedad de datos existente, las posibilidades que ofrecen los múltiples formatos disponibles y la proliferación de herramientas que facilitan o incluso automatizan en parte su tratamiento hacen que hoy en día prácticamente cualquiera pueda experimentar con los datos si se lo propone y le dedica un poco de tiempo.

Por supuesto, cuanto más complejos sean los datos o el análisis que queramos realizar sobre ellos mayores serán también los conocimientos específicos que debemos tener para poder sacarles partido, y es ahí donde surge la necesidad de todo un mercado especializado de intermediarios de datos o infomediarios.

No hay que olvidar que el análisis y tratamiento de los datos es toda una ciencia por sí misma, que de hecho se viene denominando “Data Science”, y que implica la participación de múltiples y variados perfiles para poder exprimirle todo el jugo a los datos, desde profesionales de las matemáticas y la estadística hasta especialistas en algoritmos de tratamiento de datos o expertos en su visualización, pasando por supuesto por las personas capacitadas para el estudio de la materia específica que se esté analizando en cada caso, ya sea sanidad, educación, transportes, etc.,

Y es que no es lo mismo hacer una aplicación para móvil que nos indique cuáles son las farmacias de guardia que proponerse realizar un estudio sobre el genoma humano por ejemplo. Aunque en ambos casos estaremos creando nuevos productos y servicios útiles para la sociedad y basados en el Open Data, los conocimientos requeridos, los medios necesarios para llevarlos a cabo y los beneficios obtenidos en uno y otro caso serán obviamente muy distintos.

P7 – En este momento ¿Qué número de empresas han desarrollado en nuestro país algún servicio a partir de estos datos públicos?

Ese es un dato que es difícil de estimar, debido a que no se cuenta con ningún censo oficial de referencia, y el hecho de que nuestro registro mercantil sea un conjunto de datos completamente cerrado tampoco ayuda a facilitar este tipo de análisis.

En el caso de España se suele tomar como referencia el estudio del sector infomediario realizado por el ONTSI, que en su última edición realizó un censo de más de 150 empresas en el sector. Sin embargo, mi propia experiencia me indica que es mucho más que probable que la realidad del mercado sea considerablemente mayor, ya que el censo utilizado no es exhaustivo y existe todo un mercado paralelo de actividades relacionadas con los datos que actualmente no se recogen y que es difícil de cuantificar.

Por otro lado, nos encontramos en una fase en la que el mercado está todavía tomando forma, y una vez se empiecen a poner en marcha medidas adicionales que aporten mayor seguridad y sostenibilidad al sector, como por ejemplo la unificación de las licencias de uso o la aplicación de compromisos de servicio que garanticen la disponibilidad de los datos y eliminen la incertidumbre para los emprendedores que quieran montar sus servicios sobre unos determinados datos.

P8 – ¿Qué volumen de negocio generan?

Se han realizado varios estudios a nivel internacional al respecto y, aunque las cifras no siempre coinciden, lo que sí que tienen todos en común es que las estimaciones son siempre optimistas y los volúmenes de negocio son realmente considerables.

En el caso de España nuevamente podemos tomar como referencia inicial el estudio del ONTSI que hace unas estimaciones de un volumen de negocio de unos 500 millones de euros para el conjunto del sector. Sin embargo es más que probable que la realidad del mercado sea considerablemente mayor, ya que al hecho de que el censo de empresas no sea exhaustivo hay que sumarle que no se exploran en profundidad posibles sinergias con otros sectores. Por ejemplo, la Asociación Multisectorial de la Información (ASEDIE) hace unas estimaciones de cifras de negocio en torno a 50.000 millones de euros si tenemos en cuenta también las potenciales sinergias entre el Open Data y la industria de los contenidos digitales, lo que podría llegar a suponer hasta un 5% del PIB nacional.

Además, en muchos casos los modelos de negocio todavía no están claramente definidos y se siguen explorando las posibilidades, por lo que a medida que el mercado vaya alcanzado también una mayor madurez en ese sentido es previsible que eso se haga notar también en el volumen de negocio.

Por supuesto, e independientemente de todas estas cifras económicas, tampoco podemos olvidar que gracias al Open Data se generan también otra serie de valores intangibles para la sociedad como mejoras en la transparencia del Gobierno y la participación de los ciudadanos.

P9 – Territorialmente ¿En qué Comunidad Autónoma hay un mayor grado de reutilización de esta información o mayor número de empresas?

Dado que Internet y las Nuevas Tecnologías son los habilitadores que facilitan las tareas de compartir y analizar grandes cantidades de información es un hecho que las empresas cuya base de negocio consiste en la reutilización de datos suelen tener también un componente tecnológico considerable. Como es lógico entonces, se detecta también una mayor concentración de empresas reutilizadoras allí donde también se encuentra una mayor concentración de empresas con estas características, es decir principalmente Madrid y Cataluña.

En cuanto a los lugares dónde se puede concentrar más la reutilización yo diría que el interés por los datos es global y por tanto no creo que exista tal concentración, si bien como es evidente en cada caso el grado de reutilización será directamente proporcional a la cantidad de información disponible, el valor de los datos publicados y el ecosistema de reutilizadores que se forme a su alrededor. Si tenemos en cuenta esas tres variables quizás podamos destacar nuevamente a Cataluña, puesto que cuenta ya con un gran número de iniciativas que publican algunos datos realmente interesantes y con un completo ecosistema de reutilización vivo, activo y coordinado, elementos que en su conjunto a día de hoy no encontramos todavía en ninguna otra región.

P10 – La Comisión Europea ha estrenado este año su nuevo portal de datos abiertos en el que quiere que participen todos sus organismos ¿Puede suponer esto el definitivo impulso para este sector de contenidos que llaman infomediario?

El portal que recientemente ha publicado la Comisión Europea para facilitar el acceso a la información de sus propias instituciones es un nuevo paso hacia delante dentro de la política global que lleva ya a cabo desde hace algunos años para fomentar la reutilización de la información de los organismos públicos.

Dentro de esa misma política de promoción del Open Data en el ámbito Europeo, está previsto también que este mismo año salga a concurso un nuevo portal pan-europeo en el que los distintos países miembro puedan federar sus datos formando así un macrocatálogo de información pública a nivel europeo, así como con otras medidas que incluyen acciones para la publicación de más conjuntos de datos y el fomento de las tecnologías de datos enlazados o la difusión y sensibilización en el sector público a través de la renovación de la ePSI Platform.

Desde luego todas estas medidas son pasos positivos para el impulso de la economía en torno al Open Data, ya que supondrán una mayor disponibilidad de datos de alto valor y en un formato que facilite su explotación, pero en mi opinión el impulso más importante y puede que definitivo será la puesta en marcha de la Incubadora Open Data Europea, que de forma similar al trabajo realizado por el Open Data Institute en el Reino Unido, trabajará para facilitar a las empresas los datos que necesitan y los medios para poder llevar a cabo sus proyectos. Espero que algún día podamos ver esos mismos modelos replicados también en España, puesto que creo que las medidas relacionadas con el Gobierno Abierto y el Open Data incluidas en la Agenda Digital van por el camino correcto, pero echo también en falta otras actuaciones que las complementen.

Actualización – Desde la realización de esta entrevista se han producido un par de novedades importantes que tienen mucho que ver con lo que en ella se comenta:

Interoperabilidad de los catálogos Open Data Europeos

Se acaba de abrir el plazo de comentarios y revisión pública del borrador de la especificación para el perfil de Aplicación de DCAT destinado a mejorar la interoperabilidad de Catálogos Open Data en la Unión Europea.

El perfil de aplicación de DCAT para portales Open Data Europeos (DCAT-AP) es una especificación para describir mediante metadatos los conjuntos de datos del sector público, de forma que se esas descripciones puedan ser compartidas entre diferentes catálogos o agregadas en un único punto de acceso común. La especificación forma parte del programa ISA de soluciones de interoperabilidad para Administraciones públicas Europeas de la Comisión Europea, dentro de la iniciativa Joinup de interoperabilidad semántica.

ISA | JoinUp | DCAT-AP

DCAT-AP toma como base principal el Vocabulario de Catálogos de Datos (DCAT) – estándar definido por el W3C que ya está siendo utilizando en varios Catálogos tanto en España como en Europa – así como otros vocabularios de referencia como ADMS o Dublin Core. Los objetivos principales de la especificación son:

  1. Identificar los elementos esenciales de DCAT para el contexto Europeo.
  2. Identificar los vocabularios comunes que se utilizarán como referencia en el contexto Europeo.
  3. Identificar el conjunto mínimo de metadatos para el intercambio de información entre catálogos Open Data en Europa.

DCAT-AP indica los metadatos mínimos necesarios para cumplir con las necesidades de los catálogos Open Data proporcionando así un mecanismo de interoperabilidad semántica con otras aplicaciones. Es también importante destacar que, si bien DCAT-AP está desarrollado bajo el modelo de RDF, la intención es definir únicamente el formato de intercambio y no el entorno operativo del catálogo, por lo cual también podrá ser utilizado en entornos que no implementen una solución Linked Data completa.

Además de las clases y propiedades que forman parte del perfil de aplicación el documento de trabajo incluye otras secciones interesantes como:
  • Otros perfiles de aplicación – entre los que se incluye la Norma Técnica de Interoperabilidad de Reutilización de recursos de la información – y modelos de descripción de conjuntos de datos que están siendo ya utilizados en Europa y que han servido como input para este trabajo.
  • Diferentes escenarios y casos de uso de ejemplo para la aplicación de DCAT-AP.
  • Vocabularios de referencia propuestos para su utilización de forma conjunta con el perfil de aplicación.
  • Aspectos de accesibilidad y multilingüismo que se deberán tener en cuenta.
  • Cuestiones relacionadas con el entorno de despliegue de DCAT-AP.

Participa

La definición de DCAT-AP se lleva a cabo a través del consenso de un grupo internacional de expertos que participan en distintas iniciativas Open Data de la Unión Europea. No obstante, el Vocabulario se encuentra ahora en fase de revisión pública durante las próximas cuatro semanas y es muy importante que todos los interesados revisen la especificación y comenten sus impresiones para entre todos poder conseguir la máxima interoperabilidad tanto por parte de los proveedores de datos como de los potenciales consumidores.

También se puede consultar el historial de las distintas cuestiones que se han ido debatiendo a lo largo del desarrollo del perfil de aplicación.

Building the foundation for an Open Data Directory

This post was first published at the ePSI Platform and the Open Knowledge Foundation blog.

Open (Government) Data as it is understood nowadays can still be considered a new concept. It started to gain traction worldwide since the Obama memo in early 2009 and the launch of data.gov a few months later. Following successful leading examples of the US and UK governments we have seen Open Data flourishing all over the world over the last three years. More than two hundred Open Data catalogs have been identified so far.

But still, it’s not always clear how to deliver good solutions and many questions remain unanswered. In order to build sustainable Open Data initiatives in a varied range of countries a broader view to address challenges is needed. New and existing initiatives willbenefit from shared knowledge and will also produce a range of resources that should be published in a freely and open way for others to reuse.

As the Open Data movement is growing worldwide; the number of available resources is also increasing. The scarcity of only 3-4 years ago is ending but the resources are appearing in disparate places and formats, sometimes difficult to find and share. There is a pressing need to compile and document existing resources that are verified, trustworthy, comparable, and searchable.

The Open Data Directory

Upon discussions with many in the Open Data community, an initial analysis of their own project needs and preliminary research on existing public resources, the Web Foundation believes that the community at large would benefit from a central entry point to Open Data related resources at a neutral source, the Open Data Directory (ODD).

This ODD will help to produce clear evidence base of the benefits of Open Data holding a wide range of resources types such as: use cases, case studies, stories and anecdotes, methodologies, strategies, business cases, papers, reports, articles, blog posts, training materials, slide sets, software tools, applications andvisualisations. The directory will not focus on compiling a vast number of references, instead it will give priority to high-quality references endorsed by the Open Data community.

As a first step towards the ODD, we are making public the Use Cases and Requirements Draft in order to get comments from the wide community, not only on the content of the document itself but also on the overall idea of the ODD. We’ve published it as a Google Document with comments turned on. This is a tool for you, the Open Data community, so suggestions, feedback and comments are very welcome. The extended deadline for submitting comments is: April 29th, 2013.

Nueva Directiva Europea de Reutilización de la Información del Sector Público

Recientemente el Comité de Representantes de los países miembro de la Unión Europea ha dado su visto bueno a la actualización de la Directiva de Reutilización de la Información del Sector Público. Aunque todavía habrá que esperar al trámite de su aprobación por el Parlamento Europeo en Junio, es de esperar que no se produzcan cambios ni retrasos significativos.

En general la nueva Directiva supone un avance respecto a la directiva anterior del 2003 y un nuevo paso adelante en la estrategia Open Data de la Unión Europea, destacando la intención general de la actualización:

“Una vez implementada la nueva Directiva establecerá un derecho legítimo sobre la reutilización de la información pública que no estaba presente en la Directiva del 2003” – Neelie Kroes, Vicepresidenta de la Unión Europea.

No obstante, tras un primer análisis inicial por parte de la comunidad parece que sigue también habiendo algunos puntos mejorables, por ejemplo:

  • Existe la posibilidad de cargar costes marginales en el tratamiento de los datos y mantener otros modelos adicionales de ingresos mediante tasas cuando sean de aplicación en casos concretos con normativas propias.
  • En general se permite la aplicación de cualquier tipo de tasas, siempre que se justifique y se aplique de forma transparente, ignorando los efectos negativos que la aplicación de tasas tiene sobre la reutilización o los beneficios indirectos adicionales que una mayor apertura de los datos puede proporcionar.
  • Los formatos abiertos y legibles por máquinas serán obligatorios, pero siempre que sea posible y apropiado. Un matiz que sin duda dará lugar a distintas interpretaciones que permitan saltarse la regla general.
  • Se mantienen los acuerdos exclusivos de explotación de los datos siempre que sean por el bien del interés público. Lo que en la práctica supone la posibilidad de perpetuar estos acuerdos.

En cualquier caso, también existen puntos muy positivos, como la garantía de que los documentos afectados por las libertad de información deben ser no únicamente accesibles, sino también reutilizables, las mejoras sustanciales en los mecanismos de reclamación para garantizar su independencia, la promoción de licencias únicas, automatizables y estándar para todos los organismos dentro de un mismo estado miembro o la ampliación de la directiva al ámbito cultural.

Por tanto, y aunque tengamos todavía un par de años de transposición por delante una vez aprobada por el Parlamento, en general la Directiva supone un nuevo avance del Open Data en la Agenda Digital Europea, y por tanto bienvenida sea. Estaremos pendientes también de cómo se lleva a cabo la transposición de la Directiva en el caso de España y el impacto que tendrá sobre la actual Ley de Reutilización del Sector Público.