Open Data: de la transparencia al negocio

Esta es la entrevista que me hicieron para el artículo sobre las posibilidades de negocio del Open Data en el último número de la revista Fundetec y publicada también en Infotics.

La posibilidad de que tanto los ciudadanos como las empresas puedan acceder y utilizar los datos almacenados por las administraciones está permitiendo el nacimiento de un nuevo modelo de negocio basado en la creación de productos y servicios de valor añadido a partir de esta información pública.

Open Data: la transparencia hecha negocio en la revista Fundetec

Los expertos afirman que brindan un sinfín de posibilidades a los usuarios y desarrolladores para crear múltiples aplicaciones y negocios en la red.

P1 – ¿ Nos podía concretar alguna de esas posibilidades?

Desde mi punto de vista el verdadero potencial reside en el hecho de que por mucho que se intente no creo que haya nadie capaz de concretar esas posibilidades, y eso es debido a que el concepto de la innovación aplicado al Open Data se basa principalmente en dos premisas:

  • El principio de las muchas mentes:

“La mejor forma de explotar tus datos se le ocurrirá siempre a otro” – Jo Walsh y Rufus Pollock.

  • La Ley de Joy:

“No importa quien seas, la personas más brillantes trabajan siempre para otros” – Bill Joy.

Sumando ambas premisas es cuando nos damos cuenta de que las posibilidades residen precisamente en unir la apertura de los datos con la creatividad de aquellos que los vayan a combinar y transformar para poder ser utilizados. No existen fórmulas mágicas, la clave fundamental sigue siendo la misma de siempre, pensar en cuáles son las necesidades de las personas y buscar la mejor manera posible de poder satisfacerlas, la única diferencia es que ahora tenemos la oportunidad de poder acceder cada día a más datos y a nuevas fuentes como las que proporcionan las redes sensoriales de las Smart Cities, lo que multiplica las posibilidades.

P2 – En este momento en España ¿Cuáles son  las principales iniciativas y fuentes de datos en abierto disponibles?

En España contamos ya con unas veinte iniciativas a todos los niveles. A nivel nacional tenemos no sólo el Catálogo Nacional de Datos, sino también con cierto marco legislativo, una serie de planes estratégicos en desarrollo, guías prácticas, un marco de interoperabilidad para la reutilización de recursos de la información y otras medidas de apoyo con el objetivo de conseguir que el número de conjuntos de datos disponibles vaya aumentando gradualmente tanto en cantidad como en calidad.

A nivel regional existen también múltiples iniciativas, desde las pioneras en Euskadi, Asturias o Cataluña hasta la más reciente en Aragón, y a nivel local ciudades como Zaragoza y Gijón fueron las encargadas de abrir un camino al que se han ido sumando otras como las recién incorporadas Pamplona y Terrassa.

Pero lo más importante es que el Open Data sigue muy vivo y no hay prácticamente un mes en el que no se anuncie otra iniciativa. En lo poco que llevamos de año ya llevamos cuatro nuevas iniciativas y seguiremos sumando, porque estoy convencido que este será el año de las iniciativas en las ciudades y comenzaremos a ver cada vez más a lo largo del mundo.

P3 – ¿Cómo y para qué pueden utilizar las empresas estos datos?

Todas las empresas utilizan datos en mayor o menor medida para su actividad diaria. La variedad de datos y su potencial es tan grande que el límite en cuanto a sus posibilidades de aplicación lo pone únicamente la imaginación.

Algunos datos son de aplicación más transversal, como la Información Geográfica y la Meteorología, y por tanto pueden ser de utilidad prácticamente para cualquier empresa o negocio. Otros datos pueden tener nichos de explotación mucho más específicos como por ejemplo los datos relacionados con la sanidad o las investigaciones clínicas, pero aun así al tratar cuestiones de claro interés público pueden dar lugar también a servicios con un mercado potencial muy amplio.

P4 – ¿Cuáles son los datos más utilizados y a partir de ellos qué servicios están surgiendo?

Los datos que suscitan un mayor interés suelen ser aquellos relacionados con Información Geográfica y Cartografía, Información Económica, Jurídica y Legal, Estadística y Sociodemografía, Transportes, Sanidad, Educación, Empleo, Seguridad, etc.

Sin embargo, no todos están siempre disponibles, así que dependiendo del país y el caso concreto los datos más utilizados pueden ser unos u otros. En principio, los datos relacionados con la Información Geográfica son con diferencia los más demandados y al mismo tiempo los más utilizados a nivel global, a lo que contribuye sin duda que las estimaciones indican que aproximadamente un 80% de las decisiones que deben tomar tanto las autoridades públicas como las grandes empresas cuentan con un componente geoespacial. Por otro lado ese éxito es debido también en buena parte a la directiva INSPIRE, que ha conseguido proporcionar un marco común para las infraestructuras del ámbito geoespacial a nivel Europeo, dando así lugar al caldo de cultivo ideal para el éxito en la reutilización.

P5 – ¿Es difícil usarlos?

Conseguir que los datos estén disponibles, y que además se publiquen bajo unas condiciones de uso que permitan su reutilización es ya un gran paso. Sin embargo, en muchos casos el tratamiento de los datos resulta un proceso bastante más costoso de lo que sería razonable debido a que no se publican de la forma adecuada. Esto da lugar a que se tenga que invertir tiempo y recursos en su tratamiento que serían mucho más productivos si se utilizasen para el análisis posterior, que es la parte del proceso donde realmente se genera valor.

Utilizar formatos que sean legibles por las máquinas, adoptar vocabularios estandarizados para los datos y documentarlos adecuadamente son acciones imprescindibles para facilitar la reutilización, eliminar barreras de entrada a nuevas empresas para que puedan crear sus productos o servicios y conseguir que exista un mercado de datos vivo y dinámico.

P6 – ¿Hay que tener conocimientos específicos o una base tecnológica para utilizarlos?

La gran variedad de datos existente, las posibilidades que ofrecen los múltiples formatos disponibles y la proliferación de herramientas que facilitan o incluso automatizan en parte su tratamiento hacen que hoy en día prácticamente cualquiera pueda experimentar con los datos si se lo propone y le dedica un poco de tiempo.

Por supuesto, cuanto más complejos sean los datos o el análisis que queramos realizar sobre ellos mayores serán también los conocimientos específicos que debemos tener para poder sacarles partido, y es ahí donde surge la necesidad de todo un mercado especializado de intermediarios de datos o infomediarios.

No hay que olvidar que el análisis y tratamiento de los datos es toda una ciencia por sí misma, que de hecho se viene denominando “Data Science”, y que implica la participación de múltiples y variados perfiles para poder exprimirle todo el jugo a los datos, desde profesionales de las matemáticas y la estadística hasta especialistas en algoritmos de tratamiento de datos o expertos en su visualización, pasando por supuesto por las personas capacitadas para el estudio de la materia específica que se esté analizando en cada caso, ya sea sanidad, educación, transportes, etc.,

Y es que no es lo mismo hacer una aplicación para móvil que nos indique cuáles son las farmacias de guardia que proponerse realizar un estudio sobre el genoma humano por ejemplo. Aunque en ambos casos estaremos creando nuevos productos y servicios útiles para la sociedad y basados en el Open Data, los conocimientos requeridos, los medios necesarios para llevarlos a cabo y los beneficios obtenidos en uno y otro caso serán obviamente muy distintos.

P7 – En este momento ¿Qué número de empresas han desarrollado en nuestro país algún servicio a partir de estos datos públicos?

Ese es un dato que es difícil de estimar, debido a que no se cuenta con ningún censo oficial de referencia, y el hecho de que nuestro registro mercantil sea un conjunto de datos completamente cerrado tampoco ayuda a facilitar este tipo de análisis.

En el caso de España se suele tomar como referencia el estudio del sector infomediario realizado por el ONTSI, que en su última edición realizó un censo de más de 150 empresas en el sector. Sin embargo, mi propia experiencia me indica que es mucho más que probable que la realidad del mercado sea considerablemente mayor, ya que el censo utilizado no es exhaustivo y existe todo un mercado paralelo de actividades relacionadas con los datos que actualmente no se recogen y que es difícil de cuantificar.

Por otro lado, nos encontramos en una fase en la que el mercado está todavía tomando forma, y una vez se empiecen a poner en marcha medidas adicionales que aporten mayor seguridad y sostenibilidad al sector, como por ejemplo la unificación de las licencias de uso o la aplicación de compromisos de servicio que garanticen la disponibilidad de los datos y eliminen la incertidumbre para los emprendedores que quieran montar sus servicios sobre unos determinados datos.

P8 – ¿Qué volumen de negocio generan?

Se han realizado varios estudios a nivel internacional al respecto y, aunque las cifras no siempre coinciden, lo que sí que tienen todos en común es que las estimaciones son siempre optimistas y los volúmenes de negocio son realmente considerables.

En el caso de España nuevamente podemos tomar como referencia inicial el estudio del ONTSI que hace unas estimaciones de un volumen de negocio de unos 500 millones de euros para el conjunto del sector. Sin embargo es más que probable que la realidad del mercado sea considerablemente mayor, ya que al hecho de que el censo de empresas no sea exhaustivo hay que sumarle que no se exploran en profundidad posibles sinergias con otros sectores. Por ejemplo, la Asociación Multisectorial de la Información (ASEDIE) hace unas estimaciones de cifras de negocio en torno a 50.000 millones de euros si tenemos en cuenta también las potenciales sinergias entre el Open Data y la industria de los contenidos digitales, lo que podría llegar a suponer hasta un 5% del PIB nacional.

Además, en muchos casos los modelos de negocio todavía no están claramente definidos y se siguen explorando las posibilidades, por lo que a medida que el mercado vaya alcanzado también una mayor madurez en ese sentido es previsible que eso se haga notar también en el volumen de negocio.

Por supuesto, e independientemente de todas estas cifras económicas, tampoco podemos olvidar que gracias al Open Data se generan también otra serie de valores intangibles para la sociedad como mejoras en la transparencia del Gobierno y la participación de los ciudadanos.

P9 – Territorialmente ¿En qué Comunidad Autónoma hay un mayor grado de reutilización de esta información o mayor número de empresas?

Dado que Internet y las Nuevas Tecnologías son los habilitadores que facilitan las tareas de compartir y analizar grandes cantidades de información es un hecho que las empresas cuya base de negocio consiste en la reutilización de datos suelen tener también un componente tecnológico considerable. Como es lógico entonces, se detecta también una mayor concentración de empresas reutilizadoras allí donde también se encuentra una mayor concentración de empresas con estas características, es decir principalmente Madrid y Cataluña.

En cuanto a los lugares dónde se puede concentrar más la reutilización yo diría que el interés por los datos es global y por tanto no creo que exista tal concentración, si bien como es evidente en cada caso el grado de reutilización será directamente proporcional a la cantidad de información disponible, el valor de los datos publicados y el ecosistema de reutilizadores que se forme a su alrededor. Si tenemos en cuenta esas tres variables quizás podamos destacar nuevamente a Cataluña, puesto que cuenta ya con un gran número de iniciativas que publican algunos datos realmente interesantes y con un completo ecosistema de reutilización vivo, activo y coordinado, elementos que en su conjunto a día de hoy no encontramos todavía en ninguna otra región.

P10 – La Comisión Europea ha estrenado este año su nuevo portal de datos abiertos en el que quiere que participen todos sus organismos ¿Puede suponer esto el definitivo impulso para este sector de contenidos que llaman infomediario?

El portal que recientemente ha publicado la Comisión Europea para facilitar el acceso a la información de sus propias instituciones es un nuevo paso hacia delante dentro de la política global que lleva ya a cabo desde hace algunos años para fomentar la reutilización de la información de los organismos públicos.

Dentro de esa misma política de promoción del Open Data en el ámbito Europeo, está previsto también que este mismo año salga a concurso un nuevo portal pan-europeo en el que los distintos países miembro puedan federar sus datos formando así un macrocatálogo de información pública a nivel europeo, así como con otras medidas que incluyen acciones para la publicación de más conjuntos de datos y el fomento de las tecnologías de datos enlazados o la difusión y sensibilización en el sector público a través de la renovación de la ePSI Platform.

Desde luego todas estas medidas son pasos positivos para el impulso de la economía en torno al Open Data, ya que supondrán una mayor disponibilidad de datos de alto valor y en un formato que facilite su explotación, pero en mi opinión el impulso más importante y puede que definitivo será la puesta en marcha de la Incubadora Open Data Europea, que de forma similar al trabajo realizado por el Open Data Institute en el Reino Unido, trabajará para facilitar a las empresas los datos que necesitan y los medios para poder llevar a cabo sus proyectos. Espero que algún día podamos ver esos mismos modelos replicados también en España, puesto que creo que las medidas relacionadas con el Gobierno Abierto y el Open Data incluidas en la Agenda Digital van por el camino correcto, pero echo también en falta otras actuaciones que las complementen.

Actualización – Desde la realización de esta entrevista se han producido un par de novedades importantes que tienen mucho que ver con lo que en ella se comenta:

Interoperabilidad de los catálogos Open Data Europeos

Se acaba de abrir el plazo de comentarios y revisión pública del borrador de la especificación para el perfil de Aplicación de DCAT destinado a mejorar la interoperabilidad de Catálogos Open Data en la Unión Europea.

El perfil de aplicación de DCAT para portales Open Data Europeos (DCAT-AP) es una especificación para describir mediante metadatos los conjuntos de datos del sector público, de forma que se esas descripciones puedan ser compartidas entre diferentes catálogos o agregadas en un único punto de acceso común. La especificación forma parte del programa ISA de soluciones de interoperabilidad para Administraciones públicas Europeas de la Comisión Europea, dentro de la iniciativa Joinup de interoperabilidad semántica.

ISA | JoinUp | DCAT-AP

DCAT-AP toma como base principal el Vocabulario de Catálogos de Datos (DCAT) – estándar definido por el W3C que ya está siendo utilizando en varios Catálogos tanto en España como en Europa – así como otros vocabularios de referencia como ADMS o Dublin Core. Los objetivos principales de la especificación son:

  1. Identificar los elementos esenciales de DCAT para el contexto Europeo.
  2. Identificar los vocabularios comunes que se utilizarán como referencia en el contexto Europeo.
  3. Identificar el conjunto mínimo de metadatos para el intercambio de información entre catálogos Open Data en Europa.

DCAT-AP indica los metadatos mínimos necesarios para cumplir con las necesidades de los catálogos Open Data proporcionando así un mecanismo de interoperabilidad semántica con otras aplicaciones. Es también importante destacar que, si bien DCAT-AP está desarrollado bajo el modelo de RDF, la intención es definir únicamente el formato de intercambio y no el entorno operativo del catálogo, por lo cual también podrá ser utilizado en entornos que no implementen una solución Linked Data completa.

Además de las clases y propiedades que forman parte del perfil de aplicación el documento de trabajo incluye otras secciones interesantes como:
  • Otros perfiles de aplicación – entre los que se incluye la Norma Técnica de Interoperabilidad de Reutilización de recursos de la información – y modelos de descripción de conjuntos de datos que están siendo ya utilizados en Europa y que han servido como input para este trabajo.
  • Diferentes escenarios y casos de uso de ejemplo para la aplicación de DCAT-AP.
  • Vocabularios de referencia propuestos para su utilización de forma conjunta con el perfil de aplicación.
  • Aspectos de accesibilidad y multilingüismo que se deberán tener en cuenta.
  • Cuestiones relacionadas con el entorno de despliegue de DCAT-AP.

Participa

La definición de DCAT-AP se lleva a cabo a través del consenso de un grupo internacional de expertos que participan en distintas iniciativas Open Data de la Unión Europea. No obstante, el Vocabulario se encuentra ahora en fase de revisión pública durante las próximas cuatro semanas y es muy importante que todos los interesados revisen la especificación y comenten sus impresiones para entre todos poder conseguir la máxima interoperabilidad tanto por parte de los proveedores de datos como de los potenciales consumidores.

También se puede consultar el historial de las distintas cuestiones que se han ido debatiendo a lo largo del desarrollo del perfil de aplicación.

Nueva Directiva Europea de Reutilización de la Información del Sector Público

Recientemente el Comité de Representantes de los países miembro de la Unión Europea ha dado su visto bueno a la actualización de la Directiva de Reutilización de la Información del Sector Público. Aunque todavía habrá que esperar al trámite de su aprobación por el Parlamento Europeo en Junio, es de esperar que no se produzcan cambios ni retrasos significativos.

En general la nueva Directiva supone un avance respecto a la directiva anterior del 2003 y un nuevo paso adelante en la estrategia Open Data de la Unión Europea, destacando la intención general de la actualización:

“Una vez implementada la nueva Directiva establecerá un derecho legítimo sobre la reutilización de la información pública que no estaba presente en la Directiva del 2003” – Neelie Kroes, Vicepresidenta de la Unión Europea.

No obstante, tras un primer análisis inicial por parte de la comunidad parece que sigue también habiendo algunos puntos mejorables, por ejemplo:

  • Existe la posibilidad de cargar costes marginales en el tratamiento de los datos y mantener otros modelos adicionales de ingresos mediante tasas cuando sean de aplicación en casos concretos con normativas propias.
  • En general se permite la aplicación de cualquier tipo de tasas, siempre que se justifique y se aplique de forma transparente, ignorando los efectos negativos que la aplicación de tasas tiene sobre la reutilización o los beneficios indirectos adicionales que una mayor apertura de los datos puede proporcionar.
  • Los formatos abiertos y legibles por máquinas serán obligatorios, pero siempre que sea posible y apropiado. Un matiz que sin duda dará lugar a distintas interpretaciones que permitan saltarse la regla general.
  • Se mantienen los acuerdos exclusivos de explotación de los datos siempre que sean por el bien del interés público. Lo que en la práctica supone la posibilidad de perpetuar estos acuerdos.

En cualquier caso, también existen puntos muy positivos, como la garantía de que los documentos afectados por las libertad de información deben ser no únicamente accesibles, sino también reutilizables, las mejoras sustanciales en los mecanismos de reclamación para garantizar su independencia, la promoción de licencias únicas, automatizables y estándar para todos los organismos dentro de un mismo estado miembro o la ampliación de la directiva al ámbito cultural.

Por tanto, y aunque tengamos todavía un par de años de transposición por delante una vez aprobada por el Parlamento, en general la Directiva supone un nuevo avance del Open Data en la Agenda Digital Europea, y por tanto bienvenida sea. Estaremos pendientes también de cómo se lleva a cabo la transposición de la Directiva en el caso de España y el impacto que tendrá sobre la actual Ley de Reutilización del Sector Público.

Cuando el diseño se encuentra con el Open Data

Los planteamientos de Daniel Torres Burriel sobre cómo ve él las iniciativas Open Data desde su perspectiva de un diseñador, que son de lectura obligada para comprender lo que viene a continuación, me dan pie a iniciar una conversación sobre un tema que ya me había planteado en varias ocasiones: la relación entre el Open Data y el mundo de los diseñadores, así como las oportunidades de interacción y colaboración entre ambos.

Open Data

Empiezo pues agradeciendo a Daniel el haber abierto el debate público sobre la materia y a continuación paso a expresar mis opiniones en cuanto a sus comentarios:

PDFs: El cementerio donde reposan los datos

Creo que nadie duda de ello, si bien es cierto que se sigue (y se seguirá) publicando información en PDF, mucha, claramente demasiada. El origen de este fenómeno suele ser que toda esa información normalmente ya estaba previamente en ese formato, ya que durante muchos años los PDFs fueron la forma cómoda (y pésima) de crear contenidos para las Webs de la Administración.

Pero, aunque siempre será algo mejor tener datos públicos en un mal formato que no tener ningún dato publicado, esto no debería ser tomado nunca como una solución definitiva, sino como una mera transición para publicar inmediatamente la información disponible a la vez que se trabaja en la mejora de esos formatos. El problema surge cuando lo que debería ser una solución (muy) temporal se convierte en el formato final y es entonces cuando los PDFs se convierten en el lugar a dónde van a morir los datos.

Modelos de representación de los datos

No tengo claro si he entendido bien el concepto de lo que propones como interfaz de consumo, por eso no estoy seguro de si es algo que realmente ya existe o algo que habría que hacer o si simplemente lo que pides es imposible.

Tal y como yo lo veo, cualquier dato que se exponga al final no es más que un dato, lo que al final sumará multitud de datos de las más variadas fuentes y dominios de información. Sí lo que pides es unas pautas generales de presentación de datos me atrevería a afirmar que eso es imposible más allá de todo el compendio que existe ya sobre el tratamiento general de la información y su visualización, pero eso también es una ciencia por sí misma que hay que saber aplicar en cada caso para saber sacarle partido a la información y aflorar las historias que esconde.

No hay más reglas ni puede haberlas. Si no lo he entendido bien por favor ayúdame a interpretarlo mejor, porque me encantaría poder buscarle una solución.

Los datos como entidades vivas

Sin lugar a dudas los datos son entidades vivas, y además existe cierta relación directa entre la frecuencia de actualización de los datos y su valor, es decir, generalmente los datos más vivos y que por su naturaleza se actualizan con mayor frecuencia son los que pueden aportar un mayor potencial en cuanto a beneficio social y económico.

Esa realidad se debe reflejar en los sistemas que gestionen los datos, pero el hecho de que un conjunto de datos se presente como fichero no quiere decir que ese datos estén condenados a la estaticidad de por vida. Al fin y al cabo un fichero tan solo refleja el estado de ese conjunto de datos en un momento determinado y por tanto podría ser también una solución válida aquella que aportase un fichero por cada versión de los datos, siempre que se combinase con un sistema adecuado de gestión de versiones, a través de una configuración apropiada de las URIs por ejemplo.

Cuestión aparte es que hay ciertos datos especialmente dinámicos a los que se les podría sacar mucho más partido a través de una API, e intuyo que por ahí van tus peticiones. En eso no puedo más que coincidir, con un algunos de matices:

  • Una API podría no ser siempre la mejor opción.
  • Para cumplir con los principios del Open Data esa API debería ser un complemento y nunca un sustituto del acceso completo a los datos en bruto.
  • Habrá que seleccionar cuidadosamente cuáles son los datos que se abren por este medio, ya que crear y mantener una infraestructura que de soporte a ciertos datos especialmente dinámicos puede resultar bastante caro, y por supuesto estaríamos hablando de dinero público.

Patrones de datos

Nuevamente no se si el concepto de patrón de diseño se podría aplicar a la explotación de los datos, está claro que sí debe aplicarse, y de hecho ya se hace, para el diseño de los modelos de datos, pero precisamente el potencial de la explotación de los datos se basa en que no hay patrones establecidos y la creatividad y la imaginación con los que somos capaces de combinarlos son los únicos elementos que definen los límites.

Evidentemente para poder sacar provecho de esos datos habrá que tener ciertos conocimientos que provienen de distintas disciplinas (cálculo, estadística, bases de datos, algoritmos, programación, visualización, etc.) que en conjunto se vienen denominando Data Science, y por supuesto contando siempre también con especialistas de la materia en cuestión que se esté tratando en cada momento (sanidad, educación, transportes, medio ambiente, etc.)

Lo que si que es cierto es que en general existe una ausencia muy preocupante de los famosos code books que deberían acompañar siempre a cualquier conjunto de datos para facilitar su explotación. Cuando tratamos con datos muy simples con estructuras mínimas es fácil que con poco esfuerzo cualquiera deduzca esas estructuras y pueda sacarles partido, pero en la mayoría de casos intentar hacer algo productivo con unos datos en crudo que no cuentan con ninguna documentación puede evolucionar fácilmente hacia una misión imposible, o cuando menos conllevará unos considerables esfuerzos superfluos que se podrían y deberían haberse evitado fácilmente.

La crítica final

Me alegra ver que todo el mundo esté últimamente ávido de datos, pero las iniciativas Open Data son carreras de fondo en la que hay que seguir una serie de pasos, entre los cuales se encuentra la necesidad de proporcionar un catálogo para que la información salga de los archivadores y los discos duros de la administración y se haga visible a todo el mundo.

Por muy poco acertada que pueda acabar siendo una iniciativa Open Data en su ejecución, que las hay, creo que llegar a compararlo con el despotismo ilustrado podría ser cuando menos un poco exagerado. Sobre todo si tenemos en cuenta que en este caso el Gobierno de Aragón lleva ya bastante tiempo trabajando tanto internamente, impartiendo formación a sus servidores públicos, como externamente llamando a la participación de todo el mundo, además de haber mostrado en repetidas ocasiones su voluntad de seguir haciéndolo en el futuro próximo.

Está claro que la colaboración entre todos los agentes implicados (Gobierno, Ciudadanos, Empresas, Profesionales, Universidad, etc.), incluyendo por supuesto a los diseñadores, es una herramienta fundamental para el éxito del Open Data, y por eso sería estupendo que el evento UX de referencia en España, al que acudirán muchos de esos diseñadores, adoptase un modelo más flexible, participativo e inclusivo,que las tradicionales conferencias y mesas redondas para abrirse más a la colaboración e intercambio de ideas con otros profesionales, como por ejemplo los del mundo del Open Data.

Personalmente me gustaría saber más sobre las inquietudes de diseñadores y profesionales de la UX acerca del Open Data, puesto que además ya forman parte de él cuando aplican RDFa, schema o microdatos a los diseños Web por ejemplo, pero es que si nunca hablamos, y cuando lo hacemos no es de forma constructiva, difícilmente nos vamos a poder entender.

Avances de la Comisión Europea en materia de Open Data y RISP

Este artículo fue publicado primero en inglés.

Tal y como se viene afirmando últimamente, los datos son el nuevo combustible que alimenta la era digital. Si tenemos en cuenta el amplio rango de oportunidades que el Open Data puede proporcionarnos, no es ninguna sorpresa que dentro de los planes de la Comisión Europea esté el continuar revolucionando la forma en la que las autoridades públicas comparten sus datos. A continuación se muestra una visión general de cuáles son las acciones llevadas a cabo por la CE hasta el momento en materia de Open Data e Información del sector público, así como una revisión de las acciones futuras más inmediatas.Logo European Commission

Un hito de referencia: Workshop de Datos en la Asamblea de la Agenda Digital 2011

La CE organizó una primera Asamblea de la Agenda Digital en Junio de 2011 para tratar los avances en relación a los objetivos de la Agenda Digital para Europa. Con ese propósito se organizaron una serie de dos sesiones plenarias y 24 talleres temáticos, uno de los cuales estuvo dedicado al Open data y la reutilización de la información en el Sector Público (RISP), donde distintos actores implicados en la materia se dieron cita para colaborar con la Comisión en el desarrollo de su estrategia Open Data para la Unión Europea.

Khalil Rouhana (Director General de Sociedad de la Información de la CE) realizó varios anuncios clave en relación a las políticas Open Data en la UE que analizaremos en las siguientes secciones.

El papel de los portales Open Data Europeos

Los portales Open Data están destinados a ser una referencia clave en la infrastructura digital que facilite el acceso y reutilización de la Información del Sector Público y son varios los estados miembro que están desarrollando portales Open Data a todos los niveles. Dado que la cantidad de datos publicados hasta el momento es relativamente limitada en comparación con los disponibles, la CE tiene dentro de sus planes la publicación de dos nuevos portales Open Data que faciliten el acceso a datos Europeos:

Captura de pantalla de data.gov.eu

  •  El portal Open Data de la Comisión Europea data.gov.eu, pensado para facilitar la localización de los datos de la propia Comisión y otras instituciones Europeas. El portal, actualmente en desarrollo, estará disponible para el público a lo largo del 2012.
  • Portal Open Data Pan-Europeo, que facilite la localización y reutilización de los datos de administraciones nacionales, regionales y locales a lo largo de Europa. Un prototipo estará disponible en el 2013.

Revisión de la directiva de reutilización de la Información del Sector Público

Originaria de Noviembre de 2003, y actualmente traspuesta por completo a todos los estados miembros, la Directiva original proporcionaba una harmonización mínima de reglas y procedimientos a lo largo de la UE para facilitar la reutilización de la Información del Sector Público a través de las fronteras. En diciembre de 2011 se presentó una propuesta para la revisión de la Directiva para mejorar la apertura del mercado de servicios sobre la Información del Sector Público a través de las siguientes medidas:

  • Incluir nuevos participantes en el ámbito de aplicación de la Directiva, como por ejemplo bibliotecas, museos y archivos.
  • Determinar límites en las tasas que se establezcan como costes márginales por parte de las autoridades públicas.
  • Introducir medidas de seguimiento independientes en los Estados Miembros.
  • Desarrollar estándares para formatos legibles por máquinas que puedan ser utilizados por las autoridades públicas.

Otros pasos previos significativos

El primer taller sobre Open Data en la Asamblea de la Agenda Digital supuso sin duda un antés y un después, tanto en las políticas Open Data y de reutilización en la UE como en la forma en que la CE comunica esas políticas e interactua con los distintos agentes implicados.

Sin embargo, varias fueron también las medidas adoptadas por la CE en materia de Open Data y RISP con anterioridad a este primer talle, como por ejemplo:

Diciembre 2011: El Comunicado sobre Open Data

Como continuación del primer taller de la Agenda Digital, la Comisión adoptó un Comunicado oficial sobre Open Data a través del cual se proponen una serie de acciones para cumplir con los objetivos previamente anunciados:

  • Crear un portal para la información de la Comisión que se extienda posteriormente también a otras instituciones y agencias de la UE.
  • Trabajar en conjunto con los Estados Miembros sobre los formatos de datos y la interoperabilidad de los distintos sitios.
  • Crear un portal Pan-Europeo que enlace información de distintas instituciones de los Estados Miembro.

Segundo taller sobre Datos en la Asamblea de la Agenda Digital 2012

En Junio de 2012, la Asamblea de la Agenda Digital acogió una nueva edición del taller de Datos en la que se dio un nuevo repaso a la hoja de ruta de la EC en materia de Open Data y RISP:

También es destacable la apuesta global Europea en materia de tratamiento de datos, Open Data y Open Access, no solo solo mediante políticas y medidas regulatorias, sino también a través de investigación, innovación y la implementación de pilotos y portales financiados mediante los múltiples programas de I+D+I FP7 y CIP-ICT-PSP 2011-13, que tendrán su continuación con el nuevo Programa Horizon 2020.

Horizon 2020 logoAlgunas de las cuestiones que destacan de entre las tratadas en este nuevo taller fueron:

Licencia de Datos Europea

Existe una necesidad real de estudiar los requisitos para una Licencia de Datos Europea, dado que será un elemento necesario a la hora de facilitar el acceso y la reutilización de los datos a través de las fronteras Europeas. Varias son las cuestiones que hay que resolver al respecto: ¿Sirve alguna de las licencias ya existentes o necesitaríamos una nueva? En caso de necesitar una nueva licencia, ¿hay alguna opción obvia a seguir o se necesitaría algo completamente nuevo?

Publicación de Datos Clave

Dado que los Estados Miembros de Europa cuentan ya con una enorme cantidad de datos valiosos, una tarea prioritaria sería la identificación y difusión abierta de Datos clave de referencia. Algunos de esos datos ya están siendo publicados de forma abierta por ciertos Estados Miembro, pero son todavía demasiados los que permanecen cerrados bajo extrañas reglas de reutilización o modelos de recuperación de costes insostenibles.

Próximos pasos

Además de todas las actuaciones en marcha anteriormente mencionadas, y según lo anunciado por la Vice Presidenta de la Comisión Neelie Kroes, la CE tienen en mente continuar con el desarrollo de su estrategia Europea para la publicación y reutilización de los datos del sector público en las instituciones Europeas y los Estados Miembros. Algunos elementos destacables dentro de los próximos pasos serían los siguientes:

Servicios para la publicación, acceso y reutilización de los Datos Públicos en la UE

Están planificados una serie de servicios orientados a dar soporte en la publicación de Datos por parte de agentes públicos de la EU en cualquier nivel. Estos servicios incluirán:

  • Servicios relacionados con la preparación, transformación y publicación de los datos, con el compromiso de publicar al menos 15.000 nuevos conjuntos de datos en formatos legibles por la máquinas – incluyendo tecnologías Linked Open Data – y que procedan de todos los Estados Miembro de la UE.
  • Formación a trabajadores públicos en las áreas de Open Data, y en particular para favorecer la adopción de tecnologías Linked Open Data por parte de las instituciones públicas de la Unión Europea.
  • Servicios de asesoría y consultoría técnica en materia de Open Data en general, y particularmente en cuanto a tecnologías Linked Open Data se refiere.

La Incubadora de Reutilización del Open Data

Los distintos instrumentos financieros establecidos continuarán dando soporte a distintos desarrollos Open Data. Cabe destacar el Programa de Trabajao FP7-ICT 2013 que ayudará a las pequeñas y medianas empresas (PYMEs) en el desarrollo de aplicaciones innovadoras para la gestión de contenidos digitales, y particularmente en la reutilización de Open Data a través de la Incubadora Open Data. El objetivo de la Incubadora será establecer un entorno adecuado para:

  • Sondear al público en general en búsqueda de ideas de reutilización del Open Data y llevar a cabo una campaña de Reutilización de la Información Open Data a nivel Europeo.
  • Gestionar convocatorias regulares dirigidas a PYMES en busca de mini-proyectos que puedan ser financiados y llevados a cabo en un periodo de entre 6 y 12 meses.
  • Crear una infraestructura donde las propuestas ganadoras puedan encontrar versiones corregidas y actualizadas de los datos que necesiten para crear sus servicios.
  • Establecer mecanismos para la conexión entre la oferta y la demanda, poniéndose en contacto a los agentes públicos Europeos y ayudándoles a conseguir una publicación eficiente y sostenible de la información.

Armonización de iniciativas Open Data

Como respuesta al reciente clamor por la armonización de iniciativas Open Data, la Unión Europea está financiando proyectos como “Armonización del Open Data en el área del Mediterráneo mediante un mejor acceso y reutilización de la Información del Sector Público – Homer”, cuyo objetivo principal es establecer una estrategia efectiva capaz de armonizar las políticas y portales Open Data a lo largo del área Mediterránea, dando soporte tanto a Gobiernos regionales como locales.Homer Logo

Nuevas vías de crecimiento

La búsqueda de nuevas vías de crecimiento que exploten las posibilidades del Open Data alrededor de una temática específica es tan importante a la hora de avanzar en la materia como los esfuerzos políticos, estructurales y educativos. Algunos de las temáticas Open Data que se están explorando actualmente a nivel de la Comisión Europea son:

  • Datos Culturales: La iniciativa de bibliotecas digitales de la UE pretende hacer que todos los recursos culturales de Europa sean accesibles por todo el mundo, preservándolos para las generaciones futuras. En este área cabe destacar la reciente adopción de la licencia CC0 por parte de Europeana, que supone un cambio importante en el acceso al Open Data que sienta un precedente internacional en el distanciamiento del mundo de los datos cerrados y controlados.

Europeana

  • Smart Cities: Uno de los mayores retos a los que se enfrenta la UE es cómo diseñar y adaptar las ciudades hacia entornos más inteligentes y sostenibles. Las tecnologías urbanas intelligentes suponen una mejora importante a la hora de afrontar los retos urbanos gracias a que involucran a los distintos sectores implicados, dando lugar a soluciones adaptables e interoperables y creando una vía para un uso transparente y abierto de los datos.
  • Open Science: La EC ya ha realizado un primer esbozo de las medidas para mejorar el acceso a la información científica producida en Europa. Un acceso más amplio y rápido a las publicaciones y datos científicos financiados con dinero público hará que sea más fácil aprovechar los resultados por parte de investigadores y empresas, mejorando sustancialmente la capacidad de innovación Europea y dando un acceso más rápido a los beneficios de los descubrimientos científcos. La Comisión hará que el acceso abierto a publicaciones científicas sea un principio general de Horizon 2020, el programa de Investigación e Innovación Europeo para el periodo 2014-2020.

Networking, concienciación y difusión

Tal y como se extrae de las conclusiones en materia Open Data de la última Asamblea de la Agenda Digital,  las actividades de networking, concienciación y difusión son elementos clave para el éxito de una política Open Data y RISP en la EU. De forma complementaria a las acciones legislativas, la Comisión también da soporte a acciones de concienciación difusión y networking como por ejemplo:

  • El Public Sector Information Group, un grupo de expertos en RISP que incluye representantes de 27 Estados Miembro y ha sido convocado por la CE para el intercambio de buenas prácticas e iniciativas que den soporte al RISP, así como proponer soluciones a los retos pendientes, tales como tasas, acuerdos de exclusividad o indicadores de desarrollo RISP.
  • LAPSI, la Red Temática Europea sobre Aspectos Legales de la Información del Sector Público. Principal punto de referencia Europeo en cuanto al análisis de políticas de alto nivel y acciones estratégicas sobre cualquier cuestión legal relacionada con el acceso y la reutilización de la Información del Sector Público en el ámbito digital.
  • El European Data Forum, reunido por primera vez en Copenague en Junio de 2012 y próximamente en Dublín (Abril 2013). Es un foro en el que los agentes de negocio –  incluyendo un gran número de PYMES – investigadores y otros agentes implicados pueden reunirse para discutir el estado de la economía del dato.

La Plataforma Europea de la Información del Sector Público

La EPSI Platform es el nodo central Europeo en cuanto a Reutilización de la Información en el Sector Público (RISP) y su objetivo es la promoción de un mercado RISP dinámico a lo largo de la UE. La Plataforma proporciona un punto de reunión donde los diferentes agentes implicados pueden obtener toda la información relevante acerca de los desarrollos RISP en la UE, así como buenas prácticas destacadas, cuestiones legales y ejemplos de productos y servicios RISP.

EPSI PlatformLa plataforma publica noticias sobre desarrollos RISP Europeos y casos legales acerca de la reutilización, así como buenas prácticas y ejemplos de nuevos productos y servicios que dan cobertura a los principales mercados RISP. Desde la plataforma se hace un seguimiento continuo de los principales desarrollos en políticas Open Data, Government Data y RISP y se elaboran informes sobre distintas iniciativas y proyectos, tanto a nivel Europeo como en el resto del mundo.

The European Commission steps forward on Open Data and PSI re-use

As so often repeated these days, data is the new fuel for the digital age. Considering the wide spectrum of opportunities Open Data may bring, it is no surprise that the EC plans how to keep shaking up the way public authorities share data. The following lines aim to be an overview of the EC developments so far on Open Data and Public Sector Information, as well as a review of future planned actions.

Logo European Commission

A Landmark Event: Data Workshop at the Digital Agenda Assembly 2011

The EC organized the first Digital Agenda Assembly in June 2011 to discuss advances with regards to the Digital Agenda objectives for Europe. With that aim, twenty-four thematic workshops and two plenary sessions were conducted. One of those events was the Open data and Re-use of Public Sector Information workshop, where different types of stakeholders congregated to collaborate with the Commission on developing its strategy for Open Data in the EU.

Khalil Rouhana (DG Information Society and Media Content & Cognitive Systems of the European Commission) made several key announcements in relation to Open Data policies in the EU during that workshop. We will focus briefly on these in the forthcoming sections.

The role of European Open Data portals

Open Data portals are aimed to be a key referral of the digital infrastructure bound for facilitating access to and re-use of Public Sector Information. Open Data portals have been -and are being- created around many EU Member States at all governmental levels. Given that the quantity of data published so far is relatively limited as compared to that potentially available for publication, the EC plans to publish two new central Open Data portals to facilitate access to European Open Data:

data.gov.eu screenshoot

  • The European Commission Open Data portal data.gov.eu, a portal easing the search for Commission data, as well as other EU institutions, bodies and agencies to citizens and industry. The portal, currently under developement, is expected to be released soon in 2012.
  • Pan-European Open Data portal, to make data from EU, national, regional and local administrations more easily available and re-usable. A prototype is expected to be released in 2013.

Review of the Directive on the Re-use of Public Sector Information

First adopted on November 17, 2003 and by now completely transposed to all member States, this original PSI Directive provided a minimal harmonisation of rules and procedures across the EU in order to facilitate cross-border re-use of the PSI. A proposal for a revision of the Directive, which is currently being discussed by the Union legislator, was presented in December 2011 to further open up the market for services based on PSI by:

  • Including new bodies in the scope of application of the Directive such as libraries, museums and archives.
  • Determining limits on the fees that can be charged by the public authorities at marginal costs.
  • Introducing independent oversight re-use rules in the Member States.
  • Making standard machine-readable formats for information held by public authorities.

Other Meaningful Previous Steps

That first Open Data and PSI workshop was a landmark event both in Open Data and PSI policies in the EU as well as in the way that the EC communicates these policies and interacts with the different stakeholders. Nevertheless, several steps forward were also made by the EC on the Open Data and PSI matters before this first Digital Agenda Workshop, such as:

December 2011: The Communication on Open Data

Following the first Digital Agenda workshop, the Commission adopted a Communication on Open Data by December 2011. In this Communication, the Commission proposes several actions to accomplish the objectives previously announced in the aforementioned DAE workshop:

  • To create a portal site for Commission-held information aiming at an expansion to other EU institutions, bodies and agencies at a later stage.
  • To work with the Member States on data formats and interoperability between existing sites.
  • To create a Pan-European umbrella site linking information held by EU institutions, bodies and agencies and by Member States.

First Update: New Data Workshop at the Digital Agenda Assembly 2012

In June 2012, the Digital Agenda Assembly 2012 housed a new Data Workshop where the European Commission Open Data and PSI roadmap was presented again, mainly:

It is also remarkable to recall the European overall bet for data handling, Open Data and Open Access, not only by Open Data policies and a regulatory strand (PSI Directive), but also by means of research, innovation and ICT deployment pilots and portals implemented through financial support instruments such as the FP7 and CIP-ICT-PSP 2011-13 R&D&I multiple programmes, that are currently almost gone but will have continuity with the new Horizon 2020 programme.

Horizon 2020 logoSome of the questions that lead this Workshop where:

European Data license

There is a strong need to investigate requirements for an European Data License, given that if we want to encourage use and reuse of data across European borders, there may be the need for a single cross-border license. Several questions then arise: Will one of the existing licenses do the job, or do we need a new one? If we do need a license, is there an obvious choice, or is something new required?

Release of Core Data

A first-priority task will be to identify and evangelise Open release of Core Reference Data, given that European Member States have already huge quantities of valuable data. Some of this data is now becoming freely available in certain Member States, but too much of it remains locked up behind odd rules and unsustainable cost-recovery models. It is also difficult to compare data between Member States.

Future Steps

In addition to all the work in progress that has been previously mentioned, and as announced by the Vice President of the Commission Mme Neelie Kroes, the EC also plans to continue developing their European strategy for the publication and reuse of public sector data from European institutions and the Member States, as established with Commission’s commitment to turn public data into business included in action 3 of the Digital Agenda for Europe Communication.

Some highlights of the future planned distributed actions include:

Services for publication, access and reuse of EU Open Public Data

A series of services will be purchased aimed at supporting the EU-wide availability of PSI and Open Data from public bodies at different governmental levels. These services will include:

  • The provision of data preparation, transformation and publication services, with a commitment to publish at least 15.000 new data sets from all EU Member States in machine readable formats, including Linked Open Data technologies.
  • Training services in the area of Open Data, in particular to favour the uptake of Linked Open Data technologies by public bodies within the European Union.
  • Provision of an IT advisory and consultancy service in the area of Open Data, and in particular on Linked Open Data technologies, including specific software development tasks.

The Open Data Reuse Incubator

Financial support instruments will continue to support several Open Data developments, notably, the FP7-ICT Work programme 2013 will help Small and Medium Enterprises (SMEs) to develop innovative applications in structured and unstructured digital content management and, particularly, in the reuse of open data through an Open Data Incubator.

This Incubator will establish an environment to:

  • Solicit open data reuse ideas from the general public and conduct a European wide open data reuse information campaign.
  • Publish and manage regularly scheduled calls for SMEs to submit mini-proposals to be funded for a period between six and twelve months.
  • Create a computing infrastructure where the winning mini-proposals will find accurate and up-to-date versions of the data they need for their services.
  • Establish a mechanism for connecting open data demand and supply by systematically contacting European public bodies for their open data and assisting them in the efficient and sustainable publication of such data.

Harmonization of Open Data initiatives

In response to the increasing clamour in search of harmonising Open Data initiatives, the European Union is financing projects such as “Harmonising Open Data in the Mediterranean through better access and Reuse of Public Sector Information – Homer”, which aims mainly to set up an effective strategy able to harmonise Open data policy and portals across the Mediterranean area, supporting regional and local governments.Homer Logo

New paths for growth

As important as political, structural and educational efforts, uncovering new paths for growth, in which Open Data possibilities about a given topic are explored, is also critical in order for Open Data and PSI re-use to advance. Some Open Data and PSI topics that are currently being explored by the European Commission are:

  • Cultural Data: The EU’s digital libraries initiative sets out to make all Europe’s cultural and scientific resources accessible to all, and preserve them for future generations. In this area it should be pointed out that recent Europeana’s move to CC0 is a step change in open data access, given that releasing data from across EU country sets an important new international precedent and a decisive move away from the world of closed and controlled data.

Europeana

  • Smart Cities: One of the greatest challenges facing the EU is how best to design and adapt cities into smart intelligent and sustainable environments. Smart urban technologies can make a major contribution in tackling urban challenges by breaking down boundaries between the sectors involved, ensuring adaptable and interoperable solutions and finding a way to use data transparently and openly, without breaching privacy.
  • Open Science: The European Commission outlined measures to improve access to scientific information produced in Europe. Broader and more rapid access to scientific papers and data will make it easier for researchers and businesses to build on the findings of public-funded research, boosting Europe’s innovation capacity and give citizens quicker access to the benefits of scientific discoveries. The Commission will make open access to scientific publications a general principle of Horizon 2020, the EU’s Research & Innovation funding programme for 2014-2020.

Networking, awareness raising and Dissemination

As seen from the last Digital Agenda Assembly Open Data conclusions above, networking, awareness raising, dissemination and outreach activities are considered key elements for the Open Data and PSI re-use market success at the EU. Complementary to legislation, the Commission supports deployment, support, awareness raising, and networking actions such as:

  • The Public Sector Information Group, an PSI expert group which includes representatives of 27 Member States that was set up by the EC to exchange good practices and initiatives supporting public sector information re-use and discuss and recommend solutions to challenges such as charging, exclusive agreements, development indicators for measuring public sector information and technology.
  • LAPSI, The European Thematic Network on Legal Aspects of Public Sector Information to become the main European point of reference for high-level policy discussions and strategic action on all legal issues related to the access and the re-use of the PSI, namely in the digital environment.
  • The European Data Forum, with a first meeting in Copenhagen (June 2012), and the next scheduled for Dublin in April 2013. It is a forum in which business actors, including a large number of SMEs, researchers and other stakeholders can come together to work out what a data economy really looks like.

The European Public Sector Information Platform

The EPSI Platform is Europe’s One-Stop Shop on Public Sector Information (PSI) Re-use which objective is the promotion of a dynamic PSI re-use market across the EU, a place where the different stakeholders can get all the relevant information about the European and international PSI re-use developments, emerging good practices, legislation, legal cases, examples of PSI re-use products and services, etc.

EPSI PlatformThe Platform provides news on European PSI developments, legal cases around re-use, good practices and examples of new products and services, covering the main PSI re-use markets. It follows and reports on a daily basis the developments of the PSI re-use/open-data/government-data policies, initiatives and/or projects in the EU and elsewhere.

Los tres retos del Open Data en la Asamblea de la Agenda Digital Europea

Este artículo fue publicado primero en inglés.

Esta semana el  Workshop sobre Datos de la Agenda Digital Europea nos ha dejado una buena discusión acerca de las oportunidades y los obstáculos a los que se enfrenta el Open Data, así como reflexiones sobre cómo deben implicarse todas las partes interesadas para superarlos.

El plan de trabajo de la Comisión Europea

Las iniciativas de la Comisión Europea hasta el momento podrían resumirse como el desarrollo de una estrategia de comunicación de Datos Abiertos, la revisión de la directiva de la Información del Sector Público (PSI) y la política de reutilización de la Comisión Europea. Todo ello incluye el lanzamiento de la beta del nuevo portal Open Data de la Comisión Europea a mediados de Julio y un futuro portal Paneuropeo.

También es importante recordar la apuesta Europea por la gestión de los datos, el Open Data y el libre acceso a través de proyectos pilotos y portales mediante los programas de I+D+i FP7 y CIP 2011-13 que, aunque actualmente están prácticamente liquidados, tendrán su continuidad en el nuevo programa Horizon 2020.

Los temas candentes en cuanto a datos

Paul Miller hizo una estupenda introducción, basada en el diálogo previo online, en la que se revelaron los principales temas candentes para la Agenda: Open Data, Linked Data y Big Data, así como la importancia de las cuatro Vs de los datos: Gran Volumen, Velocidad, Variedad y Valor.

También nos recuerda la importancia de seguir las mejores prácticas en cuanto a estándares abiertos para Open Data, un tema recurrente, dado que actualmente contamos con más de 150 iniciativas en marcha a lo largo de Europa, pero todas ellas cuentan con componentes ligeramente diferentes.

Finalmente, François Bancihon en su discurso reivindicó una vez más la necesidad de una licencia única Europea y nos advirtió acerca de los peligros del Open Data y el Poder de los Datos con algunos ejemplos muy buenos:

  • Twitter cuenta con información más precisa acerca de las caídas del sistema de Netflix que la que el propio Netflix tiene.
  • Google tiene constancia de las notificaciones de desempleo antes incluso que las propias oficinas de empleo.
  • Target se entera de los embarazos de adolescentes antes que sus propios padres.

Áreas de aplicación de la reutilización

Bajo el lema inicial de que  Los datos son la nueva moneda de la democracia la primera sesión se centró en mostrar áreas de aplicación específicas:

Registros mercantiles

Sin lugar a dudas, uno de los temas más controvertidos del Workshop, debido sobre todo a el estupendo y controvertido informe presentado por Chris Taggart, de Open Corporates acerca de cómo de abiertos son los registros mercantiles en la Unión Europea, y la inevitable comparación con el modelo cerrado del  Registro mercantil Europeo basando en el pago por acceso.

Por desgracia, España obtiene una puntuación final de 0 en el informe debido a su registro completamente cerrado y de pago, una pena tratándose de uno de los conjuntos de datos más populares y deseados.

Información Geográfica

Una vez más, impresionantes las estadísticas de uso de datos geográficos: 120k accesos y 60k Gb de datos. La información Geoespacial se confirma así como una de las áreas más exitosas para el Open Data en Europa, dado que el 80% de las decisiones que tienen que tomar las autoridades públicas cuentan con un componente geoespacial. Se trata sin duda de una capa fundamental y necesaria para el open data y la innovación, de ahí la necesidad de que el acceso sea libre.

Interesante también el caso de uso del Earth Observatory, que sirve de ayuda en la gestión de recursos como la energía, el agua potable o la agricultura, ayudando así a afrontar los retos sociales asociados. La lección a aprender en este proyecto: todos los intentos de comercializar los datos han fracasado, es necesario que se mantengan disponibles de forma abierta y gratuita. Importante también recalcar que la iniciativa fue posible gracias al apoyo del Gobierno, por lo que los Gobiernos tienen también un papel de liderazgo en el progreso del Open Data.

Transporte

La experiencia presentada se centró en los problemas y barreras legales encontradas durante su desarrollo. ¿Es el scrapping legal? ¿Quién es el propietario de la información? Desafortunadamente, nos encontramos con que en algunos casos la información es ya abierta por defecto, pero en otros casos los gestores de los datos se niegan a proporcionar los datos.

En el lado malo: Las reclamaciones en los tribunales suelen llevar meses o incluso años, independientemente de lo obvio que pueda resultar el caso.

Los retos del idioma en los datos

La sesión reunió a varias de las compañías Europeas expertas en los campos de traducción, internacionalización, localización y servicios multilingües, centrando la discusión en la semántica del contenido, no en los metadatos.

La conclusión fue que una de las pocas barreras que todavía tenemos en Europa son las barreras culturales e idiomáticas, lo que supone un problema real a la hora de conseguir un mercado digital único. El multilingüismo puede llegar a ser beneficioso si se explota adecuadamente, ya que una vez se consiguen procesar los datos en base al conocimiento del idioma obtendríamos una clara ventaja competitiva. El verdadero reto es ser capaz de procesar los datos multilingües y permitir que fluyan a través de idiomas, países y mercados.

Una infraestructura multilingüe será tan importante para Europa como la infraestructura de banda ancha.

Generación de valor y el futuro de la economía del dato en Europa

La última sesión se centró en la generación de valor mediante los datos, basándose en la premisa de que los datos por sí mismos no son valiosos y lo que necesitamos no es sólo tecnología, sino  soluciones de análisis que aporten conocimiento y ayuden en la toma de decisiones.

Mención especial para varias áreas de negocio intensivas en datos que son potenciales oportunidades para las PYMES: Venta al por menor, manufactura, medios sociales, envejecimiento de la población, gestión urbana, transporte, seguridad alimentaria, el sector público o la sanidad y medicina.

Existe también consenso en cuanto al hecho de que es el momento de buscar modelos de negocio innovadores en torno al Open Data, como por ejemplo el análisis de datos en tiempo real sin almacenamiento. La duda que sigue en el aire es ¿qué debe ser lo primero? ¿más datos abiertos o mejores modelos de negocio?

Los retos del Open Data

En la sesión de conclusiones, además de varias observaciones finales de las que se extrae que el Open Data será clave para la sostenibilidad de un mercado digital único, se consensuaron tres retos principales en cuanto al Open Data para la Agenda Digital:

  • Sostenibilidad de las iniciativas Open Data.
  • Casos de uso de interés público frente a casos de uso de negocio.
  • Retos del Multilingüismo.

Como conclusión final podemos terminar con una de las citas más memorables del día, por obra de Chris Taggart:

Abre tus datos o prepárate para decir adiós a la democracia

El debate continuará en el Encuentro Aporta de iniciativas Open Data en España la próxima semana.

Three Challenges of Open Data at the Digital Agenda Assembly

Today’s Digital Agenda Data Workshop left us with a good discussion about what the opportunities and hurdles of Open Data are, and what can be done by all the stakeholders.

The European Commission roadmap

EC initiatives so far could be summarized as the development of an Open Data communication strategy, the revision of the PSI directive and an EC reuse policy. That includes the launch on beta stage of the new Open Data EC portal at mid July and a future Pan-European portal.

Also important to recall the European bet for data handling, open data and open access pilots and portals through the FP7 and CIP 2011-13 R&D&I programmes, currently almost gone, but that will have continuity with the new Horizon 2020 programme.

Data hot topics

Paul Miller gave an excellent introduction based on the previous online discussion that uncovers the main hot topics for the Agenda: Open Data, Linked Data and Big Data, as well as the importance of the four V’s of data: Big Volume, Velocity, Variety and Value.

He also remembered us the importance of best practices and open standards for open data, a recurrent topic, given that we have currently 150+ on-going initiatives all around Europe, but all of them are slightly different.

Finally, François Bancihon in his keynote raised his voice again for the need of a single pan-European license and advised us about the perils of Open Data and the Power of Data, with a few very good examples:

  • Twitter has more accurate information about Netflix’s downtime that Netflix.
  • Google knows about unemployment claims before the unemployment office.
  • Target knows about the pregnancy of the teen before their parents.

PSI application areas

With the opening tagline of Data is the new currency of democracy the first session focused on showcasing specific application areas:

Company registers

Without any doubt, one of the hot topics at the Workshop, mainly due to the great and controversial report published by Chris Taggart, from Open Corporates about how open company registers in Europe are, and the inevitable comparison with the European business registry closed model based on pay-to-play access.

Sadly, Spain scores 0 points in the report due to its fully closed registry, a pity for one of the most popular and desired datasets.

Geographical information

On more time, impressive stats on GEOdata usage: 120k accesses and 60k Gb of data. Geospatial confirms as one of the EU Open Data successful areas, given that 80% of needs for decisions from public authorities have a geospatial component. It is a fundamental layer necessary for open data and innovation, thus the need to remain open.

Also interesting the Earth Observatory use case that helps to manage resources such as energy, freshwater and agriculture. It measures land-use change and help to address social challenges. The lesson to learn from the project: all attempts to commercialise data supply failed, it needs to be open and freely available. Important to say that it was launched with government support and sponsorship, so Governments play also a leading role in Open Data progress.

Transportation

The use case presented focused on the legal issues and barriers for reuse. Is scrapping legal? Who is the owner of the information? Unfortunately, you can find some cases where data is open by default and others where data managers refuse to supply the information.

The bad side: Fighting in court could take long months, even years, no matter how obvious the case is.

Data and language challenges

One of the sessions I was personally expecting was the one which got together some of the European expert companies in the fields of translation, internationalization, localization and multilingual services. Surprisingly for me, the discussion focused on semantics of contents and not metadata as I expected.

The conclusion was that one of the few remaining European barriers are the cultural and language ones, a real problem for a successful Single Digital Market. Multilingualism can be a benefit if properly exploited, once we can process data based on language knowledge, we can obtain remarkable results and a competitive advantage. The real challenge is to be able to process multilingual data and enable it to flow through languages, countries and markets.

A multilingual infrastructure is as important for Europe as a broadband infrastructure.

Value generation and the future of the EU data economy

The last session focused on data value generation based on the premise that data itself is not valuable alone and what we need are data analysis solutions for insight and decisions, not just technology.

Several data intensive areas were mentioned as potential SMEs business opportunities for analysis, simulation or analytics, such as: Retail, Manufacturing, Social Media, Ageing Population, Urban Management, Transport, Food Security, the Public Sector or Health and Medical data.

There is also an agreement on the fact that it’s time to look for innovative business models around Open Data, such as streaming data analytics with live data that is not stored but processed on the fly. The doubt is still what come first, more data openness or better business models.

Open Data challenges

In the wrap-up session, some final remarks, three main Open Data challenges were proposed for the Digital Agenda:

  • Sustainability of Open Data.
  • Profit vs. public interest data uses.
  • Multilingualism issues.

As a conclusion, we can finish with one of the most remarkable quotes of the day, by Chris Taggart:

Open your data or say good-bye to democracy