Emprender con datos – retos y oportunidades: Open Data, Big Data, Linked Data

La posibilidad de que tanto los ciudadanos como las empresas puedan acceder y utilizar a cada vez un mayor volumen y variedad de datos, gracias al auge del Open Data, Big Data y Linked Data, está permitiendo el nacimiento de un nuevo modelo de negocio basado en la creación de productos y servicios de valor añadido a partir de esa información.

Jornadas emprender con datos. 25 Noviembre. http://www.coworkingtaluderia.es/

Son ya varios los estudios económicos a nivel internacional que indican que las estimaciones del volumen potencial de negocio en torno a los datos en los próximos años son muy elevadas, entorno a los 200 billones de euros en toda Europa, pudiendo llegar a los 50.000 millones de euros sólo en España (el 5% del PIB nacional) si tenemos en cuenta también las potenciales sinergias con la industria de los contenidos digitales. Además la industria de los datos generará alrededor de 5 millones de puestos de trabajo en los próximos años.

Por eso, y en colaboración con la iniciativa Oviedo Emprende, hemos organizado unas jornadas en las que hablaremos de los retos y oportunidades para los emprendedores que trabajan con datos en las que reuniremos a especialistas en el área con varios emprendedores que ya están utilizando los datos como materia prima en sus proyectos de formas muy variadas para debatir sobre las posibilidades de negocio utilizando los datos como materia prima.

En primer lugar conoceremos las últimas tendencias y oportunidades en torno a los datos:

  • Open Data, modelos de negocio, tendencias y oportunidades – Carlos Iglesias, Experto Open Data y Consultor TIC Independiente.
  • Startups y emprendedores – Marco Laucelli, responsable de ISVs & Startups en IBM.
  • Investigación, transferencia de conocimiento, innovación abierta e internacionalización en el mundo de los datos – Sergio García, Director de I+D+i en Treelogic.
  • Linked Open Data, un mundo de posibilidades – Jose Emilio Labra, Investigador principal del grupo WESO (Web Semantics Oviedo) y Profesor Asociado del Departamento de Informática de la Universidad de Oviedo.

A continuación conoceremos de primera mano varias experiencias prácticas por parte de algunos “emprendedores de los datos”:

Y durante el debate final se plantearán y se intentará dar respuesta a preguntas cómo:
  • ¿Qué modelos de negocio se pueden plantear en torno a los datos?
  • ¿Qué otros servicios de valor añadido se pueden explotar alrededor de los datos
  • ¿Qué problemas existen a la hora de acceder y explotar a los datos?
  • ¿Qué datos son los más útiles? ¿Cuáles se echan de menos?
  • ¿Cuál es el grado actual de colaboración de la administración?
  • ¿Es fácil reutilizar los datos actualmente? ¿Qué haría falta para que fuese más fácil?
  • Servicios o datos ¿Qué quieren realmente los usuarios?

¡Reserva ya tu plaza para participar!

Interoperabilidad de los catálogos Open Data Europeos

Se acaba de abrir el plazo de comentarios y revisión pública del borrador de la especificación para el perfil de Aplicación de DCAT destinado a mejorar la interoperabilidad de Catálogos Open Data en la Unión Europea.

El perfil de aplicación de DCAT para portales Open Data Europeos (DCAT-AP) es una especificación para describir mediante metadatos los conjuntos de datos del sector público, de forma que se esas descripciones puedan ser compartidas entre diferentes catálogos o agregadas en un único punto de acceso común. La especificación forma parte del programa ISA de soluciones de interoperabilidad para Administraciones públicas Europeas de la Comisión Europea, dentro de la iniciativa Joinup de interoperabilidad semántica.

ISA | JoinUp | DCAT-AP

DCAT-AP toma como base principal el Vocabulario de Catálogos de Datos (DCAT) – estándar definido por el W3C que ya está siendo utilizando en varios Catálogos tanto en España como en Europa – así como otros vocabularios de referencia como ADMS o Dublin Core. Los objetivos principales de la especificación son:

  1. Identificar los elementos esenciales de DCAT para el contexto Europeo.
  2. Identificar los vocabularios comunes que se utilizarán como referencia en el contexto Europeo.
  3. Identificar el conjunto mínimo de metadatos para el intercambio de información entre catálogos Open Data en Europa.

DCAT-AP indica los metadatos mínimos necesarios para cumplir con las necesidades de los catálogos Open Data proporcionando así un mecanismo de interoperabilidad semántica con otras aplicaciones. Es también importante destacar que, si bien DCAT-AP está desarrollado bajo el modelo de RDF, la intención es definir únicamente el formato de intercambio y no el entorno operativo del catálogo, por lo cual también podrá ser utilizado en entornos que no implementen una solución Linked Data completa.

Además de las clases y propiedades que forman parte del perfil de aplicación el documento de trabajo incluye otras secciones interesantes como:
  • Otros perfiles de aplicación – entre los que se incluye la Norma Técnica de Interoperabilidad de Reutilización de recursos de la información – y modelos de descripción de conjuntos de datos que están siendo ya utilizados en Europa y que han servido como input para este trabajo.
  • Diferentes escenarios y casos de uso de ejemplo para la aplicación de DCAT-AP.
  • Vocabularios de referencia propuestos para su utilización de forma conjunta con el perfil de aplicación.
  • Aspectos de accesibilidad y multilingüismo que se deberán tener en cuenta.
  • Cuestiones relacionadas con el entorno de despliegue de DCAT-AP.

Participa

La definición de DCAT-AP se lleva a cabo a través del consenso de un grupo internacional de expertos que participan en distintas iniciativas Open Data de la Unión Europea. No obstante, el Vocabulario se encuentra ahora en fase de revisión pública durante las próximas cuatro semanas y es muy importante que todos los interesados revisen la especificación y comenten sus impresiones para entre todos poder conseguir la máxima interoperabilidad tanto por parte de los proveedores de datos como de los potenciales consumidores.

También se puede consultar el historial de las distintas cuestiones que se han ido debatiendo a lo largo del desarrollo del perfil de aplicación.

Cuando el diseño se encuentra con el Open Data

Los planteamientos de Daniel Torres Burriel sobre cómo ve él las iniciativas Open Data desde su perspectiva de un diseñador, que son de lectura obligada para comprender lo que viene a continuación, me dan pie a iniciar una conversación sobre un tema que ya me había planteado en varias ocasiones: la relación entre el Open Data y el mundo de los diseñadores, así como las oportunidades de interacción y colaboración entre ambos.

Open Data

Empiezo pues agradeciendo a Daniel el haber abierto el debate público sobre la materia y a continuación paso a expresar mis opiniones en cuanto a sus comentarios:

PDFs: El cementerio donde reposan los datos

Creo que nadie duda de ello, si bien es cierto que se sigue (y se seguirá) publicando información en PDF, mucha, claramente demasiada. El origen de este fenómeno suele ser que toda esa información normalmente ya estaba previamente en ese formato, ya que durante muchos años los PDFs fueron la forma cómoda (y pésima) de crear contenidos para las Webs de la Administración.

Pero, aunque siempre será algo mejor tener datos públicos en un mal formato que no tener ningún dato publicado, esto no debería ser tomado nunca como una solución definitiva, sino como una mera transición para publicar inmediatamente la información disponible a la vez que se trabaja en la mejora de esos formatos. El problema surge cuando lo que debería ser una solución (muy) temporal se convierte en el formato final y es entonces cuando los PDFs se convierten en el lugar a dónde van a morir los datos.

Modelos de representación de los datos

No tengo claro si he entendido bien el concepto de lo que propones como interfaz de consumo, por eso no estoy seguro de si es algo que realmente ya existe o algo que habría que hacer o si simplemente lo que pides es imposible.

Tal y como yo lo veo, cualquier dato que se exponga al final no es más que un dato, lo que al final sumará multitud de datos de las más variadas fuentes y dominios de información. Sí lo que pides es unas pautas generales de presentación de datos me atrevería a afirmar que eso es imposible más allá de todo el compendio que existe ya sobre el tratamiento general de la información y su visualización, pero eso también es una ciencia por sí misma que hay que saber aplicar en cada caso para saber sacarle partido a la información y aflorar las historias que esconde.

No hay más reglas ni puede haberlas. Si no lo he entendido bien por favor ayúdame a interpretarlo mejor, porque me encantaría poder buscarle una solución.

Los datos como entidades vivas

Sin lugar a dudas los datos son entidades vivas, y además existe cierta relación directa entre la frecuencia de actualización de los datos y su valor, es decir, generalmente los datos más vivos y que por su naturaleza se actualizan con mayor frecuencia son los que pueden aportar un mayor potencial en cuanto a beneficio social y económico.

Esa realidad se debe reflejar en los sistemas que gestionen los datos, pero el hecho de que un conjunto de datos se presente como fichero no quiere decir que ese datos estén condenados a la estaticidad de por vida. Al fin y al cabo un fichero tan solo refleja el estado de ese conjunto de datos en un momento determinado y por tanto podría ser también una solución válida aquella que aportase un fichero por cada versión de los datos, siempre que se combinase con un sistema adecuado de gestión de versiones, a través de una configuración apropiada de las URIs por ejemplo.

Cuestión aparte es que hay ciertos datos especialmente dinámicos a los que se les podría sacar mucho más partido a través de una API, e intuyo que por ahí van tus peticiones. En eso no puedo más que coincidir, con un algunos de matices:

  • Una API podría no ser siempre la mejor opción.
  • Para cumplir con los principios del Open Data esa API debería ser un complemento y nunca un sustituto del acceso completo a los datos en bruto.
  • Habrá que seleccionar cuidadosamente cuáles son los datos que se abren por este medio, ya que crear y mantener una infraestructura que de soporte a ciertos datos especialmente dinámicos puede resultar bastante caro, y por supuesto estaríamos hablando de dinero público.

Patrones de datos

Nuevamente no se si el concepto de patrón de diseño se podría aplicar a la explotación de los datos, está claro que sí debe aplicarse, y de hecho ya se hace, para el diseño de los modelos de datos, pero precisamente el potencial de la explotación de los datos se basa en que no hay patrones establecidos y la creatividad y la imaginación con los que somos capaces de combinarlos son los únicos elementos que definen los límites.

Evidentemente para poder sacar provecho de esos datos habrá que tener ciertos conocimientos que provienen de distintas disciplinas (cálculo, estadística, bases de datos, algoritmos, programación, visualización, etc.) que en conjunto se vienen denominando Data Science, y por supuesto contando siempre también con especialistas de la materia en cuestión que se esté tratando en cada momento (sanidad, educación, transportes, medio ambiente, etc.)

Lo que si que es cierto es que en general existe una ausencia muy preocupante de los famosos code books que deberían acompañar siempre a cualquier conjunto de datos para facilitar su explotación. Cuando tratamos con datos muy simples con estructuras mínimas es fácil que con poco esfuerzo cualquiera deduzca esas estructuras y pueda sacarles partido, pero en la mayoría de casos intentar hacer algo productivo con unos datos en crudo que no cuentan con ninguna documentación puede evolucionar fácilmente hacia una misión imposible, o cuando menos conllevará unos considerables esfuerzos superfluos que se podrían y deberían haberse evitado fácilmente.

La crítica final

Me alegra ver que todo el mundo esté últimamente ávido de datos, pero las iniciativas Open Data son carreras de fondo en la que hay que seguir una serie de pasos, entre los cuales se encuentra la necesidad de proporcionar un catálogo para que la información salga de los archivadores y los discos duros de la administración y se haga visible a todo el mundo.

Por muy poco acertada que pueda acabar siendo una iniciativa Open Data en su ejecución, que las hay, creo que llegar a compararlo con el despotismo ilustrado podría ser cuando menos un poco exagerado. Sobre todo si tenemos en cuenta que en este caso el Gobierno de Aragón lleva ya bastante tiempo trabajando tanto internamente, impartiendo formación a sus servidores públicos, como externamente llamando a la participación de todo el mundo, además de haber mostrado en repetidas ocasiones su voluntad de seguir haciéndolo en el futuro próximo.

Está claro que la colaboración entre todos los agentes implicados (Gobierno, Ciudadanos, Empresas, Profesionales, Universidad, etc.), incluyendo por supuesto a los diseñadores, es una herramienta fundamental para el éxito del Open Data, y por eso sería estupendo que el evento UX de referencia en España, al que acudirán muchos de esos diseñadores, adoptase un modelo más flexible, participativo e inclusivo,que las tradicionales conferencias y mesas redondas para abrirse más a la colaboración e intercambio de ideas con otros profesionales, como por ejemplo los del mundo del Open Data.

Personalmente me gustaría saber más sobre las inquietudes de diseñadores y profesionales de la UX acerca del Open Data, puesto que además ya forman parte de él cuando aplican RDFa, schema o microdatos a los diseños Web por ejemplo, pero es que si nunca hablamos, y cuando lo hacemos no es de forma constructiva, difícilmente nos vamos a poder entender.

Avances de la Comisión Europea en materia de Open Data y RISP

Este artículo fue publicado primero en inglés.

Tal y como se viene afirmando últimamente, los datos son el nuevo combustible que alimenta la era digital. Si tenemos en cuenta el amplio rango de oportunidades que el Open Data puede proporcionarnos, no es ninguna sorpresa que dentro de los planes de la Comisión Europea esté el continuar revolucionando la forma en la que las autoridades públicas comparten sus datos. A continuación se muestra una visión general de cuáles son las acciones llevadas a cabo por la CE hasta el momento en materia de Open Data e Información del sector público, así como una revisión de las acciones futuras más inmediatas.Logo European Commission

Un hito de referencia: Workshop de Datos en la Asamblea de la Agenda Digital 2011

La CE organizó una primera Asamblea de la Agenda Digital en Junio de 2011 para tratar los avances en relación a los objetivos de la Agenda Digital para Europa. Con ese propósito se organizaron una serie de dos sesiones plenarias y 24 talleres temáticos, uno de los cuales estuvo dedicado al Open data y la reutilización de la información en el Sector Público (RISP), donde distintos actores implicados en la materia se dieron cita para colaborar con la Comisión en el desarrollo de su estrategia Open Data para la Unión Europea.

Khalil Rouhana (Director General de Sociedad de la Información de la CE) realizó varios anuncios clave en relación a las políticas Open Data en la UE que analizaremos en las siguientes secciones.

El papel de los portales Open Data Europeos

Los portales Open Data están destinados a ser una referencia clave en la infrastructura digital que facilite el acceso y reutilización de la Información del Sector Público y son varios los estados miembro que están desarrollando portales Open Data a todos los niveles. Dado que la cantidad de datos publicados hasta el momento es relativamente limitada en comparación con los disponibles, la CE tiene dentro de sus planes la publicación de dos nuevos portales Open Data que faciliten el acceso a datos Europeos:

Captura de pantalla de data.gov.eu

  •  El portal Open Data de la Comisión Europea data.gov.eu, pensado para facilitar la localización de los datos de la propia Comisión y otras instituciones Europeas. El portal, actualmente en desarrollo, estará disponible para el público a lo largo del 2012.
  • Portal Open Data Pan-Europeo, que facilite la localización y reutilización de los datos de administraciones nacionales, regionales y locales a lo largo de Europa. Un prototipo estará disponible en el 2013.

Revisión de la directiva de reutilización de la Información del Sector Público

Originaria de Noviembre de 2003, y actualmente traspuesta por completo a todos los estados miembros, la Directiva original proporcionaba una harmonización mínima de reglas y procedimientos a lo largo de la UE para facilitar la reutilización de la Información del Sector Público a través de las fronteras. En diciembre de 2011 se presentó una propuesta para la revisión de la Directiva para mejorar la apertura del mercado de servicios sobre la Información del Sector Público a través de las siguientes medidas:

  • Incluir nuevos participantes en el ámbito de aplicación de la Directiva, como por ejemplo bibliotecas, museos y archivos.
  • Determinar límites en las tasas que se establezcan como costes márginales por parte de las autoridades públicas.
  • Introducir medidas de seguimiento independientes en los Estados Miembros.
  • Desarrollar estándares para formatos legibles por máquinas que puedan ser utilizados por las autoridades públicas.

Otros pasos previos significativos

El primer taller sobre Open Data en la Asamblea de la Agenda Digital supuso sin duda un antés y un después, tanto en las políticas Open Data y de reutilización en la UE como en la forma en que la CE comunica esas políticas e interactua con los distintos agentes implicados.

Sin embargo, varias fueron también las medidas adoptadas por la CE en materia de Open Data y RISP con anterioridad a este primer talle, como por ejemplo:

Diciembre 2011: El Comunicado sobre Open Data

Como continuación del primer taller de la Agenda Digital, la Comisión adoptó un Comunicado oficial sobre Open Data a través del cual se proponen una serie de acciones para cumplir con los objetivos previamente anunciados:

  • Crear un portal para la información de la Comisión que se extienda posteriormente también a otras instituciones y agencias de la UE.
  • Trabajar en conjunto con los Estados Miembros sobre los formatos de datos y la interoperabilidad de los distintos sitios.
  • Crear un portal Pan-Europeo que enlace información de distintas instituciones de los Estados Miembro.

Segundo taller sobre Datos en la Asamblea de la Agenda Digital 2012

En Junio de 2012, la Asamblea de la Agenda Digital acogió una nueva edición del taller de Datos en la que se dio un nuevo repaso a la hoja de ruta de la EC en materia de Open Data y RISP:

También es destacable la apuesta global Europea en materia de tratamiento de datos, Open Data y Open Access, no solo solo mediante políticas y medidas regulatorias, sino también a través de investigación, innovación y la implementación de pilotos y portales financiados mediante los múltiples programas de I+D+I FP7 y CIP-ICT-PSP 2011-13, que tendrán su continuación con el nuevo Programa Horizon 2020.

Horizon 2020 logoAlgunas de las cuestiones que destacan de entre las tratadas en este nuevo taller fueron:

Licencia de Datos Europea

Existe una necesidad real de estudiar los requisitos para una Licencia de Datos Europea, dado que será un elemento necesario a la hora de facilitar el acceso y la reutilización de los datos a través de las fronteras Europeas. Varias son las cuestiones que hay que resolver al respecto: ¿Sirve alguna de las licencias ya existentes o necesitaríamos una nueva? En caso de necesitar una nueva licencia, ¿hay alguna opción obvia a seguir o se necesitaría algo completamente nuevo?

Publicación de Datos Clave

Dado que los Estados Miembros de Europa cuentan ya con una enorme cantidad de datos valiosos, una tarea prioritaria sería la identificación y difusión abierta de Datos clave de referencia. Algunos de esos datos ya están siendo publicados de forma abierta por ciertos Estados Miembro, pero son todavía demasiados los que permanecen cerrados bajo extrañas reglas de reutilización o modelos de recuperación de costes insostenibles.

Próximos pasos

Además de todas las actuaciones en marcha anteriormente mencionadas, y según lo anunciado por la Vice Presidenta de la Comisión Neelie Kroes, la CE tienen en mente continuar con el desarrollo de su estrategia Europea para la publicación y reutilización de los datos del sector público en las instituciones Europeas y los Estados Miembros. Algunos elementos destacables dentro de los próximos pasos serían los siguientes:

Servicios para la publicación, acceso y reutilización de los Datos Públicos en la UE

Están planificados una serie de servicios orientados a dar soporte en la publicación de Datos por parte de agentes públicos de la EU en cualquier nivel. Estos servicios incluirán:

  • Servicios relacionados con la preparación, transformación y publicación de los datos, con el compromiso de publicar al menos 15.000 nuevos conjuntos de datos en formatos legibles por la máquinas – incluyendo tecnologías Linked Open Data – y que procedan de todos los Estados Miembro de la UE.
  • Formación a trabajadores públicos en las áreas de Open Data, y en particular para favorecer la adopción de tecnologías Linked Open Data por parte de las instituciones públicas de la Unión Europea.
  • Servicios de asesoría y consultoría técnica en materia de Open Data en general, y particularmente en cuanto a tecnologías Linked Open Data se refiere.

La Incubadora de Reutilización del Open Data

Los distintos instrumentos financieros establecidos continuarán dando soporte a distintos desarrollos Open Data. Cabe destacar el Programa de Trabajao FP7-ICT 2013 que ayudará a las pequeñas y medianas empresas (PYMEs) en el desarrollo de aplicaciones innovadoras para la gestión de contenidos digitales, y particularmente en la reutilización de Open Data a través de la Incubadora Open Data. El objetivo de la Incubadora será establecer un entorno adecuado para:

  • Sondear al público en general en búsqueda de ideas de reutilización del Open Data y llevar a cabo una campaña de Reutilización de la Información Open Data a nivel Europeo.
  • Gestionar convocatorias regulares dirigidas a PYMES en busca de mini-proyectos que puedan ser financiados y llevados a cabo en un periodo de entre 6 y 12 meses.
  • Crear una infraestructura donde las propuestas ganadoras puedan encontrar versiones corregidas y actualizadas de los datos que necesiten para crear sus servicios.
  • Establecer mecanismos para la conexión entre la oferta y la demanda, poniéndose en contacto a los agentes públicos Europeos y ayudándoles a conseguir una publicación eficiente y sostenible de la información.

Armonización de iniciativas Open Data

Como respuesta al reciente clamor por la armonización de iniciativas Open Data, la Unión Europea está financiando proyectos como “Armonización del Open Data en el área del Mediterráneo mediante un mejor acceso y reutilización de la Información del Sector Público – Homer”, cuyo objetivo principal es establecer una estrategia efectiva capaz de armonizar las políticas y portales Open Data a lo largo del área Mediterránea, dando soporte tanto a Gobiernos regionales como locales.Homer Logo

Nuevas vías de crecimiento

La búsqueda de nuevas vías de crecimiento que exploten las posibilidades del Open Data alrededor de una temática específica es tan importante a la hora de avanzar en la materia como los esfuerzos políticos, estructurales y educativos. Algunos de las temáticas Open Data que se están explorando actualmente a nivel de la Comisión Europea son:

  • Datos Culturales: La iniciativa de bibliotecas digitales de la UE pretende hacer que todos los recursos culturales de Europa sean accesibles por todo el mundo, preservándolos para las generaciones futuras. En este área cabe destacar la reciente adopción de la licencia CC0 por parte de Europeana, que supone un cambio importante en el acceso al Open Data que sienta un precedente internacional en el distanciamiento del mundo de los datos cerrados y controlados.

Europeana

  • Smart Cities: Uno de los mayores retos a los que se enfrenta la UE es cómo diseñar y adaptar las ciudades hacia entornos más inteligentes y sostenibles. Las tecnologías urbanas intelligentes suponen una mejora importante a la hora de afrontar los retos urbanos gracias a que involucran a los distintos sectores implicados, dando lugar a soluciones adaptables e interoperables y creando una vía para un uso transparente y abierto de los datos.
  • Open Science: La EC ya ha realizado un primer esbozo de las medidas para mejorar el acceso a la información científica producida en Europa. Un acceso más amplio y rápido a las publicaciones y datos científicos financiados con dinero público hará que sea más fácil aprovechar los resultados por parte de investigadores y empresas, mejorando sustancialmente la capacidad de innovación Europea y dando un acceso más rápido a los beneficios de los descubrimientos científcos. La Comisión hará que el acceso abierto a publicaciones científicas sea un principio general de Horizon 2020, el programa de Investigación e Innovación Europeo para el periodo 2014-2020.

Networking, concienciación y difusión

Tal y como se extrae de las conclusiones en materia Open Data de la última Asamblea de la Agenda Digital,  las actividades de networking, concienciación y difusión son elementos clave para el éxito de una política Open Data y RISP en la EU. De forma complementaria a las acciones legislativas, la Comisión también da soporte a acciones de concienciación difusión y networking como por ejemplo:

  • El Public Sector Information Group, un grupo de expertos en RISP que incluye representantes de 27 Estados Miembro y ha sido convocado por la CE para el intercambio de buenas prácticas e iniciativas que den soporte al RISP, así como proponer soluciones a los retos pendientes, tales como tasas, acuerdos de exclusividad o indicadores de desarrollo RISP.
  • LAPSI, la Red Temática Europea sobre Aspectos Legales de la Información del Sector Público. Principal punto de referencia Europeo en cuanto al análisis de políticas de alto nivel y acciones estratégicas sobre cualquier cuestión legal relacionada con el acceso y la reutilización de la Información del Sector Público en el ámbito digital.
  • El European Data Forum, reunido por primera vez en Copenague en Junio de 2012 y próximamente en Dublín (Abril 2013). Es un foro en el que los agentes de negocio –  incluyendo un gran número de PYMES – investigadores y otros agentes implicados pueden reunirse para discutir el estado de la economía del dato.

La Plataforma Europea de la Información del Sector Público

La EPSI Platform es el nodo central Europeo en cuanto a Reutilización de la Información en el Sector Público (RISP) y su objetivo es la promoción de un mercado RISP dinámico a lo largo de la UE. La Plataforma proporciona un punto de reunión donde los diferentes agentes implicados pueden obtener toda la información relevante acerca de los desarrollos RISP en la UE, así como buenas prácticas destacadas, cuestiones legales y ejemplos de productos y servicios RISP.

EPSI PlatformLa plataforma publica noticias sobre desarrollos RISP Europeos y casos legales acerca de la reutilización, así como buenas prácticas y ejemplos de nuevos productos y servicios que dan cobertura a los principales mercados RISP. Desde la plataforma se hace un seguimiento continuo de los principales desarrollos en políticas Open Data, Government Data y RISP y se elaboran informes sobre distintas iniciativas y proyectos, tanto a nivel Europeo como en el resto del mundo.

The European Commission steps forward on Open Data and PSI re-use

As so often repeated these days, data is the new fuel for the digital age. Considering the wide spectrum of opportunities Open Data may bring, it is no surprise that the EC plans how to keep shaking up the way public authorities share data. The following lines aim to be an overview of the EC developments so far on Open Data and Public Sector Information, as well as a review of future planned actions.

Logo European Commission

A Landmark Event: Data Workshop at the Digital Agenda Assembly 2011

The EC organized the first Digital Agenda Assembly in June 2011 to discuss advances with regards to the Digital Agenda objectives for Europe. With that aim, twenty-four thematic workshops and two plenary sessions were conducted. One of those events was the Open data and Re-use of Public Sector Information workshop, where different types of stakeholders congregated to collaborate with the Commission on developing its strategy for Open Data in the EU.

Khalil Rouhana (DG Information Society and Media Content & Cognitive Systems of the European Commission) made several key announcements in relation to Open Data policies in the EU during that workshop. We will focus briefly on these in the forthcoming sections.

The role of European Open Data portals

Open Data portals are aimed to be a key referral of the digital infrastructure bound for facilitating access to and re-use of Public Sector Information. Open Data portals have been -and are being- created around many EU Member States at all governmental levels. Given that the quantity of data published so far is relatively limited as compared to that potentially available for publication, the EC plans to publish two new central Open Data portals to facilitate access to European Open Data:

data.gov.eu screenshoot

  • The European Commission Open Data portal data.gov.eu, a portal easing the search for Commission data, as well as other EU institutions, bodies and agencies to citizens and industry. The portal, currently under developement, is expected to be released soon in 2012.
  • Pan-European Open Data portal, to make data from EU, national, regional and local administrations more easily available and re-usable. A prototype is expected to be released in 2013.

Review of the Directive on the Re-use of Public Sector Information

First adopted on November 17, 2003 and by now completely transposed to all member States, this original PSI Directive provided a minimal harmonisation of rules and procedures across the EU in order to facilitate cross-border re-use of the PSI. A proposal for a revision of the Directive, which is currently being discussed by the Union legislator, was presented in December 2011 to further open up the market for services based on PSI by:

  • Including new bodies in the scope of application of the Directive such as libraries, museums and archives.
  • Determining limits on the fees that can be charged by the public authorities at marginal costs.
  • Introducing independent oversight re-use rules in the Member States.
  • Making standard machine-readable formats for information held by public authorities.

Other Meaningful Previous Steps

That first Open Data and PSI workshop was a landmark event both in Open Data and PSI policies in the EU as well as in the way that the EC communicates these policies and interacts with the different stakeholders. Nevertheless, several steps forward were also made by the EC on the Open Data and PSI matters before this first Digital Agenda Workshop, such as:

December 2011: The Communication on Open Data

Following the first Digital Agenda workshop, the Commission adopted a Communication on Open Data by December 2011. In this Communication, the Commission proposes several actions to accomplish the objectives previously announced in the aforementioned DAE workshop:

  • To create a portal site for Commission-held information aiming at an expansion to other EU institutions, bodies and agencies at a later stage.
  • To work with the Member States on data formats and interoperability between existing sites.
  • To create a Pan-European umbrella site linking information held by EU institutions, bodies and agencies and by Member States.

First Update: New Data Workshop at the Digital Agenda Assembly 2012

In June 2012, the Digital Agenda Assembly 2012 housed a new Data Workshop where the European Commission Open Data and PSI roadmap was presented again, mainly:

It is also remarkable to recall the European overall bet for data handling, Open Data and Open Access, not only by Open Data policies and a regulatory strand (PSI Directive), but also by means of research, innovation and ICT deployment pilots and portals implemented through financial support instruments such as the FP7 and CIP-ICT-PSP 2011-13 R&D&I multiple programmes, that are currently almost gone but will have continuity with the new Horizon 2020 programme.

Horizon 2020 logoSome of the questions that lead this Workshop where:

European Data license

There is a strong need to investigate requirements for an European Data License, given that if we want to encourage use and reuse of data across European borders, there may be the need for a single cross-border license. Several questions then arise: Will one of the existing licenses do the job, or do we need a new one? If we do need a license, is there an obvious choice, or is something new required?

Release of Core Data

A first-priority task will be to identify and evangelise Open release of Core Reference Data, given that European Member States have already huge quantities of valuable data. Some of this data is now becoming freely available in certain Member States, but too much of it remains locked up behind odd rules and unsustainable cost-recovery models. It is also difficult to compare data between Member States.

Future Steps

In addition to all the work in progress that has been previously mentioned, and as announced by the Vice President of the Commission Mme Neelie Kroes, the EC also plans to continue developing their European strategy for the publication and reuse of public sector data from European institutions and the Member States, as established with Commission’s commitment to turn public data into business included in action 3 of the Digital Agenda for Europe Communication.

Some highlights of the future planned distributed actions include:

Services for publication, access and reuse of EU Open Public Data

A series of services will be purchased aimed at supporting the EU-wide availability of PSI and Open Data from public bodies at different governmental levels. These services will include:

  • The provision of data preparation, transformation and publication services, with a commitment to publish at least 15.000 new data sets from all EU Member States in machine readable formats, including Linked Open Data technologies.
  • Training services in the area of Open Data, in particular to favour the uptake of Linked Open Data technologies by public bodies within the European Union.
  • Provision of an IT advisory and consultancy service in the area of Open Data, and in particular on Linked Open Data technologies, including specific software development tasks.

The Open Data Reuse Incubator

Financial support instruments will continue to support several Open Data developments, notably, the FP7-ICT Work programme 2013 will help Small and Medium Enterprises (SMEs) to develop innovative applications in structured and unstructured digital content management and, particularly, in the reuse of open data through an Open Data Incubator.

This Incubator will establish an environment to:

  • Solicit open data reuse ideas from the general public and conduct a European wide open data reuse information campaign.
  • Publish and manage regularly scheduled calls for SMEs to submit mini-proposals to be funded for a period between six and twelve months.
  • Create a computing infrastructure where the winning mini-proposals will find accurate and up-to-date versions of the data they need for their services.
  • Establish a mechanism for connecting open data demand and supply by systematically contacting European public bodies for their open data and assisting them in the efficient and sustainable publication of such data.

Harmonization of Open Data initiatives

In response to the increasing clamour in search of harmonising Open Data initiatives, the European Union is financing projects such as “Harmonising Open Data in the Mediterranean through better access and Reuse of Public Sector Information – Homer”, which aims mainly to set up an effective strategy able to harmonise Open data policy and portals across the Mediterranean area, supporting regional and local governments.Homer Logo

New paths for growth

As important as political, structural and educational efforts, uncovering new paths for growth, in which Open Data possibilities about a given topic are explored, is also critical in order for Open Data and PSI re-use to advance. Some Open Data and PSI topics that are currently being explored by the European Commission are:

  • Cultural Data: The EU’s digital libraries initiative sets out to make all Europe’s cultural and scientific resources accessible to all, and preserve them for future generations. In this area it should be pointed out that recent Europeana’s move to CC0 is a step change in open data access, given that releasing data from across EU country sets an important new international precedent and a decisive move away from the world of closed and controlled data.

Europeana

  • Smart Cities: One of the greatest challenges facing the EU is how best to design and adapt cities into smart intelligent and sustainable environments. Smart urban technologies can make a major contribution in tackling urban challenges by breaking down boundaries between the sectors involved, ensuring adaptable and interoperable solutions and finding a way to use data transparently and openly, without breaching privacy.
  • Open Science: The European Commission outlined measures to improve access to scientific information produced in Europe. Broader and more rapid access to scientific papers and data will make it easier for researchers and businesses to build on the findings of public-funded research, boosting Europe’s innovation capacity and give citizens quicker access to the benefits of scientific discoveries. The Commission will make open access to scientific publications a general principle of Horizon 2020, the EU’s Research & Innovation funding programme for 2014-2020.

Networking, awareness raising and Dissemination

As seen from the last Digital Agenda Assembly Open Data conclusions above, networking, awareness raising, dissemination and outreach activities are considered key elements for the Open Data and PSI re-use market success at the EU. Complementary to legislation, the Commission supports deployment, support, awareness raising, and networking actions such as:

  • The Public Sector Information Group, an PSI expert group which includes representatives of 27 Member States that was set up by the EC to exchange good practices and initiatives supporting public sector information re-use and discuss and recommend solutions to challenges such as charging, exclusive agreements, development indicators for measuring public sector information and technology.
  • LAPSI, The European Thematic Network on Legal Aspects of Public Sector Information to become the main European point of reference for high-level policy discussions and strategic action on all legal issues related to the access and the re-use of the PSI, namely in the digital environment.
  • The European Data Forum, with a first meeting in Copenhagen (June 2012), and the next scheduled for Dublin in April 2013. It is a forum in which business actors, including a large number of SMEs, researchers and other stakeholders can come together to work out what a data economy really looks like.

The European Public Sector Information Platform

The EPSI Platform is Europe’s One-Stop Shop on Public Sector Information (PSI) Re-use which objective is the promotion of a dynamic PSI re-use market across the EU, a place where the different stakeholders can get all the relevant information about the European and international PSI re-use developments, emerging good practices, legislation, legal cases, examples of PSI re-use products and services, etc.

EPSI PlatformThe Platform provides news on European PSI developments, legal cases around re-use, good practices and examples of new products and services, covering the main PSI re-use markets. It follows and reports on a daily basis the developments of the PSI re-use/open-data/government-data policies, initiatives and/or projects in the EU and elsewhere.

Del eGovernment al Linked Government Data

Una visión histórica sobre la gestión de la información en el sector público.
Este artículo fue publicado primero en BOLETIC en colaboración con Jose Manuel Alonso.

A lo largo de los años, los organismos e instituciones públicas han ido produciendo, archivando y distribuyendo una gran cantidad y variedad de información en el transcurso diario de sus actividades. El reto permanente para las Administraciones consiste en aplicar planes de actuación que sigan los estándares y prácticas adecuadas para conseguir que toda esa información gubernamental sea fácil de encontrar, esté siempre a mano, y sea accesible, comprensible y usable, para así conseguir que las personas puedan interactuar con sus Administraciones de la forma más eficaz y eficiente posible.

En este artículo haremos un breve recorrido histórico sobre la gestión de la información en el sector público, desde los orígenes de la eAdministración hasta llegar a las tendencias actuales y futuras de la mano del Linked Government Data.

Unos inicios no muy lejanos.

Desde la aparición de las nuevas tecnologías de la información y la comunicación, la Administración ha estado esforzándose por utilizar estas herramientas para encontrar medios cada vez más eficaces a la hora de dar servicio a los ciudadanos. La idea de que la Administración hiciera uso de la Web y sus tecnologías asociadas nació a finales de la década de los 90 y se culminó a principios de la década siguiente como una extensión de la tendencias dominantes por aquella época (eComercio, eConocimiento, eServicio, etc.), lo que dio lugar a que se acuñase también el término de eAdministración (eGovernment o eGov en inglés).

En aquel momento, la Web era una tecnología incipiente que estaba dando sus primeros pasos y aún funcionaba de una forma bastante caótica. Se hablaba de estos términos y se divulgaban con la esperanza de crear interés y, a la larga, un negocio a través de este nuevo medio.

Fue durante ese mismo periodo cuando las Administraciones comenzaron a darse cuenta de las oportunidades que estas tecnologías podrían suponer también a nivel interno para mejorar su organización y sus actividades, buscando el mismo nivel de eficiencia y los mismos enfoques utilizados por otros sectores para mejorar y divulgar su información y servicios.

Situación actual

Las Administraciones se han esforzado durante esta última década en proporcionar más información y mejores servicios a sus usuarios finales, llevando a cabo grandes esfuerzos en los ámbitos de la política, los recursos, la tecnología y las capacidades.

La explosión y desarrollo de la Web, así como las tecnologías y prácticas asociadas a ella, han ofrecido a las Administraciones lo que quizás es su mejor oportunidad para hacer realidad el objetivo de ofrecer información y servicios a la vez que se satisface la demanda por parte de los ciudadanos de una contribución e interacción cada vez mayores.

Sin embargo, en general, las Administraciones todavía no han comprendido por completo el impacto y la oportunidad que supone la Web para ellas ni cómo incorporarla y adaptarla correctamente a sus sistemas de trabajo, por lo que los objetivos de mejora de servicio, eficiencia, transparencia y participación no se han visto todavía cumplidos en la medida de lo esperado.

Por otro lado, el cambio de paradigma y la descentralización aportada por la denominada Web 2.0 no ha hecho otra cosa que acrecentar y complicar los desafíos que deben superar las Administraciones, ya que en general se han visto sorprendidas y desconcertadas por este nuevo paradigma, con el problema añadido de la carencia general de estrategias claras para el tratamiento de la información por parte de las instituciones gubernamentales.

Nuevos tiempos, nuevos modelos

Hoy en día, inmersos como nos encontramos en plena transición hacía la economía del conocimiento, todo el mundo asume como natural que ciertos datos procedentes de las Administraciones deben ser compartidos, fáciles de localizar, accesibles y manipulables por todo aquel que lo desee.

Ahora también, y gracias a la tecnologías emergentes que ofrece la Web, como es el caso de la Web Semántica, las Administraciones tienen a su disposición nuevas formas de comunicación con los ciudadanos que les brindan la oportunidad de abrir sus puertas, ayudando a entender, explicar, informar y divulgar grandes cantidades y tipos de información para su uso, interés y comprensión.

Semantic Web at W3CPor tanto, en la actualidad existen todos los ingredientes necesarios para que la Administración electrónica consiga que los ciudadanos puedan acceder a la información y los servicios gubernamentales en sus propios términos. Además, compartir esos datos e información gubernamental con el público hace que se establezca una relación más abierta y transparente con los ciudadanos, dando lugar a un nuevo modelo de Administración, la Administración Abierta (Open Government en inglés).

Los pioneros del Open Government

Dos son las iniciativas que a nivel mundial, y en un ejercicio de transparencia sin precedentes, iniciaron el camino hacia modelos de Gobierno más abiertos en los que el objetivo es utilizar las ventajas que ofrecen las tecnologías de la Web para destronar el secretismo que se había instaurado por defecto, pasando la Administración a cumplir un papel de simple gestor de la información en lugar de considerarse el propietario de la misma como había sucedido hasta el momento.

Barack Obama y Gordon Brown

Estados Unidos

A través de la figura de Barack Obama, que impulsó mediante una directiva de Gobierno Abierto la creación de un sistema de transparencia, participación pública y colaboración, con el convencimiento de que dicha estrategia fortalecerá la democracia y promoverá la eficiencia y efectividad en el Gobierno.

Los pilares de la estrategia USA se basan en la publicación online de la Información Gubernamental, la mejora en la calidad de dicha información, la promoción e institucionalización de una cultura de Gobierno Abierto y la creación de un Framework común que le de soporte.

Reino Unido

Mediante la figura de Gordon Brown, y posteriormente David Cameron, ha iniciado también un proceso de apertura mediante la publicación de la información que obra en poder de la Administración, con el objetivo de ayudar a los ciudadanos a entender cómo funciona el gobierno y cómo se llevan a cabo las distintas políticas.

La principal motivación en el caso del Reino Unido es el convencimiento de que esta información pública de fácil acceso ayudará a que los ciudadanos puedan tomar mejores decisiones y realizar sugerencias sobre las políticas de Gobierno basadas en la información recibida.

El punto común: Open Goverment Data

Ambas iniciativas comparten el objetivo común de publicar los conjuntos de datos de los que dispone la Administración en un ejercicio de transparencia por el que esa información vuelve a sus verdaderos dueños – la ciudadanía – creando al mismo tiempo procesos más eficientes de funcionamiento interno y externo que mejoren las operaciones e intercambios dentro de la propia Administración.

Así pues, las iniciativas pioneras de Gobierno Abierto se basaron en un mismo concepto, el Open Government Data (OGD), o lo que es lo mismo, la publicación de la información que obra en poder de las distintas Agencias de la Administración, haciéndola accesible a todo el mundo. Si bien existen varias definiciones de OGD, la más ampliamente aceptada es la que sigue las siguientes premisas:

  1. La información tiene que ser completa.
  2. Los datos deben provenir directamente de la fuente, sin transformación alguna.
  3. La publicación debe realizarse a tiempo para preservar el valor de la información.
  4. La información tiene que estar disponible para el mayor número de usuarios posibles.
  5. Los datos deben presentar una estructura mínima que permita su tratamiento automatizado
  6. La publicación tiene que estar libre de discriminación y disponible para cualquiera.
  7. Los formatos de publicación deben ser no propietarios.
  8. La información debe estar libre de restricciones de copyright o patentes. [según una versión más reciente: o ser reutilizable mediante licencias de tipo “atribución” – n.b.]

Estrategias diferentes: Datos en crudo vs. Linked data

Si bien ambas iniciativas comparten el objetivo común de facilitar el acceso a la información, facilitar la interoperabilidad y permitir su reutilización, la estrategia a seguir difiere en un aspecto fundamental ya que, mientras la iniciativa USA bajo la dirección estratégica de Vivek Kundra se centró inicialmente en la publicación de la mayor cantidad de información en el menor plazo posible, volcando la información en crudo tal y como está disponible, en el caso de UK se realiza un tratamiento previo de los datos parar reducir los esfuerzos necesarios en su posterior reutilización.

Raw Data now! vs. Linked Government Data

Para ello, el Gobierno de UK, que cuenta con el asesoramiento del inventor de la Web – Tim Berners-Lee, apostó por las tecnologías de la Web Semántica para modelar la información y establecer relaciones explícitas entre los distintos conjuntos de datos siguiendo los principios de los Datos Enlazados (o Linked Data):

  • Utilizar URIs para la identificaciónde los distintos elementos de información.
  • Hacer que las URIs de identificación resuelvan a través del protocolo HTTP.
  • Proporcionar información útil cuando se resuelve una URI de identificación.
  • Añadir enlaces a otra información para que se puedan descubrir nuevos elementos.

Linked Data

Es sabido que, gracias a la integración de información que ofrecen los datos enlazados y en formatos abiertos, es posible explotar nuevas vías para encontrar datos relevantes y pertinentes para sus necesidades a través de búsquedas, consultas, interfaces o herramientas.

El futuro: Linked Government Data

Muchas son ya las iniciativas que a nivel mundial han seguido el ejemplo de las pioneras pero, todas ellas, incluido el caso de USA, tienden en la actualidad a converger hacia la aplicación de los conceptos del Linked Data al Open Government, en lo que ya se denomina Linked Government Data.

Public Dataset Catalogs Faceted BrowserGracias a la utilización de las tecnologías de la Web Semántica, los Datos enlazados y el seguimiento de los principios generales de la Arquitectura Web, las Administraciones pueden ahora publicar conjuntos de datos que utilizarán vocabularios y metadatos de dominio específicos y ofrecerán al mismo tiempo interfaces de consulta comunes y transparentes para el acceso a la información, sin necesidad de que dichos interfaces hayan sido predefinidos, pasando así de la información legible para las máquinas a información que puede ser relacionada por las máquinas.

Estas características son las que hacen del Linked Government Data una herramienta perfecta para favorecer enormemente la reutilización de información por parte de terceras personas de formas completamente nuevas e impredecibles, al proporcionarnos un modelo de datos flexible que permite integrar fácilmente la información proveniente de distintas fuentes.

Linked Open Data cloud

Objetivo cinco estrellas

En cualquier proyecto de apertura de información no deberíamos limitarnos a buscar soluciones para compartir datos, sino que debemos buscar soluciones eficaces y eficientes, soluciones robustas que tengan en cuenta los principios de modularidad, redundancia mínima, escalabilidad e interoperabilidad entre otras buenas prácticas.

Es por ello que debemos siempre debemos intentar seguir una estrategia gradual orientada a llegar al máximo nivel dentro de la clasificación de las cinco estrellas para la publicación de Linked Open Data:

★                     Publicar la información (en cualquier formato) utilizando licencias abiertas.

★★                  Utilizar formatos de datos estructurados para proporcionar la información.

★★★                Evitar formatos propietarios para la representación de los datos.

★★★★             Utilizar URIs como identificación para que los datos se puedan referenciar.

★★★★★          Enlazar los datos con otros para añadir contexto.

Siguiendo una estrategia de este tipo se conseguirán finalmente los mayores beneficios, tanto para los publicadores de la información como para los consumidores finales.

Los desafíos pendientes

Hasta el momento se han puesto sobre la mesa muchas preguntas y la mayoría de proyectos existentes sólo han ofrecido respuestas parciales a algunas de ellas.

¿Cómo se deben modificar y adaptar las políticas, los procedimientos y las leyes de forma que haya cabida para el Open Data?

¿Cómo pueden garantizar las Administraciones que la fidelidad y la esencia fundamental de la información se mantienen intactas?

¿Existe alguna forma de publicar los datos sacados de los sistemas e infraestructuras desfasadas a través de la Web?

Desde nuestra experiencia podemos afirmar sin lugar a dudas que hoy en día disponemos de las herramientas y tecnologías necesarias para llevar a cabo una estrategia Linked Government Data con éxito, sin embargo, no existen todavía respuestas únicas y concretas para muchas de estas preguntas, ya que el Linked Government Data es actualmente una ciencia joven y hay algunas lecciones que todavía están por aprender mientras que los proyectos maduran y se siguen desarrollando.

Arquitectura de un sistema Linked Government Data

No obstante, en todos ellos ha quedado demostrado que lograr una Administración Abierta no es una tarea fácil, debido principalmente a los desafíos a los que deben enfrentarse las Administraciones a la hora de recopilar, gestionar y compartir la información. Entre estos desafíos podemos encontrar:

  • Impulso de las estrategias a todos los niveles ya que, tal como afirma Tim Berners-Lee, para que tenga éxito es necesario que la iniciativa se desarrolle simultáneamente tanto al más alto nivel de Gobierno como en los mandos intermedios y en la sociedad civil.
  • Existencia de políticas desfasadas que no se corresponden con la realidad social y tecnológica actual, con los consiguientes desafíos legales que se plantean y las dificultades para proporcionar una atención adecuada a los ciudadanos.
  • Cultura burocrática muy lenta, siendo necesario realizar cambios en los procedimientos para que se ajusten a la nueva realidad.
  • Limitaciones presupuestarias y de personal, no pudiendo siempre responder a las inversiones necesarias para llevar a cabo los proyectos de apertura de información y la capacitación necesaria para el personal que los gestione.
  • Desafíos tecnológicos a la hora de compartir la información, debido al carácter innovador de los proyectos y la complejidad que aporta la amplitud del ámbito de actuación.
  • Sensación de pérdida de control de la información, que pueda dar lugar a problemas de autenticidad en la procedencia de los datos, privacidad o seguridad nacional debido a la exposición inoportuna de la información o la falta de calidad de la misma.

A pesar de todo lo anterior, los beneficios de la apertura de la información son siempre mayores que los problemas que se plantean, ya que la publicación de los datos provenientes del sector público en formatos abiertos fomentará el discurso civil, proporcionará un mayor bienestar social y conseguirá un uso más eficiente de los recursos públicos.

Iniciativas Open DataEs por ello que cada vez son también más las iniciativas que surgen a nivel de la Administración nacional, y con las que trabajamos mano a mano para ofrecer soluciones a los problemas y desafíos pendientes con el objetivo de seguir sumando éxitos del Open Data en la Administración Pública.