Pablo Coca (Director de Desarrollo de Negocio y Operaciones)
16 de marzo de 2022
Una Nueva Economía se está fraguando, la Economía del Dato. Las Estrategias de Digitalización de la Unión Europea y de sus Estados Miembro, entre ellos España, identifican esta gran oportunidad en la hay puestas grandes expectativas, basadas en una prometedora evolución en la economía generada alrededor de los datos. No en vano, el European Data Market Study [1], elaborado el año pasado por la Comisión Europea, cuantifica en 36.714 millones de euros el impacto total de la Economía del Dato en el total de la economía española, representando el 3% del PIB de nuestro País y las previsiones que hace este mismo estudio indican un crecimiento de la Economía del Dato española hasta prácticamente los 50.000 millones de euros el año 2025 (4% PIB) y 67.000 millones de euros en 2030 (5,2% PIB)
La oportunidad está servida y vendrá dada por un aumento explosivo del volumen de datos que manejaremos a nivel Global en los próximos años, hasta el punto de que en el año 2025 representarán 175 zetabytes frente a los 33 zetabytes que manejábamos en el año 2018. Un incremento del 530% [2]. A modo de ejemplo, 1 zettabyte es el equivalente a una película HD con una duración de 36 millones de años.
Fuente: Estrategia Europea de Datos. Comisión Europea
Carme Artigas, Secretaria de Estado de Digitalización e Inteligencia Artificial, indicaba en la presentación del Hub Español de GAIA-X, el 14 de julio de 2021, que “todos los datos de los que disponemos hoy, tan sólo representan el 20% de los datos que tendremos a nuestra disposición en 2025. De este 80% de datos que aún hace falta crear y capturar, más del 60% provendrán de datos empresariales, no de datos personales. Por lo tanto, el gran potencial que tiene Europa es aprovechar esta gran mina de oro que van a ser los datos empresariales” [3].
La Comisión Europea lo tiene claro y en su Estrategia de Datos ha incluido como pilar básico el despliegue de Espacios de Datos Compartidos e interoperables para la construcción de un Mercado Único Europeo de Datos. Recientemente, aprovechando la publicación de Proyecto de Ley Europea de Datos (Data Act), el Comisario Europeo de Mercado Interior [4], Thierry Breton, anunciaba la publicación de un Informe sobre el grado de avance (state of play) del trabajo de la Comisión en lo relativo a Espacios Europeos de Datos Compartidos [5]. En este informe se identifican las 12 prioridades temáticas y sectoriales sobre las que la Comisión Europea está poniendo los esfuerzos para la creación de los Espacios de Datos:
Fuente: CTIC
El éxito de estos Espacios de Datos depende de la atracción de empresas, entidades y organismos privados y públicos a estos ecosistemas de compartición de datos, haciendo ver los beneficios de participar en los mismos, tanto consumiendo como aportando datos, y generando un marco de confianza, técnica y legal, a todas las partes para entrar en la dinámica del intercambio de datos, habilitante para que se desarrollen nuevos modelos de negocio basado en los datos.
En el sector público ya existe cultura y tradición de compartición de datos. Las iniciativas de Datos Abiertos (Open Data) han ayudado mucho, sin lugar a dudas. Somos buenos conocedores del camino hecho. Desde CTIC Centro Tecnológico, promovimos ya en el año 2008 la creación del Grupo e-Government del Worldwide Web Consortium (W3C), desde donde impulsamos junto a otros Miembros del Consorcio, las primeras guías y especificaciones de tecnologías W3C orientadas al open data. Esto nos dio la posibilidad de trabajar posteriormente con varias Comunidades Autónomas (Andalucía, Asturias, Castilla y León, Cataluña, Galicia, Navarra, País Vasco) y algunos Ayuntamientos (Barcelona, Gijón, Zaragoza) en el despliegue de sus estrategias de datos abiertos, así como con Red.es en la definición del Catálogo Nacional de datos abiertos y en el desarrollo de la Norma Técnica de Interoperabilidad para la Reutilización de Información del Sector Público (RISP) [6].
En el campo de la reutilización de datos abiertos generados por el sector público, aún existe mucho campo de mejora. El informe más reciente sobre este tema “La reutilización de datos abiertos III” [7], presentado por Alberto Abella y Fundación COTEC el pasado 6 de marzo, Día de los Datos Abiertos, se señala que sólo una tercera parte de los datos abiertos disponibles en nuestro País son reutilizados con fines profesionales, para la generación de negocio.
Es precisamente en este punto donde las iniciativas de Espacios de Datos Compartidos pueden, por un lado, beneficiarse de un gran volumen de datos disponibles a día de hoy, aproximadamente 58.000 conjuntos de datos (datasets) en España, y por otro lado beneficiar en el sentido inverso, al introducir aire fresco a la iniciativas de datos públicos abiertos incorporando nuevos consumidores de datos.
De nuevo, todo esto no tendrá recorrido sin el convencimiento y la participación activa del sector privado, consumiendo, generando y compartiendo nuevos datos. Las preguntas por su parte son claras y directas. ¿Cómo funciona? y ¿Qué saco de todo esto?
Damos la respuesta a través de una analogía y un juego de palabras: los Espacios de Datos son gasolineras de datos.
Foto de Coche creado por prostooleh - www.freepik.es
Como usuarios de un vehículo de combustión, cuando acudimos a una gasolinera a repostar, no tenemos que preocuparnos sobre qué combustible nos encontraremos y si éste será válido para nuestro motor. Acudimos en la confianza de que nos encontraremos una variedad de tipos de combustible, a saber, gasolina de distintos octanajes, diésel de distintas calidades o gasóleo para uso agrícola. Esto es posible gracias a que en el proceso de transformación del crudo de petróleo, que una vez extraído es transportado, refinado y convertido en combustible, todo se hace conforme a estándares y regulaciones, consensuados y conocidos por todas las partes, tanto productores, como fabricantes de vehículos usuarios, de modo que podremos repostar cualquier tipo de vehículo en cualquier país sin mayor problema que indicar cuánto combustible deseamos. El resto está solucionado por la estandarización, con sistemas que son interoperables.
Llevado al ámbito de los datos, un espacio de datos es una gasolinera de datos, una infraestructura, en este caso lógica, donde como usuarios acudimos para consumir datos, la gasolina de nuestros motores de analítica e inteligencia artificial. Y podemos hacer esto sin tener las preocupaciones y limitaciones actuales de qué datos encontraremos, en qué formato, con qué calidad y con qué restricciones para su utilización.
Conviene resaltar dos características principales de los espacios de datos compartidos:
- Federación de datos: el concepto “Espacio” se debe a que es una estructura federada, no centralizada. Esto quiere decir que a diferencia de un lago de datos (data lake) o una nube (cloud) centralizada, en estos Espacios el dato permanece “en origen” y mediante conectores y capacidades de búsqueda avanzada mediante semántica, se identifica dónde están los datos que se requieren, y se accede a ellos.
- Soberanía de datos: el propietario del dato decide qué se puede hacer con sus datos, bajó que condiciones se comparten y cómo se monetizan en caso de que haya condiciones económicas asociadas. Debe existir un marco de gobernanza que aporte la seguridad jurídica y confianza necesarias para facilitar el intercambio de datos y la generación de negocio asociado.
En cuanto al porqué, éste viene determinado por el acceso a nuevas oportunidades de negocio o la posibilidad de mejorar la competitividad o posicionamiento en el negocio ya existente. Esto se consigue a través de la opción que nos aportan estos Espacios para complementar datos propios, que están en posesión de una empresa, con datos disponibles en un espacio de datos, obteniendo en esa combinación una información de mayor valor.
Un ejemplo práctico de aplicación sería la combinación de los datos obtenidos por sensores en una explotación agrícola, por ejemplo propiedades del terreno, con datos disponibles de origen público, por ejemplo previsiones meteorológicas, así como con datos facilitados por una empresa privada, por ejemplo características de fertilizantes, para facilitar la toma de decisión por parte del agricultor en cuanto a tratamiento de sus terrenos. Esto podría hacerse ya, sin necesidad de acudir a espacio de datos compartidos, pero de este modo se asegura el acceso a los datos siempre del mismo modo, utilizando los mismos protocolos y reglas técnicas y asegurando que los nuevos datos que se generen a futuro se compartirán e intercambiarán del mismo modo.
Fuente: CTIC
Otro ejemplo, en este caso relacionado con el mantenimiento industrial, vendría a demostrar el beneficio de compartir los datos. A una empresa que desea implementar una solución de inteligencia artificial para el mantenimiento predictivo de una instalación y poder de este modo anticiparse a averías en los equipos de la misma, puede resultarle inviable la puesta en servicio del sistema inteligente por no tener suficientes datos para su entrenamiento. Compartiendo datos de los equipos que le interesa vigilar con otras empresas en su misma situación, datos anonimizados y agregados para evitar problemas de confidencialidad, todos se pueden beneficiar disponiendo de un volumen de datos suficiente para que los modelos y algoritmos de mantenimiento predictivo hagan recomendaciones certeras.
Hay varias entidades y organismos trabajando en las tecnologías de base sobre las que se está construyendo el esquema técnico de interoperabilidad que permita todo este intercambio en los Espacios de Datos Compartidos. Entre otros, la Asociación Internacional de Espacios de Datos (IDSA), el propio Worldwide Web Consortium (W3C), del que somos en CTIC Centro Tecnológico su Oficina para la comunidad hispanohablante en España y Latinoamérica, trabajando con la base de tecnologías semánticas e identificadores descentralizados desarrollados en sus grupos de trabajo, así como su trayectoria impulsando el Open Data.
Otra entidad es GAIA-X [8] , asociación europea que tiene por objetivo la creación de una infraestructura de datos abierta y segura. Es precisamente esta entidad la que además de promover el desarrollo de estándares y recomendaciones técnicas para la compartición de datos, ha adquirido un importante protagonismo como foro de encuentro y discusión entre todas las partes interesadas, independientemente de su forma (grandes empresas, pymes, asociaciones, ONGs, centros tecnológicos, organismos de investigación y universidades, Administraciones Públicas), para alcanzar consensos en cuanto al modelo de gobernanza del sistema para la obtención de seguridad jurídica en el nuevo marco que se abre en torno a los Espacios de Datos.
GAIA-X, promueve la creación de hubs en los distintos Estados Miembro de la Unión Europea, en torno a los cuales se desarrollen los ecosistemas nacionales de compartición de datos. Con el impulso y dinamización de la Secretaría de Estado de Digitalización e Inteligencia Artificial, se ha conseguido que un grupo promotor formado por 57 entidades, del que CTIC Centro Tecnológico forma parte, haya constituido las bases para la constitución oficial del Hub español como Asociación, GAIA-X España [9] , el próximo viernes, 18 de marzo, así como los grupos de trabajo para el lanzamiento de los primeros espacios de datos en nuestro País, concretamente en los ámbitos de Turismo, Fabricación, Movilidad y Agroalimentario. Desde CTIC Centro Tecnológico participamos en todos ellos, siendo además uno de los co-líderes del Grupo impulsor del Espacio de Datos Agroalimentario.
Fuente: Web GAIA-X España
Además, del grupo promotor de GAIA-X España [9], otras 350 entidades ya han mostrado su interés en sumarse a la Asociación, evidenciando el alto interés de esta iniciativa y de la temática, para la que los fondos Next Generation EU gestionados por el Gobierno de España, tienen previsto movilizar 500 millones de euros para el despliegue de espacios de datos en nuestro País.
Referencias:
- European Data Market Study: https://digital-strategy.ec.europa.eu/en/library/results-new-european-data-market-study-2021-2023
- Estrategia Europea de Datos. Comisión Europea: https://ec.europa.eu/info/strategy/priorities-2019-2024/europe-fit-digital-age/european-data-strategy_es
- Evento de presentación del hub español de GAIA-X: https://www.youtube.com/watch?v=wLUvDgH4Llw
- Data Act: Commission proposes measures for a fair and innovative data economy: https://ec.europa.eu/commission/presscorner/detail/en/ip_22_1113
- Staff working document on data spaces: https://digital-strategy.ec.europa.eu/en/library/staff-working-document-data-spaces
- Norma Técnica de Interoperabilidad de Reutilización de Recursos de Información: https://datos.gob.es/es/documentacion/norma-tecnica-de-interoperabilidad-de-reutilizacion-de-recursos-de-informacion
- La reutilización de Datos Abiertos III (PDF): https://www.meloda.org/wp-content/uploads/2022/03/Datos_abiertos_en_spain_III_2021.pdf
- GAIA-X: https://www.gaia-x.eu/
- GAIA-X Hub España: https://www.gaiax.es/