“Data mogen niet het nieuwe goud zijn, maar moeten – zoals hernieuwbare energie – op een duurzame manier en met gedecentraliseerd eigenaarschap beheerd worden met het oog op innovatie en algemeen belang.” Stefan Lefever, technisch directeur digitale transformatie bij imec, zet een duidelijke toon. Samen met Tanguy Coenen en Piet Demeester loodst hij ons doorheen de Vlaamse en Europese visie op databeheer en de bijdragen die imec en zijn partners hieraan leveren. Tanguy Coenen is expert digitale transformatiestrategie bij imec. Piet Demeester is professor aan de Universiteit Gent en directeur van IDLab, een imec-onderzoeksgroep aan de Universiteit Gent.
De behoefte aan een nieuw denkkader
Je hoeft geen data-expert te zijn om te weten dat een klein aantal techgiganten momenteel een monopolie bezitten op de data die wereldwijd beschikbaar zijn. In toenemende mate berichten de media over de negatieve effecten hiervan op onze privacy en persoonlijke levenssfeer. Minder aandacht krijgt het feit dat het datamonopolie ook een enorme rem zet op innovatie. Doordat opkomende en kleinere spelers geen toegang hebben tot data, strijden ze met ongelijke wapens en kunnen ze de hegemonie van de big-tech onmogelijk doorbreken. Daardoor kunnen deze giganten blijven teren op hun machtspositie en kunnen ze zonder veel gevolgen hun eigen financiële belangen vooropstellen boven die van hun gebruikers die de data genereren.
Piet Demeester: “Het is om deze reden dat Europa sterk inzet op een nieuw denkkader dat een tegengeluid en tegengewicht moet bieden aan de krachten uit de Verenigde Staten en Azië waaraan we nu onderhevig zijn. Onder het moto data sovereignty wil Europa naar een toekomst waarin de controle en het beheer van data niet langer in handen zijn van (een klein aantal) bedrijven, maar wel van degene die de data genereert. Dat kan zowel een persoon als een bedrijf zijn.”
Eens bewaarheid zal de Europese visie een belangrijke impact hebben op ons persoonlijk gegevensbeheer, op de innovatiepositie van ons bedrijfsleven en op de relatie die wij als consument hebben ten aanzien van deze bedrijven.
De beperkingen van ons huidig databeheer
Deze ideologische koersverandering vraagt echter ook een vernieuwde visie op de achterliggende data-infrastructuur en de daarbij behorende technologische ontwikkelingen. En hierin speelt het concept van dataspaces een sleutelrol. Cruciaal is dat gegevens bij een dataspace niet centraal maar bij de bron worden opgeslagen en alleen worden gedeeld wanneer dat nodig is.
Stefan Lefever: “Om goed te begrijpen waarom dataspaces noodzakelijk zijn, kan het helpen om eerst te kijken naar wat ze wel – en vooral ook niet – zijn. Met de reeds bestaande open data en data-uitwisselingsplatformen en technologie, krijg ik soms vanuit het veld het gevoel dat we er al zijn. Maar niets is minder waar.”
De laatste decennia werd, met name vanuit overheden, sterk ingezet op open data: het publiek toegankelijk maken van allerlei gegevens, bijvoorbeeld gerelateerd aan bevolking, mobiliteit, energie, luchtkwaliteit enzovoort. Recent is echter het besef ontstaan dat het simpelweg openstellen van deze data ontoereikend is. Zo is het niet altijd eenvoudig om de open data te vinden, laat staan hun kwaliteit te beoordelen of ze uit te lezen en te combineren met gegevensbronnen uit verschillende domeinen.
Bij door bedrijven gegenereerde data speelt dan nog een ander aspect, namelijk veiligheid en eigenaarschap. Zo zijn nutsbedrijven, telecomoperatoren etc. niet happig om hun data zomaar open te stellen of publiek te delen. Ze grijpen daarom terug naar ad-hoc-oplossingen om data te delen. Ze kiezen bijvoorbeeld voor het gecontroleerd uitwisselen van gegevens in een omgeving die opgezet is vanuit een wederzijds vertrouwen tussen het klein aantal partijen die er toegang toe krijgen. Er is inmiddels een groot aanbod aan dataplatformbedrijven die dergelijke diensten aanbieden op de Vlaamse en internationale markt.
Tanguy Coenen: “Ik zie ook een belangrijk onderscheid tussen high- en low-velocity data. Low velocity data zijn relatief statisch, zoals demografische gegevens van een bepaalde regio of dagelijkse gemiddeldes van neerslag of temperatuur. Deze zijn relatief eenvoudig beschikbaar te stellen en vormen dan ook een groot percentage van de beschikbare open data. High-velocity data zijn gegevens van sneller veranderende bronnen zoals persoonlijke data van je mobiele telefoon of slimme speaker of van allerlei andere sensoren in het internet der dingen (IoT). Dit type data wordt minder snel opengesteld omdat ze vaak privacygevoelig zijn, maar ook omdat het meer eist van de hard- en software en de middelen of wil er niet altijd zijn om daarin te investeren.”
Nochtans erkent ook Europa ondertussen het belang van dergelijke data en de combinatie ervan met reeds beschikbare open data om bedrijven toe te laten om reële business cases te ontwikkelen. Stefan Lefever: “En op dat moment schiet ad-hoc data delen dus ook tekort, omdat het simpelweg niet schaalbaar is. Het is onmogelijk voor de veelheid aan potentiële innovaties en business cases telkens een op maat gemaakte vertrouwde omgeving op te zetten en te beheren.”
Waarom dataspaces het antwoord zijn
En net daarom ontwikkelen data-wetenschappers zogenaamde dataspaces: om de veiligheid en eenvoud van ad-hoc data sharing te vertalen naar een breder inzetbare context. Piet Demeester: “Je kan misschien nog het best de parallel trekken met het ontstaan van het internet. In die periode konden computers al wel met elkaar communiceren, maar vereiste dat telkens een oplossing op maat. Om het eenvoudiger en schaalbaar te maken, is een combinatie van drie standaarden belangrijk geweest die samen het internet vormen; namelijk een protocol (http) om computers aan elkaar te koppelen, een taal (html) om ze met elkaar te laten praten en een lokalisatiecode (URL) om ze elkaar te laten vinden. Dankzij het breed omarmen van deze standaarden is het internet uitgegroeid tot wat het nu is.”
Dataspaces stellen een gelijkaardige toekomst voorop als het gaat om databeheer. Waarbij de nodige standaarden, protocollen en andere afspraken ervoor zullen zorgen dat data lokaal gegenereerd en beheerd kunnen worden en er toch een eenvoudige en veilige manier is om ze gecontroleerd met elkaar uit te wisselen. Een voorbeeld van het gebruik van het principe van dataspaces is het wereldwijde initiatief Solid; met aan het hoofd Sir Tim Berners-Lee, de uitvinder van het world wide web. Solid is een reeks van specificaties en afspraken die ervoor zorgen dat je je persoonlijke data kan bewaren en beheren in een zogenaamde data pod. Je bent eigenaar en hebt volledige controle over deze pod. Vergelijk het met een kluis: je kan zelf beslissen wie je toegang geeft tot welke data, met welk doel deze data mogen gebruikt worden en voor hoe lang. En omdat het een standaard is, hoef je je data niet te dupliceren of om te zetten, maar kan iedereen je vragen om vanuit deze ene bron informatie te ontvangen.
Stefan Lefever: “Iedereen zal intuïtief aanvoelen dat dit een drastische verandering is tegenover hoe we nu met persoonlijke data omgaan en hoe die verspreid zit bij ontelbare bedrijven en instanties. En dat bijvoorbeeld bepaalde administratie sterk vereenvoudigd kan worden omdat je slechts op één plek aanpassingen moet verwerken. Minstens even belangrijk is echter dat het onze relatie met bijvoorbeeld het bedrijfsleven ook fundamenteel wijzigt. Als bedrijven straks nog toegang willen tot gegevens uit jouw Solid-datakluis, zullen ze voldoende meerwaarde moeten bieden aan jou als gebruiker of consument. Je zal dan sneller geneigd zijn om je data (onder consent) te laten gebruiken door een bedrijf dat toegevoegde waarde aan jou biedt en niet (alleen) financiële winst voor zichzelf genereert.”
Imec als voortrekker
Solid is één specifiek voorbeeld van het toepassen van dataspaces, met name voor je persoonlijke data. Het concept van dataspaces is in ontwikkeling voor zowat elke context waar data ontstaan en beheerd of uitgewisseld moet worden. Het landschap is dan ook divers en imec speelt er een actieve rol in. Zo is Ruben Verborgh, professor bij IDLab (een imec-onderzoeksgroep aan de Universiteit Gent) als rechterhand van Sir Tim Berners-Lee vanop de eerste rij betrokken bij de ontwikkeling van Solid. Om het Solid-onderzoek op te schalen, werd begin dit jaar SolidLab Vlaanderen opgericht. Imec-onderzoekers aan verschillende Vlaamse universiteiten zullen zich de komende vier jaar toeleggen op technologisch, maatschappelijk en toegepast onderzoek rond de ontwikkeling van gedecentraliseerde datakluizen. Om de opgebouwde kennis op een optimale manier te laten doorstromen naar de industrie, worden collaboratieve onderzoeksprojecten opgezet met technologieproviders, datagebruikers en app-ontwikkelaars. Er wordt ook een Software Development Kit ontwikkeld die bedrijven toelaat om op een eenvoudige wijze data te lezen en te schrijven van en naar de datakluis.
Op Europees niveau is Gaia-X het meest in het oog springende samenwerkingsverband. Opgericht door enkele Franse en Duitse initiatiefnemers, verzamelt het inmiddels meer dan driehonderd leden uit overheid, onderzoek en bedrijfsleven rond de ontwikkeling van een oplossing voor de Europese ambitie van innovatie dankzij data-onafhankelijkheid. De insteek is breed en zet zowel in op hardware en software als op aspecten zoals de noodzakelijke juridische en economische omkadering. In de veelheid aan ontwikkelingen spelen dataspaces een centrale rol. Zo is een van de vooropgestelde scenario’s dat je dankzij Gaia-X een omgeving zal krijgen waarin je aanbieders van data objectief met elkaar kan vergelijken.
Stefan Lefever: “Stel dat je behoefte hebt aan data over luchtkwaliteit, dan zal je niet langer op verschillende plekken moeten gaan zoeken en individuele onderhandelingen aangaan met elke aanbieder, maar kan je in een door Gaia-X opgezette omgeving toegang krijgen tot de data, vanuit een uniform ecosysteem dat gestoeld is op het gebruik van standaarden en gezamenlijke richtlijnen. En dat gaat breder dan data alleen, maar richt zich ook op aspecten zoals cloud infrastructuur, compute power enzovoort. Je krijgt hierdoor ook een eerlijker speelveld, omdat in dergelijke omgeving de grote en kleine aanbieders gelijkwaardig naast elkaar komen te staan.”
Als een van de leden van Gaia-X is imec actief betrokken bij de technologische ontwikkelingen. Zo verkent imec de standaarden en technologiebouwblokken binnen zijn digital twin projecten, en draagt het ook actief bij aan het definiëren van de standaarden die hiervoor in aanmerking komen. Gaia-X publiceerde in oktober 2021 nog een white paper met belangrijke bijdragen van verscheidene imec-onderzoekers. Imec neemt ook een centrale rol in om de concepten uit Gaia-X te vertalen naar een lokale Vlaamse implementatiecontext, in gebieden als slimme steden, mobiliteit, logistiek en gezondheidszorg.
Tanguy Coenen: “Behalve Solid en Gaia-X zijn er natuurlijk nog een veelheid aan andere initiatieven die elk hun bijdrage leveren aan de toekomst van ons databeheer. Imec probeert bij zoveel mogelijk van hen aangehaakt te blijven om de relevante ontwikkelingen te kunnen doorvertalen naar de Vlaamse stakeholders. Zo is er FiWARE, een open source project waar Europa het voorbije decennium enorm in heeft geïnvesteerd en die gestandaardiseerde modules voor data-uitwisseling ter beschikking stelt. En er zijn organisaties als het Europees Interoperability Framework (EIF), Connecting Europe Facility (CEF), de International Data Spaces Association (IDSA), de Big Data Value Association (BDVA), de Data Sharing Coalition en MyDataGlobal die elk hun positie en specifiek belang hebben.”
Stefan Lefever: “In het relanceplan ‘Vlaamse Veerkracht’ van de Vlaamse Regering is digitale transformatie één van de zeven speerpunten. Hierin is de ambitie opgenomen om leidinggevend te zijn in Europa op vlak van databeheer voor slimme steden en IoT. Vlaanderen heeft daarbij het voordeel dat het als regio klein genoeg is om snel te kunnen schakelen en toch ook groot genoeg om relevant te zijn. Zo legden imec en zijn partners in het City of Things-programma al een solide basis voor een heel aantal verdere ontwikkelingen die gericht zijn op de leefbaarheid van onze steden en bebouwde omgeving.”
Tanguy Coenen: “Een belangrijke realisatie is bijvoorbeeld VLOCA, de Vlaamse Open City Architectuur die imec samen met VITO opzet in opdracht van het Agentschap Binnenlands Bestuur. Dit project streeft naar een gemeenschappelijk (open) data-beleid en een infrastructuur waarmee data tussen verschillende bestuursniveaus en steden kunnen uitgewisseld worden. Een van de doelen is om op korte termijn een open-architectuurcharter uit te brengen waarmee Vlaanderen een volgende stap zet in de ontwikkeling tot data-gedreven topregio. Eerder investeerde de Vlaamse overheid al in OSLO: open standaarden voor linkende organisaties. En er ligt een plan op tafel om specifiek in te zetten op de ontwikkeling van een Vlaamse Sensor Dataspace. Die moet zorgen voor de ontsluiting van gestandaardiseerde low- en high-velocity data, zodat bedrijven op dat vlak worden ontzorgd en sneller kunnen focussen op de ontwikkeling van relevante toepassingen op basis van deze data.. Een belangrijke rol is ook weggelegd voor het Vlaamse datanutsbedrijf. Deze organisatie in oprichting zal een cruciale centrale rol spelen in het opzetten en beheren van de onderliggende data-infrastructuur. Vergelijk het met de netbeheerders voor telecomapplicaties en energievoorzieningen.”
Ondanks de grote ambities, de veelheid aan initiatieven en technologieën en de complexiteit zal de nieuwe Europese data-economie er sneller zijn dan we misschien denken. Stefan Lefever: “Gaia-X heeft een gedetailleerd vijfjarenplan en hierin stelt het voorop dat een Europese data-economie, ondersteund door dataspaces, tegen 2025 werkelijkheid zal zijn.”
Meer weten?
- Recente Gaia-X white paper met imec-onderzoekers als co-auteurs: Gaia-X and European Smart Cities and Communities white paper
- Website SOLID: Home · Solid (solidproject.org)
- Website Gaia-X: Gaia-X: A Federated Secure Data Infrastructure
- Website VLOCA: VLOCA | Vlaamse Open City Architectuur (vlaanderen.be)
- Aankondiging Vlaams datanutsbedrijf: Vlaamse regering keurt oprichting van Vlaams Datanutsbedrijf goed | Agoria
- Aankondiging Vlaamse Sensor Dataspace: Monitoring Relanceplan Vlaamse Veerkracht - April 2021 (vlaanderen.be)
- Aankondiging SolidLab Vlaanderen: Imec start interuniversitair labo op om te onderzoeken hoe Vlaamse bedrijven competitief kunnen worden in de data-economie
- Inzichtelijke blogs over dataspaces: Design Principles for Data Spaces| Position Paper (design-principles-for-data-spaces.org) en The Magic of Data Spaces Now | International Data Spaces
Stefan Lefever is technisch directeur bij imec voor digitale transformatie. Hij is gefascineerd door technologie die geavanceerde hardware- en softwareoplossingen combineert om complexe functionaliteiten te realiseren, in het bijzonder wanneer deze bijdragen tot een betere leefomgeving. Stefan heeft een master in de industriële wetenschappen (elektronica) en de ingenieurswetenschappen (computerwetenschappen). Hij heeft een carrière van 20 jaar achter de rug in de telecommunicatiesector. Bij imec heeft Stefan gewerkt rond open IoT en data management/governance architectuur om lokale en regionale overheden te ondersteunen om beter de digitalisatie- en dataficatie-uitdagingen in een steeds sneller veranderende stedelijke omgeving voor te bereiden. Belangrijke onderzoeksdomeinen zijn daarbij dataspaces en digital twins voor overheden om een datagedreven beleid te faciliteren.
Piet Demeester is professor aan de Faculteit Ingenieurswetenschappen en Architectuur van de Universiteit Gent, IEEE Fellow en houder van een ERC Advanced Grant en Methusalem Grant. Hij leidt IDLab, een imec-onderzoeksgroep aan de Universiteit Gent.
Na het afronden van een doctoraat over metaal-organische dampfase-epitaxie voor fotonische apparaten in 1988, richtte hij daarrond een onderzoeksgroep op op die werkte aan verschillende materiaalsystemen (AlGaAs, InGaAsP, GaN). Dit onderzoek werd in 2002 met succes overgedragen aan imec. In 1992 startte Piet Demeester zijn onderzoek naar optische communicatienetwerken. In de loop der jaren breidde IDLab zijn activiteiten uit (nu ongeveer 300 onderzoeksmedewerkers). Op het gebied van dataspaces werkt het 'Knowledge on Web Scale'-team van IDLab nauw samen met Tim Berners-Lee (MIT en University of Oxford) aan de Solid-architectuur en onderliggende technologieën. Piet Demeester staat sinds 2022 aan het hoofd van SolidLab Vlaanderen.
Tanguy Coenen werkt als expert digitale transformatiestrategie bij imec. Hij behaalde een doctoraat in bedrijfswetenschappen aan de Solvay Management School van de Vrije Universiteit Brussel. Hij heeft meer dan 20 jaar ervaring in het werken in Innovation Management-projecten, het managen van multidisciplinaire en multi-stakeholder software- en hardware-ontwikkelingsprojecten. Tanguy heeft een brede achtergrond in onderzoek naar informatiesystemen en is betrokken geweest bij zowel theoretisch onderzoek als praktische implementatie. Onderwerpen waar hij in de loop der jaren aan heeft gewerkt zijn onder meer sociale software, IoT, Digital Twins en Data Spaces.
Gepubliceerd op:
3 januari 2022