Wat zijn data spaces?
Data spaces zijn de nieuwste visie op hoe datatransacties kunnen gebeuren op een manier die kwalitatief, betrouwbaar en veilig is, en bovendien schaalbaar, economisch rendabel, maatschappelijk relevant en juridisch rechtvaardig.
Onze maatschappij en economie bouwen in toenemende mate op kennis en inkomsten die volgen uit het genereren, analyseren en delen van gigantische en diverse hoeveelheden data – de ene al waardevoller of gevoeliger dan de andere.
De grote droom van Europa is om met behulp van kennis uit data een beter en duurzamer beleid te kunnen voeren. Ook wil de EU op het vlak van datagedreven toepassingen een eerlijker speelveld creëren door de toegang tot data te democratiseren en een nieuwe balans te creëren in de bijhorende kosten en baten. Dit moet kleinere en opkomende databedrijven dezelfde kansen geven als gevestigde spelers om bestaande en nieuwe markten aan te boren – en op die manier ook meer innovatieve toepassingen en businessmodellen laten ontstaan.
Na een decennium waarin beleidsmakers om die redenen publieke open data hebben gepromoot, is duidelijk geworden dat – om tot impactvolle toepassingen te komen – er een noodzaak is om deze te combineren met private data. Dit heeft tot gevolg dat de nodige technische, juridische en economische afspraken moeten toelaten om zowel open als private data decentraal te beheren en toch een vlotte uitwisseling te verzekeren tussen de databron(nen) en de eindgebruiker(s). Denk aan het combineren van (open) data over luchtkwaliteit met (private) data van je navigatiesysteem of fitnessapp. Data spaces faciliteren exact dát.
Waarom data spaces de oplossing zijn
Essentieel voor het potentieel en onderscheidend vermogen van data spaces is het decentrale karakter. Bij datafederatie tussen een meer beperkte en statische groep bedrijven of organisaties worden de relevante gegevens vaak gedupliceerd en gesynchroniseerd op een centrale plek, waarvoor de toegangsrechten van de betrokken partijen dan geregeld zijn. Dit is niet haalbaar en ook niet wenselijk als je gaat opschalen. Zo zou onnodig veel extra dataopslag nodig zijn, riskeer je datamonopolies (zoals je nu al hebt op het internet) en kunnen deze centrale bronnen een grootschalig doelwit vormen voor hackers. Data spaces vermijden al deze nadelen.
In essentie zijn data spaces een omgeving waarop leveranciers en gebruikers van data onafhankelijk van elkaar kunnen inpluggen en met elkaar gegevens uitwisselen. Daarbij het niet noodzakelijk is dat ze (telkens) rechtstreeks met elkaar in interactie gaan. Dergelijke flexibiliteit en schaalbaarheid laat op termijn toe om een scala aan nieuwe impactvolle toepassingen te faciliteren die gebaseerd zijn op databronnen vanuit uiteenlopende sectoren. En om die redenen gebeuren momenteel heel wat inspanningen op technisch, juridisch en economisch vlak om data spaces te ontwikkelen en uit te rollen.
Lees meer in het data spaces dossier
Randvoorwaarden voor data spaces
Tot op zekere hoogte is het delen van gegevens via data spaces vergelijkbaar met het delen van informatie over het internet. Daarbij worden websites over de hele wereld gehost en zijn ze dankzij de nodige standaarden en afspraken toch eenvoudig toegankelijk. Idem voor het delen van documenten via je eigen opslag, waarbij je dankzij de nodige standaarden en toegangsrechten kan beslissen wie er wel en niet bij kan.
Meer nog dan in de context van informatie en activiteiten op het internet, is vertrouwen een essentieel begrip voor data spaces. Zoals niet zomaar elke app toegang kan krijgen tot je bankgegevens, moet er een universeel systeem komen om in de context van data spaces licenties uit te geven aan betrouwbare partners. En om deze ook weer afdwingbaar te kunnen intrekken bij eventueel misbruik.
Net zoals informatie op het internet enkel vindbaar is omdat er standaarden bestaan zoals HTML en afspraken zoals domeinnamen, hebben ook data spaces behoefte aan breed gedragen standaarden en afspraken. Die beginnen bij het kwalitatief organiseren, filteren en labelen van data, zodat geïnteresseerden er hun weg in kunnen vinden. Vervolgens zijn afspraken noodzakelijk die de vindbaarheid van data garanderen en hun toegankelijkheid regelen in functie van de eindgebruiker en het doel dat die ermee heeft.
Dit alles moet gepaard gaan met de nodige economische en juridische afspraken die bepalen wie eigenaar is van de data en hoe die kan bepalen aan wie ze gratis of betalend ter beschikking worden gesteld . Zodra die antwoorden duidelijker worden, zal de technische infrastructuur ook daar op voorzien moeten zijn. Doorheen dit alles speelt het vraagstuk wie hier welke rol in moet nemen: de overheid vanuit haar maatschappelijke opdracht versus het bedrijfsleven vanuit de economische vooruitzichten die data spaces openen.
Om aan deze en andere vragen een antwoord te bieden, zijn zowel in Vlaanderen als internationaal heel wat initiatieven hard aan het werk. Vaak vanuit duidelijk gedefinieerde use cases om focus en relevantie te garanderen.
Het Vlaamse en internationale speelveld rond data spaces
Een van de belangrijkste dataspace-initiatieven op Europees vlak is Gaia-X. Dit consortium uit industrie, beleid en onderzoek stelt zich als doel om tegen 2025 data spaces op substantiële schaal operationeel te hebben in Europa. Het onderhoudt nauwe banden met de International Data Spaces Association (IDSA), een wereldwijde organisatie van meer dan honderd bedrijven die onder andere verantwoordelijk is voor het bedenken en uitrollen van de International Data Spaces (IDS)-referentie-architectuur en andere afspraken rond vertrouwen en certificering. Sinds eind 2022 is er – met financiële steun van de Europese Commissie – ook een Data Spaces Support Center (DSSC). Dit neemt een coördinerende rol op om de behoeftes vanuit de verschillende sectoren in kaart te brengen en bestaande initiatieven op elkaar af te stemmen. De organisatie draagt – mede dankzij een door hen ontwikkelde ‘starterskit’ – ook bij aan de kennisdeling over data spaces en heeft ook een sleutelrol in de ontwikkeling van het Europees beleid en regelgeving.
Op Vlaams niveau is een belangrijke rol weggelegd voor het recent opgerichte Datanutsbedrijf. Deze organisatie heeft als doel om de onderliggende basisinfrastructuur uit te rollen en te beheren. Vergelijk het met de aanleg en onderhoud van (snel)wegen voor personen- en vrachtvervoer. Daarnaast is er de Vlaamse Smart Data Space (VSDS): een door Vlaanderen opgezet initiatief om tegen 2023 alle bouwstenen te creëren die toelaten om Vlaamse (open) basisdata en (publieke of private) data op een gestandaardiseerde manier en volgens de principes van data spaces te publiceren en te gebruiken. Vervolgens spelen heel wat Vlaamse actoren diverse rollen in lokale en internationale initiatieven. Zo is KU Leuven actief betrokken bij het DSSC en hebben ook organisaties als Agoria en Digitaal Vlaanderen programma’s en activiteiten gericht op data spaces. Imec heeft, behalve technische inbreng, ook een verbindende rol om als neutrale partij kennis te ontwikkelen en te ontsluiten op Vlaams en internationaal niveau. Om data spaces succesvol te maken, is namelijk een goede orkestratie nodig tussen de verschillende aspecten en verschillende geografische niveaus.
De grote uitdaging van data spaces: kritische massa als ‘de kip en het ei’
Maar meer nog dan deze complexe onderlinge relaties, zit de grote uitdaging van data spaces waarschijnlijk in de noodzaak voor grootschalige uitrol voordat het potentieel ervan ten volle zichtbaar is. En dat is dus een beetje zoals de kip en het ei: waarbij veel bedrijven en organisaties zich pas zullen aansluiten als de meerwaarde onmiddellijk aantoonbaar is, maar het pas aantoonbaar wordt zodra er voldoende zijn aangesloten.
Daarom vertrekken veel initiatieven van bestaande usecases in specifieke domeinen zoals gezondheidszorg, milieu of mobiliteit. Om vanuit concrete probleemstellingen data spaces als oplossing uit te rollen met behulp van de belangrijkste spelers in deze domeinen. Zodra op die manier de basis gelegd is en de meerwaarde aangetoond, kan de kritische massa per domein uitgebouwd worden en kunnen verschillende domeinen ook onderling synergieën creëren. Het doel is namelijk dat je straks de data over lucht- en waterkwaliteit kan combineren met gegevens over bepaalde aandoeningen in het kader van een onderzoek naar volksgezondheid. En niet dat er een veelheid aan sectorale data spaces ontstaan die als gescheiden eilanden onbereikbaar zijn voor elkaar.
Lees meer in het data spaces dossier
Meer weten?
Als onderzoeksinstituut wil imec de kennis die we hebben opgebouwd zoveel mogelijk delen met anderen - inclusief onze expertise over data spaces.
Heb je een vraag over data spaces? Wil je samen met een neutrale partij testen of een data space een meerwaarde kan bieden voor jouw use case/project? Neem dan contact op met bart.matthys@imec.be.
Gepubliceerd op:
22 februari 2023