Het is de inspanning waard
Gezien de complexiteit van onze maatschappij en economie en de snelheid en onzekerheid waarmee deze veranderen, kunnen publiek beleid en bedrijfsstrategie niet langer vanuit het buikgevoel onderbouwd worden. Op data gebaseerde beslissingen zijn dé manier om sneller en tot betere inzichten en beslissingen te komen. Zeker als het gaat om domeinoverschrijdende uitdagingen.
Overheden en bedrijven die hun beleid of business willen optimaliseren door data-gebaseerde kennis komen al snel terecht in een uitgebreid lexicon wat het niet altijd eenvoudig maakt om door de bomen het bos nog te zien. Ruwe data, fair data, smart data, data spaces, digital twins…: een recent door imec gepubliceerde whitepaper “Smart data operations for better data-informed decision taking” schept klaarheid in dit snel evoluerend en relevant domein.
De belangrijkste boodschappen die je aan het lezen ervan moet overhouden, zijn de betekenis van - en de noodzaak aan - data die dermate matuur en bewerkt zijn dat ze onmiddellijk inzetbaar zijn voor bepaalde uitdagingen en toepassingen. Plus: wat daarvoor onder de motorkap nodig is aan smart-data processen en technieken. Vanuit deze inzichten nodigen de auteurs je uit om deel te nemen aan de verschillende initiatieven in het veld. VLOCA, VSDS, Gaia-X, IDSA... zijn allemaal open programma’s die aan bod komen in de white paper en waar je zowel eerder passief als heel actief op kan aanhaken: gaande van informatie absorberen en vragen stellen tot lid worden, deelnemen aan sessies, bijdragen op een kennishub enz.
De volledige Engelstalige whitepaper kan je hier downloaden.
Ruwe, fair en smart data
Om wegwijs te geraken in het data-vocabularium, kan je de vergelijking maken met foto’s en het delen ervan op sociale media. Zolang de foto’s op je telefoon of laptop staan, inclusief alle dubbele en mislukte beelden, kan je dat beschouwen als ruwe data. Zodra je een selectie maakt, op sociale media deelt en er voldoende meta-data aan toevoegt, kom je in de buurt van de principes van ‘fair data’. Waarbij FAIR staat voor Findability, Accessibility, Interoperability and Reuse en wil zeggen dat ze vindbaar, toegankelijk, uitwisselbaar en herbruikbaar zijn. Smart data gaat nog een stap verder en moet toelaten om er kennis uit te halen voor een of meerdere specifieke toepassingen.
Voor de in de whitepaper geselecteerde use case van overstromingsdetectie zou dat bijvoorbeeld willen zeggen dat je wil weten hoe hoog het waterpeil is van een rivier op een foto of de verhouding natuur ten opzichte van door mensen gebouwde constructies. Het is misschien een wat kunstmatig voorbeeld, maar geeft een eerste inzicht in de hoge eisen waaraan gegevens moeten voldoen die het label ‘smart data’ willen dragen.
In zijn volledigheid moeten smart data namelijk aan volgende criteria voldoen:
- Betrouwbaar: op vlak van kwaliteit, consistentie, herkomst…
- Contextueel: tijd, plaats en omstandigheden waarin de data zijn gegenereerd.
- Relevant: voorzien van filters of meta-data die toelaten om er toepassingsgerichte kennis uit te halen.
- Cognitief: resultaat van patroonherkenning door algoritmes die beelden of menselijke taal kunnen analyseren.
- Voorspellend: voorzien van voldoende meta-data en context zodat oorzaak-gevolg relaties inzichtelijk zijn en voorspellingen toelaten.
- Consumeerbaar: toegang en presentatie zodanig geregeld dat zowel computers als mensen er eenvoudig wijs uit geraken.
Het vraagt dan ook een substantiële inspanning om ruwe of fair data naar dit niveau op te waarderen.
De volledige Engelstalige whitepaper kan je hier downloaden.
Technische infrastructuur en het speelveld van afspraken en organisaties
Toch is die investering noodzakelijk en rendabel zodra je de beschikbare smart data kan inzetten. Daarbij kom je dan al snel in aanraking met de nodige technische infrastructuur, net zoals een reeks aan technische, juridische en zakelijke afspraken en de bijhorende spelers die zich over een of meer van deze aspecten buigen. Zo zijn er data spaces en digital twins als technische omgevingen die toelaten om data vanuit verschillende bronnen met elkaar te combineren en/of er simulaties en voorspellingen op los te laten.
Daarbij is het hele speelveld aan standaarden, wetgevingen en afspraken nog volop in ontwikkeling. En komen er ook geregeld belangrijke spelers bij op het lokale en internationale toneel om dit alles in goede banen te leiden en op elkaar af te stemmen. Omdat deze dynamiek en complexiteit intimiderend en demotiverend kunnen overkomen voor wie met smart data of data-gedreven beslissingen aan de slag wil gaan, geeft de whitepaper inzicht in termen zoals data spaces, hun relatie tot digital twins en ook een overzicht van enkele belangrijke aspecten en organisaties in dit speelveld.
De volledige Engelstalige whitepaper kan je hier downloaden.
Meer weten?
Als onderzoeksinstituut wil imec de kennis die we hebben opgebouwd zoveel mogelijk delen met anderen - inclusief onze expertise over data spaces.
Hebt je een vraag over data spaces? Wil je samen met een neutrale partij testen of een data space een meerwaarde kan bieden voor jouw use case/project? Neem dan contact op met bart.matthys@imec.be.
Gepubliceerd op:
22 februari 2023