Dissecting data workflows using SHACL
Het DiSHACLed-project heeft als doel de efficiëntie van data service providers binnen het Europese data-ecosysteem te verbeteren. DiSHACLed ontwikkelt een kader, standaarden en tools om de grotendeels handmatige processen voor het ontdekken en integreren van externe datasets binnen een specifieke zakelijke of onderzoekscontext te vervangen door semi-geautomatiseerde methodes.
De sleutel tot semantische interoperabiliteit ligt in het gebruik van gestandaardiseerde datamodellen bij het registreren van data. Om datasets beter vindbaar te maken, kunnen ze beschreven worden aan de hand van hun ‘shape’ – de gebruikte datastructuur – via de Shapes Constraint Language (SHACL).
Tot voor kort was het niet mogelijk om datasets te zoeken die volledig of gedeeltelijk voldoen aan een bepaalde minimale datastructuur van elementen en relaties. Door de snelgroeiende hoeveelheid open data vormt dit een grote hindernis om op een efficiënte, manier geschikte datasets te vinden om een bestaande dataset binnen een specifieke bedrijfscontext te verrijken.
Vlaanderen is met initiatieven zoals OSLO (Open Standaarden voor het Linken van Organisaties) al een leider op het vlak van semantische interoperabiliteit en data governance. Er werden al meer dan 134 semantische standaarden ontwikkeld die aansluiten bij Europese vocabularia. Dankzij deze inspanningen positioneren Vlaanderen en zijn Data Sharing Service Providers (DSSP’s) zich als pioniers in het gebruik van SHACL. Op basis van deze solide basis willen ze hun expertise nu ook economisch valoriseren, en dat in lijn met de doelstellingen van de Europese Data Governance Act (DGA).
Het DiSHACLed-project wil het exploreren van data, de interoperabiliteit van tools en de geautomatiseerde generatie van formulieren binnen het Europese data-ecosysteem verbeteren. In overeenstemming met de DGA versterkt het project de Vlaamse DSSP’s door SHACL in te zetten voor schaalbare en efficiënte oplossingen voor data governance. Door samenwerking tussen industrie en onderzoeksinstellingen levert DiSHACLed een bijdrage aan het bredere Europese ecosysteem voor datatechnologie en helpt het bij het vormgeven van de volgende generatie data governance.
DiSHACLed werkt aan een oplossing voor drie centrale doelstellingen:
De resultaten van DiSHACLed zullen breed inzetbaar zijn in uiteenlopende domeinen, waaronder:
Hoewel het project zich richt op technologische vernieuwing, wordt er expliciet rekening gehouden met regelgeving rond data governance. Door data-interoperabiliteit en automatisering te stimuleren, wil DiSHACLed de manuele werklast verlagen, de toegankelijkheid van data vergroten en het vertrouwen in het delen van data versterken.
“DiSHACLed wil niet alleen manuele processen vereenvoudigen, maar ook bijdragen aan het Europese datatech-ecosysteem. Het doet dat door efficiënte en schaalbare oplossingen te ontwikkelen met een brede impact op dienstenleveranciers van gegevens, en op bedrijven en burgers.”
DiSHACLed ontwikkelt oplossingen op het vlak van de ontdekking van datasets, de interoperabiliteit van tools en de automatisatie van formulieren, met als doel een nieuwe standaard te creeëren voor efficiënte dataworkflows.
DiSHACLed is een imec.icon onderzoeksproject gesteund door imec en het Vlaams Agentschap Innoveren & Ondernemen (VLAIO).
Het project is gestart op 01.03.2025 en loopt tot 30.02.2027.