Als we onze digitale erfenis niet verloren willen zien gaan, hebben we een nieuw opslagmedium nodig. De natuur biedt inspiratie om gegevens compacter, duurzamer, goedkoper en voor eeuwig op te slaan.
Van financiële transacties en sportprestaties tot filmpjes van katten: de mensheid genereert in een razend tempo nieuwe data. Een deel van die data slaan we op in de cloud en vragen we daarna nooit meer op. Dat betekent niet dat we maar beter alles weggooien. Denk bijvoorbeeld aan de gigantische datasets die astronomen of deeltjesfysici verzamelen: we kunnen vandaag niet weten op basis van welke data we morgen nieuwe ontdekkingen zullen doen. Ook in de gezondheidszorg of in de ontwikkeling van zelfrijdende auto’s worden meer data bijgehouden die van vitaal belang kunnen zijn.
Naar verwachting zullen we in 2022 met z’n allen 97 zettabyte (of gemiddeld 33 gigabyte per persoon per dag) aan data gegenereerd hebben. In 2025 kan dat al 181 zettabyte worden, meer dan alle data in het vorige decennium opgeteld. Op termijn zal traditionele opslagapparatuur, zoals magneetband, die duizelingwekkende groei niet meer kunnen volgen. De hele wereld volbouwen met energieverslindende datacenters is geen duurzame oplossing.
De Amerikaanse fysicus Richard Feynman lanceerde al in 1959 een interessanter idee: waarom laten we ons niet inspireren door de biologie om informatie op te slaan? In DNA wordt informatie miljoenen keren dichter opgeslagen dan in de digitale opslagapparatuur waarover we vandaag beschikken. Zo zouden we zonder energiekosten tien films kunnen opbergen in een volume dat kleiner is dan een korrel zout.
Om van DNA een kostenefficiënt opslagmedium te maken moet je data goedkoop kunnen wegschrijven en uitlezen. In het uitlezen staan we al ontzettend ver. De kosten van DNA-sequencing (het bepalen van de volgorde van baseparen - de ‘letters’ A, C, G en T) zijn de voorbije 25 jaar exponentieel gedaald. Dat is te danken aan de kruisbestuiving tussen chiptechnologie en biotechnologie. Voor het wegschrijven van DNA is die revolutie nog maar net begonnen. Binaire code wordt omgezet in het genetische vierletteralfabet en geprint in synthetische DNA-strengen. Door processen op een chip uit te voeren kan de DNA-synthese veel nauwkeuriger uitgevoerd worden en kan de productie opgeschaald worden. Voor 1 dollar hoopt men 1 gigabyte te kunnen wegschrijven in 2024 en 1 terabyte in 2030. Om DNA-opslag snel realiteit te maken werd de DNA Storage Alliance in het leven geroepen. Imec bundelt daarin de krachten met onder meer de DNA-synthesespecialist Twist BioScience, met sequencingspecialist Illumina en bedrijven zoals Microsoft en Western Digital.
DNA zal traditionele opslagmedia niet meteen vervangen, maar wordt op termijn het medium bij uitstek voor langdurige archivering. We kunnen er data in opslaan die we nooit willen zien verdwijnen. Bedenk dat we vandaag DNA kunnen ontcijferen van mammoeten die een miljoen jaar onder het ijs gelegen hebben. Heb je thuis nog ergens een oude ponskaart, diskette of cd-rom liggen? De kans wordt elk jaar kleiner dat ze nog leesbaar zijn. We zullen echter wel altijd over moleculaire machines beschikken om DNA uit te lezen. De natuur biedt ons een ruime toolbox om DNA te manipuleren. Dat doet me hopen dat het uiteindelijk zelfs mogelijk wordt om informatie in DNA op volledig moleculaire wijze te verwerken zonder dat er nog klassieke computers aan te pas komen.
Deze column verscheen eerst in De Tijd
Peter Peumans behaalde een doctoraat als elektrisch ingenieur aan Princeton University, en een bachelor- en masterdiploma aan de Katholieke Universiteit Leuven. Voor hij bij imec in dienst trad, was Peter Peumans professor Electrical Engineering aan de Stanford University. Hij ontving een NSF CAREER award en een Belgian-American Educational Foundation honorary fellowship. Hij is momenteel verantwoordelijk voor imec's strategie in gezondheid.
Gepubliceerd op:
1 november 2022