La Mémoire dans la Peau

  Et si la solution à l’archivage des données était dans notre corps depuis toujours ? L’ADN comme mode de stockage, l’avenir du Big Data.

Quand on le sort de sa pochette de 30 centimètres, le disque glisse du feuillet qui le protège. La platine est en place. Une légère pression sur le bras articulé dépose le diamant sur le vinyle. Il se met à tourner. Et ça crisse. Alors il y a ceux pour qui ce grain est une signature, un ancêtre que l’on aime retrouver. Il y a ceux qui y voient la marque du temps, l’obsolescence d’un médium. Comme le Compact Disc rayé, la cassette vidéo trop regardée, ou le disque dur qui s’arrête brutalement. Écran noir, tragédie moderne.

Toujours plus de données. L’ensemble du monde se numérise et s’archive dans de géants data centers. Stocker la mémoire de l’humanité prend de place. Des premiers serveurs d’IBM aux cartes mini-SD d’aujourd’hui, il y a un gouffre. En soixante ans, les technologies de stockage se sont miniaturisées. Jusqu’à ce que les chercheurs décident d’aller plus loin. La solution se trouvait sous leur peau. Pas de science-fiction mais une réalité qui se précise. L’ADN se mue en clef USB.

La première image de l'ADN réalisée par Rosalind Franklin en 1951

La première image de l'ADN réalisée par Rosalind Franklin en 1951

Des chercheurs et des bières

À chaque découverte scientifique, sa légende. Ici tout commence comme une blague. Ewan Birney et Nick Goldman se retrouvent dans un bar. Ça se passe à Hambourg en 2011, après une longue et fatigante journée de colloque. Les deux scientifiques travaillent pour le European Bionformatic Institute. Une des missions de ce centre de recherches britannique est de compiler et de croiser toutes les informations que le monde produit à propos de la génétique et de l’ADN. Une énorme banque de données scientifiques open-source. Entre dans la discussion une question fondamentale, celle du stockage. Comment assurer la durabilité de ces milliards de données ?

L’histoire continue. Ewan et Nick commandent une bière. La durée de vie d’un data center est de cinq à dix ans. Ensuite, les serveurs doivent être renouvelés. C’est un processus coûteux et énergivore. Plus il y a d’informations, plus c’est cher, plus ça prend de place. Un casse-tête sans fin. La deuxième bière arrive. Soudain tout s’éclaire. Et si la réponse était sous leurs yeux depuis le début ? Cette solution, l’ADN.

Mais au fait, c'est quoi l'ADN?

L’acide désoxyribonucléique est la molécule fondamentale du vivant, sa carte d’identité. Elle définit chacune de ses caractéristiques. Sa structure est une double hélice, composée de deux bras reliés par des nucléotides. Ce sont ces derniers qui contiennent l’information génétique.

Il y en a de quatre sortes : l’adénine, la thymine, la guanine et la cytosine. Le tout forme un code composé des lettres ACGT permettant de comprendre les données contenues dans les cellules. Avec un brin d'ADN, on peut découvrir la couleur des cheveux, celle des yeux et même l'origine ethnique de quelqu'un.

L’idée de Birney et Goldman est simple. Utiliser la capacité de stockage de l’ADN pour y placer d’autres données. De retour au laboratoire, ils commencent à réfléchir à un code. La clef de voûte de la technologie. Ils développent un moyen de traduire les informations binaires en une série d’ACGT. Il ne leur reste plus qu’à en prouver le fonctionnement.

Un enregistrement mp3 du I have a dream de Martin Luther King, la copie PDF de l’article de Watson et Crick décrivant la structure de l’ADN, l’ensemble des sonnets de Shakespeare et une photographie du laboratoire de l’EBI. 739 kb d’informations binaires à séquencer sous la forme de molécules d’ADN. La conversion effectuée, une entreprise américaine pris le relais. Spécialisée dans la fabrication d’ADN synthétique, elle renvoya au laboratoire britannique une minuscule particule de poussière. À sa relecture, tous les fichiers avaient survécu. C’était en 2013 et les deux chercheurs détenaient le record de la quantité d’informations stockée sous forme d’ADN.

Parce qu’ils ne voyageaient pas en solitaire, un laboratoire d’Harvard aux États-Unis les avait devancés d’une année, quelques centaines de kB en moins. En 2016, Microsoft et l’Université de Washington poussaient un peu plus loin les limites en séquençant 200Mb d’informations. Stocker de l’information dans de l’acide désoxyribonucléique devenait une réalité.

Francis Crick et James Dewey Watson

Francis Crick et James Dewey Watson

Un système viable ?

Les experts prédisent un accroissement du volume des données mondiales à hauteur de 175 Zettabytes d’ici à 2025. Un Zettabyte, c’est 1000 milliards de milliards de Bytes. Stocker durablement toutes ces informations va devenir un problème de société aussi important que le réchauffement climatique ou la crise des énergies fossiles. Avec de l’ADN, il suffirait d’un kilogramme pour tout archiver. Mais est-ce une solution viable ?

La taille d’une molécule d’ADN et sa capacité de stockage la rendent très attractive. Et ce n’est pas tout. Les technologies nécessaires à son développement se miniaturisent de plus en plus. Un séquenceur d’ADN tient aujourd’hui dans une poche. Plus d’espace de stockage, pour moins d’espace physique.

Un des arguments en faveur de l’acide désoxyribonucléique est sa durabilité. À température ambiante, il peut se conserver jusqu’à 2000 ans. Mais lorsqu’il est plongé dans le froid, à -18°C, l’ADN persiste 2 millions d’années sans détruire l’information qu’il contient. Mais comment prouver un tel constat ? En partie grâce aux mammouths laineux gelés dans la Toundra russe. Leur code génétique était encore lisible.

La difficulté principale de la technologie est la lecture des données de l’ADN, son séquençage. Quand on traduit les informations contenues dans une portion d’ADN, elle se détruit. La solution est d’en réaliser de multiples copies pour ne rien perdre. Et ça tombe bien parce qu’on peut répliquer des millions de fois une molécule grâce à un petit ordinateur. Stocker l’information dans l’ADN pourrait être un système viable pour conserver de très grandes quantités de données sur un temps très long. Le tout sans électricité.

Radiographies de séquences d'ADN

Radiographies de séquences d'ADN

Écouter l’ADN

D’abord, on l’entend. Lorsqu’une nouvelle technologie voit le jour, elle fait du bruit. Pas tout de suite du côté de l’industrie, plus souvent dans le coin des artistes. Un exemple nous vient du Japon, Etsuko Yakushimaru. En 2017, la chanteuse pop a remporté un prix à Bruxelles pour son projet « I’m Humanity ». Un morceau de 4 minutes 32 secondes séquencé sous forme d’ADN et introduit dans le génome d’une bactérie hôte. Contrairement à la séquence synthétique, ce procédé entraîne inévitablement l’évolution. Le vivant s’adapte. L’information contenue dans la bactérie se transforme pour créer une version inédite du morceau. Comme une transmission orale qui se mue de bouche en bouche.

L’autre domaine qui nécessite d’immenses bases de données est la médecine. Plus particulièrement la génétique. Parce que comprendre ce qu’il se passe dans le génome humain offre des potentialités énormes pour diagnostiquer rapidement des maladies génétiques ou des cancers héréditaires. En 2019, séquencer un génome, composer la carte d’identité d’un être vivant, prend environ 2 jours, coûte 1000 euros et pèse 500 Gb. Mais la Belgique ne possède pas les infrastructures nécessaires pour cela. Elle sous-traite à l’étranger. Nous sommes encore loin de l’utilisation de l’ADN dans le diagnostic quotidien des patients. Pourtant, les potentialités d’un tel système sont grandes.

Alors, stocker de l’information dans de l’ADN n’est pas encore pour tout de suite. C’est une solution à long terme, rentable pour de grandes bases de données. L’ensemble du savoir scientifique de l’humanité pourrait dormir paisiblement, congelé dans le relief de l’Arctique. Comme un héritage aux générations futures. Car tant qu’il y aura du vivant, il y aura de l’ADN et quelqu’un pour le lire.

Texte : Victor Huon
Photos : Reporters