Vous travaillez sur le stockage d’information sur de l’ADN de synthèse, en quoi cette technologie répond-elle à des problématiques environnementales ?

Stéphane Lemaire : Dans notre époque de transformation numérique de la société, nous avons besoin de stocker de plus en plus de données. Notamment car ces données sont le carburant de l’Intelligence Artificielle et que sans données, il n’y a pas d’apprentissage, et donc, il n’y a pas d’Intelligence Artificielle. Actuellement, la quantité de données stockées dans le monde est estimée à 45 ZettaOctet. D’ici 2025, on prévoit qu’elle arrivera à 75 ZettaOctet. L’explosion des besoins de stockage est vertigineuse. Or, les moyens technologiques de stockage actuels posent un certain nombre de problèmes. Tout d’abord, l’obsolescence, car il faut remplacer les serveurs tous les 5 à 7 ans, mais également le volume : aujourd’hui, les data centers occupent presque 2 fois la surface de Paris. Et c’est en augmentation constante. Tout cela à un coût énergétique et environnemental fort. Les data centers consomment 2% de la consommation électrique mondiale et ont une empreinte carbone déjà supérieure à l’aviation civile. Cette empreinte écologique est proportionnelle à la quantité de données stockées. Si le stockage augmente par 5, l’impact environnemental augmentera de même. Les technologies de stockage progressent mais pas aussi vite que la génération de données. En 2025, on devra stocker 5 fois plus de données qu’aujourd’hui. Il faut trouver une solution car la transformation numérique de nos sociétés ne pourra pas se faire sans une vraie rupture technologique concernant le stockage des données. 

Vous avez déposé deux capsules d’ADN aux Archives Nationales le 23 novembre. Pourquoi cette décision d’archiver la Déclaration des droits de l’homme et celle de la Femme et de la Citoyenne par Olympe de Gouges ?

S.L : Tout part d’un article paru dans une des revues étudiantes : le journal AlmaMater. Cet article mentionnait l’entreprise américaine TwistBioScience qui avait encodé deux chansons sur ADN, l’une de Deep Purple, l’autre de Miles Davis. Étant nous-mêmes experts de la manipulation ADN, les étudiants, intrigués, nous ont mis au défi de stocker de l’information sur ADN. On a dit : « D’accord, mais on ne va pas encoder n’importe quoi sur ADN. Il faut que vous trouviez quelque chose qui a du sens ». Après réflexion, ils nous ont proposé d’encoder la Déclaration des Droits de l’Homme et du Citoyen. Nous trouvions l’idée bonne et nous avons souhaité rajouter la Déclaration des Droits de la Femme et de la Citoyenne d’Olympe de Gouges.

L’avantage c’est que l’ADN est stable à température ambiante et ne nécessite aucun apport d’énergie.

Pourquoi l’ADN est-elle une solution de stockage alternative révolutionnaire ?

S.L. : Outre les data-centers, il existe une autre technologie de stockage, qui n’a pas été inventée par l’être humain et qui se perfectionne depuis 4 milliards d’années : c’est l’ADN (acide désoxyribonucléique). L’ADN est la forme de stockage inventée par le Vivant puisqu’elle permet de stocker les informations génétiques. Cette double-hélice représentée par les 4 lettres ATGC est extrêmement dense. Dans un génome humain, il y a 6,4 milliards de lettres, ce qui correspond à 1,6 GigaOctet de données dans chaque cellule de notre corps. Et l’ADN, c’est très stable. A partir de défenses de mammouth datant d’1,2 millions d’années, on a été capable de reséquencer le génome entièrement. Contrairement aux supports actuels qu’on doit remplacer tous les 5 à 7 ans. Le deuxième avantage de l’ADN, c’est que c’est très très compact. La densité maximale de données qu’il est possible de stocker sur un gramme d’ADN équivaut à 450 millions TeraOctet. En clair, toutes les données du monde pourrait tenir dans 100g d’ADN, c’est-à-dire sur la taille d’une tablette de chocolat. 

L’avantage c’est que l’ADN est stable à température ambiante et ne nécessite aucun apport d’énergie. Elle est considérée comme la meilleure technologie pour remplacer nos technologies de stockage actuelles, et notamment pour ce qu’on appelle le stockage « froid » c’est-à-dire toutes les archives et les copies de secours qui représentent 70% des données mondiales y compris dans les data-centers. 70% des données de Google sont stockées sur des bandes magnétiques, c’est ce support que l’on envisage pouvoir remplacer de façon beaucoup plus respectueuse de l’environnement par le support ADN. 

Que proposez-vous comme solution ?

S.L : Nous avons développé une technologie appelée DNA Drive. Cette technologie permet de stocker dans des capsules métalliques un ADN stable durant des milliers d’années. Sa capacité de stockage est illimitée, modulable et permet de coder tous types de fichiers numériques : des dossiers, des répertoires…Exactement comme sur un disque dur. Sauf qu’au lieu d’avoir une forme magnétique, on stocke les données sur de grandes molécules d’ADN bio-compatibles qui peuvent être copiées à très bas coût. Avec cette technologie, on peut relire l’information à l’aide de séquenceurs ADN qui font la taille d’une grosse clé USB. Pour montrer que cela fonctionne, nous avons décidé d’encoder dans ces capsules, et à l’aide de la technologie DNA Drive, les deux textes historiques et symboliques évoqués. Si l’on souhaite dupliquer ces documents, il suffit de les mettre dans un système biologique dans lequel les bactéries se multiplient. A chaque division, elles multiplient l’ADN par deux. Pour les faire pousser, on leur donne du sucre. Basiquement, on transforme du sucre en information. A la fin du processus, les documents prennent très peu de place de stockage. Une de nos capsules contient 100 milliards de copies du fichier. Notre but, à terme, avec DNA Drive est de proposer une solution automatisée et miniaturisée qui prend l’intégralité du processus en compte : de l’encodage de l’information à la lecture de celle-ci.

Pierre Crozet  : Ce projet a été réalisé en partenariat étroit avec les Archives Nationales qui possèdent les originaux, il a été mené par Sorbonne-Université et le CNRS et par TwistBioScience qui est une société américaine leader de la synthèse d’ADN. La société française IMAGEN détient la technologie d’encapsulation de ces capsules. Pour poursuivre le développement de cette technologie, nous avons créé une start-up qui s’appelle BioMemory et qui vise à poursuivre le développement de la technologie DNA Drive et à la commercialiser.

Le stockage ADN a-t-il vocation à remplacer les datacenters ?

P.C : Remplacer, non. Il y a deux niveaux de réponses à donner. Le premier, c’est que, pour l’instant, l’ADN ne remplacera pas les disques durs, la mémoire flash, peut-être qu’il remplacera les bandes magnétiques -en tout cas on l’espère- mais il ne remplacera pas les autres types de disque car le temps d’accès aux informations stockées sur l’ADN est, pour l’instant, beaucoup trop long. Au mieux, c’est une journée, on espère arriver à moins d’une heure dans quelques années. 

S.L : L’écriture est très lente aussi. Ça ne remplacera pas les disques type clé USB sur lesquels nous disposons d’un accès quasi-immédiat.

P.C : L’autre niveau de réponse, c’est que nous sommes déjà à crédit en termes de données, donc il est impossible de se passer des datacenters d’un coup. Mais en ce qui concerne BioMemory, nous espérons voir notre technologie dans les datacenters à horizon 10 ans. 

Vous êtes biologistes de synthèse, que dire de cette discipline et de ses futures potentialités ?

P.C : On date la naissance de la biologie de synthèse à l’an 2000. Au même titre que la chimie de synthèse a été la science du XIXème siècle, on pourrait considérer la biologie synthétique comme la science du XXIème siècle. On s’attend à ce que cela transforme radicalement notre façon de voir les choses. La synthèse est une approche conceptuelle qui complète l’analyse. L’analyse comprend grâce à l’observation et à la déconstruction alors que la synthèse comprend en construisant quelque chose, en réfléchissant aux potentialités. Par exemple, faire produire du fil de soie d’araignée à des bactéries. Car maintenant qu’on est capable de synthétiser l’ADN, il est possible de programmer le vivant. C’est un véritable changement de paradigme pour la société. 

S.L : Pour illustrer ça, on a l’habitude de dire que les sciences expérimentales doivent être successivement analytiques, descriptives et synthétiques. La chimie a d’abord décrit les molécules qui existaient dans la nature, a analysé leur fonctionnement, et les a synthétisées. Ensuite, on a synthétisé des molécules qui n’existaient pas dans la nature : c’est le cas du plastique, par exemple. La biologie, grâce à ces progrès depuis les 40 dernières années, est en train de passer à l’ère de la synthèse. Et donc, comme la chimie a changé complètement nos sociétés en développant des nouveaux matériaux qui n’existaient pas ou des nouvelles molécules, on peut désormais créer des matériaux bio-fabriqués : des bio-bétons, des bio-plastiques, des choses qui s’auto-réparent. On peut remplacer les arômes, les colorants, les conservateurs, faire du foie gras synthétique ou de la viande éthique grâce à l’agriculture cellulaire, de l’immunothérapie avec des anticorps qui ciblent les cellules cancéreuses, mais aussi avancer sur le plan environnemental avec les bio-carburants, la dépollution ou le numérique comme avec DNA Drive, par exemple. 

Qui sont-ils ?

Directeur de recherches au CNRS, Stéphane Lemaire est un expert mondial des micro-algues, de la biologie synthétique et de la photosynthèse. Pierre Crozet est lui Maître de conférences, enseignant-chercheur à Sorbonne-Université. Leur métier est de créer de nouveaux systèmes biologiques, permettant d’exploiter le potentiel du vivant pour répondre aux problématiques actuelles.

Nolwenn Mauguen
Nolwenn Mauguen
Humanités Numériques