Publier ou périr : stockage de données et civilisation
MaisonMaison > Nouvelles > Publier ou périr : stockage de données et civilisation

Publier ou périr : stockage de données et civilisation

Jun 14, 2023

A qui pensez-vous quand vous pensez aux civilisations anciennes ? Romains? Les Grecs? Chinois? Inde? Égyptiens ? Qu'en est-il des Scythes, des Muisca, des Gana ou des Kerma ? Vous pourriez ne pas reconnaître ce deuxième groupe aussi facilement parce qu'ils n'avaient pas tous de système d'écriture. Il en va de même, dans une moindre mesure, pour les Étrusques, les Minoens ou les habitants de l'île de Pâques où ils écrivaient, mais personne ne se souvient comment lire leur écriture. Même les Égyptiens étaient mystérieux jusqu'à la découverte de la pierre de Rosette. Nous imaginons qu'un auteur écrivant en étrusque ne pensait pas que personne ne serait capable de lire l'écriture à l'avenir – il pensait probablement qu'il enregistrait ses pensées pour toute l'éternité. Hybris ? Peut-être, mais qu'en est-il de nos documents qui sont de plus en plus stockés sous forme de bits quelque part ?

C'était déjà assez grave quand vous aviez des cartes perforées et des supports magnétiques. Nous sommes sûrs que certains formats de bande ne sont plus pratiques à lire. Pourriez-vous lire une cartouche à bulles magnétiques ? Serait-ce même viable après toutes ces années ? Mais le problème est encore pire maintenant. Où sont vos anciennes copies de Hackaday ? Où sont vos e-mails ? "Dans le nuage" est un cliché, mais approprié. Dans 1 000 ans, il n'y aura plus de serveur Google et quel que soit le support de stockage qu'il utilise aujourd'hui, il sera probablement de la poussière, même si les personnes voulant le lire savaient comment.

Et ça empire. Si vous voyez une pierre ou un parchemin avec des gribouillis dessus, vous pouvez en déduire qu'il s'agit d'écriture. Et si vous voyiez des cordes avec des nœuds ? Les Incas utilisaient un système comme celui-là pour enregistrer les choses. Nous ne savons toujours pas exactement comment les lire. Que pensera un futur archéologue d'une carte flash ou d'un disque dur ? Ils sont aussi peu susceptibles d'utiliser quelque chose comme ça que nous d'utiliser un strigile - le couteau romain utilisé pour se nettoyer. Si vous en avez vu un sans contexte, vous pourriez supposer qu'il s'agissait d'un outil de menuiserie, pas d'un accessoire de salle de bain. Pourquoi nos futurs archéologues penseraient-ils que certaines petites boîtes pourraient contenir des écritures si vous saviez les lire ?

Au moins certains des médias les plus anciens ont une chance de survivre. Les cartes perforées et les bandes de papier sont probablement aussi robustes que les livres. Comme une tablette de pierre, il devrait être assez évident qu'elles contiennent des données et qu'elles sont faciles à décoder, même à la main.

Les choses magnétiques sont moins certaines, cependant. Les oxydes à base de bandes ne dureront pas éternellement et les informations magnétiques qu'ils contiennent sont encore plus fragiles. Les supports optiques peuvent durer, mais il est loin d'être certain que vous réaliseriez qu'il y avait des données encodées. Ils pourraient être confondus avec l'art. La bande a le même problème. Il serait facile d'imaginer un futur musée montrant du ruban adhésif utilisé pour un rituel religieux inconnu impliquant des sanctuaires avec des planchers surélevés.

Les médias modernes sont susceptibles d'être basés sur le flash et cela ne durera certainement pas éternellement. Il est encore plus difficile de réaliser qu'il pourrait y avoir quelque chose sur eux. Même maintenant, je peux voir une demi-douzaine de périphériques USB sur mon bureau, dont la moitié ne sont pas des lecteurs flash mais ne semblent pas très différents.

Ensuite, il y a toutes les données du cloud. Bien sûr, il est vraiment stocké quelque part sur un disque dur (support magnétique ou flash). Vraisemblablement, si de futurs archéologues trouvaient un centre de données enfoui, quelque part, ils pourraient déverrouiller des tonnes de données, mais seulement s'ils réalisaient ce que c'était et comment les lire.

Même aujourd'hui, il peut être difficile de lire un disque écrit sur un système si vous n'avez pas ce système. C'est devenu un peu plus facile, dans certains cas courants, car quelques formats sont presque universels, mais il y a toujours des cas aberrants.

Comme expérience de pensée, imaginez que vous êtes un futur archéologue étudiant les ruines du 21e siècle. Votre assistant vous apporte un petit rectangle noir de la taille de votre vignette marqué "32 Go, classe 10". Tout d'abord, vous devez réaliser qu'il s'agit d'un périphérique flash. Ensuite, vous devrez comprendre comment le mettre sous tension et lui envoyer les bonnes commandes sur le bus série pour en extraire les données.

Mais le plaisir ne fait que commencer. Avec les données, vous devrez déterminer le format du système de fichiers. Ensuite, vous pouvez creuser dans les différents types de fichiers, chacun constituant un projet scientifique en soi. Fichiers PDF ? Images et vidéo ? Bonne chance. Imaginez si les Égyptiens utilisaient un ensemble différent de hiéroglyphes à des fins différentes, puis les soumettaient à une compression de données pour minimiser la redondance.

Nous ne sommes pas les seuls à y penser. L'Université de Göttingen, par exemple, gère 5 pétaoctets de données dans une archive "pour toujours" collectée au cours des 40 dernières années. Ils affirment que les bandes qu'ils utilisent ont une durée de vie de 20 à 30 ans, mais la technologie pour les gérer ne dure que 10 ans. Ils déplacent donc constamment des données d'un support à l'autre, ce qui prend environ deux ans. Bien sûr, s'ils cessent de fonctionner, vous pouvez supposer que dans 300 ou 400 ans, il n'y aura pas beaucoup de chance de récupérer les données.

Les services ne manquent pas pour stocker vos données "pour toujours" dans le cloud, mais il est difficile de voir comment ils peuvent vraiment garantir cela et ce que cela signifierait si cela ne fonctionnait pas. Par exemple, Ardrive utilise le "blockweave" pour stocker des données de manière distribuée, mais il est facile d'imaginer un certain nombre de façons dont cela pourrait être perturbé. Comme l'a dit Adam Farquhar, responsable de la préservation numérique à la British Library, "Si nous ne faisons pas attention, nous en saurons plus sur le début du 20e siècle que sur le début du 21e."

Non pas que les dossiers papier soient bien meilleurs. Le papier se détériore. Les langues se perdent. La célèbre bibliothèque d'Alexandrie a brûlé. Mais la pierre semble durer. Ironiquement, nous en savons beaucoup sur Akhenaton, le père du roi Tut, car les Égyptiens ont tenté de l'effacer de l'histoire en détruisant son œuvre. Ils ont réutilisé les pierres, souvent comme fondation pour de nouvelles constructions et nous en avons donc trouvé une grande partie bien conservée.

Au fur et à mesure que nous poussons vers des supports de stockage plus exotiques, le problème ne fait qu'empirer. Nous avons lu sur le stockage des données dans du verre (voir la vidéo ci-dessous) et le stockage moléculaire à 80K en utilisant de l'azote liquide. Rien de tout cela ne sera plus évident ou plus viable que ce que nous utilisons aujourd'hui. En fait, beaucoup d'entre eux aggraveront le problème.

Nous ne pouvons pas dire à quel point ils sont sérieux, mais le projet "Billion Year Archive" a envoyé un disque de quartz avec la trilogie de la Fondation d'Isaac Asimov dans la boîte à gants de la Tesla spatiale d'Elon Musk. Ils ont également apparemment envoyé une bibliothèque sur la lune en 2019. Cependant, ces bibliothèques utilisent le stockage de l'ADN, ce qui semble étrange car nous avons du mal à récupérer l'ancien ADN aujourd'hui et également en gravant de minuscules textes dans de minces films de nickel. En plus de cela, la sonde avec laquelle il faisait du stop s'est écrasée, et la survie de la bibliothèque est en question.

Il est difficile, cependant, de visualiser notre archéologue post-apocalyptique errant sur la lune et réalisant l'importance d'une feuille de métal et de quelques cristaux. Cela nous amène à deux questions intéressantes : premièrement, comment pourriez-vous stocker des données évidentes pour un futur lointain de manière à ce qu'elles survivent et soient compréhensibles ? La question est un peu comme les messages extraterrestres où il est difficile de comprendre ce qu'un autre être pourrait décoder. Sans cette réponse, nous pourrions devenir un jour une autre mystérieuse "civilisation perdue".

La deuxième question est : et si cela s'était déjà produit auparavant ? Cela sent la science folle, mais que se passe-t-il si un ancien artefact contient des informations encodées et que nous ne le reconnaissons même pas ? Bien sûr, nous en reconnaissons certains, mais nous ne savons pas quoi en faire comme les nœuds incas dans la vidéo ci-dessous. Vous avez une réponse à l'une de ces questions? Laissez-les dans les commentaires.

[Image de bannière : "Hiéroglyphes égyptiens" par Martie Swart

Problèmes d'encodage