Imaginez un site internet contenant… absolument tout. Toutes les définitions de tous les dictionnaires du monde, toutes les pages de tous les livres jamais écrits et de ceux qui n’existent pas encore, le résumé de votre journée d’aujourd’hui, mais aussi de celle de demain. Imaginez n’importe quelle scène, même la plus saugrenue : elle se trouve déjà sur ce site. Et aussi étrange que cela puisse paraître, ce site existe bel et bien ! Il s’appelle libraryofbabel.info, du nom de l’une des plus célèbres nouvelles de Jorge Luis Borges (1899-1986), « La Bibliothèque de Babel ». L’auteur argentin y décrivait en 1941 une « bibliothèque totale » renfermant tous les livres de 410 pages – de 80 lignes chacune – théoriquement possibles, comprenant ainsi tous les textes imaginables mais également une multitude de successions aléatoires de lettres.

« En considérant ces textes comme des ensembles de données dénuées de sens, Borges pensait déjà en terme d’algorithmes », souligne Jonathan Basile, doctorant en littérature comparée à l’université américaine d’Emory (Atlanta). C’est lui qui a créé en 2015 le site libraryofbabel.info. « Il m’a fallu environ trois mois pour concevoir un algorithme générant des pages aléatoires, explique Jonathan Basile. Je souhaitais aussi que le processus soit réversible, c’est-à-dire que chaque page soit toujours rangée au même endroit et que l’on puisse, en cherchant un texte précis, retrouver sa localisation dans la bibliothèque. »

Un océan de non-sens et d’aléatoire

Pour bien comprendre le fonctionnement de celle-ci, mieux vaut commencer petit, avec par exemple des « pages » contenant uniquement un mot de trois lettres. Avec notre alphabet de 26 lettres, il existe précisément 17.576 combinaisons possibles (26 fois 26 fois 26, soit 263). L’algorithme est capable d’attribuer à chacune de ces combinaisons une place qui soit toujours la même. Le mot AAA sera par exemple toujours à la première place, le mot RVH toujours localisé à la position numéro 12.527, etc. Inversement, si l’on cherche ce qui se trouve à la position numéro 12.527, l’algorithme affichera systématiquement le mot RVH.

À ce stade, deux constats s’imposent. Tout d’abord, l’algorithme n’a pas à stocker à l’avance toutes les combinaisons possibles, se contentant de répondre ponctuellement aux questions « quel mot se trouve à telle position » et « où se trouve tel mot ». Mais surtout, le procédé fournit majoritairement des combinaisons de lettres dénuées de tout sens. Seuls quelques centaines de réels mots de trois lettres (en français), comme SAC, MUR ou ARC, sont discernables parmi les milliers de combinaisons abstraites. Si l’on reproduit le même procédé avec cinq lettres, le nombre de combinaisons dépasse les 11 millions (265). Les rares mots compréhensibles de cinq lettres se retrouvent d’autant plus noyés dans un océan de non-sens et d’aléatoire.

Maintenant, rajoutez aux 26 lettres de notre alphabet la virgule, le point et l’espace pour pouvoir scinder le tout en plusieurs mots, puis en phrases. Enfin, montez le nombre de caractères jusqu’à 3.200, soit une page de livre de poche. C’est ce qu’a fait Jonathan Basile sur son site, capable de recréer les 293200 combinaisons possibles pour une telle page. Toutes ces pages ont ensuite été soigneusement « rangées » dans des livres de 410 pages, eux-mêmes entreposés sur des étagères virtuelles au sein d’une succession de pièces hexagonales. Le nombre de livres obtenus est absurdement grand : 104677. Soit une suite ininterrompue de 4.678 chiffres… plus longue que le texte que vous venez de lire jusqu’ici. « Ce nombre est si grand qu’il dépasse toutes nos capacités de compréhension », résume Jonathan Basile. Pour comparaison, le nombre de millisecondes écoulées depuis la naissance de notre planète, il y a 4,5 milliards d’années, ne comporte que 21 chiffres. Celui des atomes dans l’Univers visible, environ 80. Si le nombre de livres est donc fini d’un strict point de vue mathématique, il flirte pour un esprit humain avec les frontières de l’infini.

Naviguer au hasard dans la bibliothèque de Babel, c’est se retrouver submergé par des pages et des pages de combinaisons incohérentes de lettres. Parmi elles, avec un peu de chance, il est possible de relever un mot de trois, voire quatre lettres. Mais aussi, toutes les combinaisons de 3.200 caractères étant possibles, des mots bien plus longs, des phrases et même des paragraphes entiers de texte. Le premier paragraphe de cet article se trouve ainsi à la page 354 du 26e livre posé sur la 5e étagère du mur 3, dans la pièce numéro 3gdek6p7ky… Et il se trouvait déjà à cette exacte position depuis des années. Vertigineux ! Si toutes les pages de tous les livres connus et inconnus existent bel et bien dans la bibliothèque, il est pour autant statistiquement impossible de tomber dessus sans passer par le moteur de recherche du site, explique son créateur. « Ces pages de texte rationnel sont exceptionnellement rares. Mais elles ne sont pas plus chargées de sens que les autres, résultant elles aussi d’un processus aléatoire. La bibliothèque nous montre que tout discours, toute réflexion sensée, est reproductible de manière mécanique en l’absence d’intention. »

Des images de vous-même en train de lire ce magazine

Non content d’avoir mis en ligne cette époustouflante bibliothèque virtuelle, le jeune Américain a voulu pousser le concept plus loin. Sur le même site, une partie « Archives images de Babel » a ainsi vu le jour. L’algorithme, plutôt que de générer des textes, produit ici toutes les variations possibles d’une image de 640 pixels sur 416, chaque pixel pouvant prendre une couleur parmi 4.096 disponibles. Comme son pendant littéraire, cette bibliothèque d’images renferme majoritairement des pages dénuées de sens, ici sous forme d’une bouillie de pixels. Mais elle contient aussi, entre autres, une multitude d’images de vous-même en train de lire ce magazine, prises dans une infinité d’angles et de cadrages différents. « L’algorithme peut en réalité s’appliquer à un grand nombre d’expériences, comme des morceaux de musique, mais je trouvais que la génération d’images constituait une extension très intéressante du concept, car très personnelle, presque dérangeante pour les visiteurs », souligne Jonathan Basile. Difficile de lui donner tort : quelque part sur son site se trouve une photo des enfants ou des petits-enfants que vous n’avez pas encore.

Borges et le paradoxe du singe savant 

L’écrivain argentin Jorge Luis Borges a toujours aimé jouer avec le concept de l’infini. La nouvelle « L’Aleph », publiée en 1945 dans le recueil du même nom, imaginait un point situé dans la cave d’une maison contenant une infinité de lieux et d’événements ; un point à travers lequel on pouvait observer simultanément « tous les lieux de l’univers, vus de tous les angles ». Trente ans plus tard, dans une nouvelle intitulée « Le Livre de sable », Borges décrivait un livre au nombre de pages « exactement infini » et contenant, de fait, tous les livres imaginables. Une forme de réponse à La Bibliothèque de Babel, l’un de ses textes les plus célèbres, imaginé quelques décennies plus tôt. En réalité, cette nouvelle s’inspirait déjà de « La Bibliothèque universelle », un récit écrit au début du siècle par l’écrivain et mathématicien allemand Kurd Lasswitz (1848-1910). Toutes ces créations littéraires ont souvent été considérées comme autant d’illustrations d’un paradoxe mathématique, celui du singe savant. Ce théorème aux multiples variations affirme qu’un singe immortel tapant indéfiniment sur une machine à écrire finira presque sûrement (formulation issue de la théorie des probabilités) par écrire, entre autres exemples, « Hamlet » de Shakespeare. Absurde, mais mathématiquement imparable.

Par Yann Chavance

Imaginez un site internet contenant… absolument tout. Toutes les définitions de tous les dictionnaires du monde, toutes les pages de tous les livres jamais écrits et de ceux qui n’existent pas encore, le résumé de votre journée d’aujourd’hui, mais aussi de celle de demain. Imaginez n’importe quelle scène, même la plus saugrenue : elle se trouve déjà sur ce site. Et aussi étrange que cela puisse paraître, ce site existe bel et bien ! Il s’appelle libraryofbabel.info, du nom de l’une des plus célèbres nouvelles de Jorge Luis Borges (1899-1986), « La Bibliothèque de Babel ». L’auteur argentin y décrivait en 1941 une « bibliothèque totale » renfermant tous les livres de 410 pages – de 80 lignes chacune – théoriquement possibles, comprenant ainsi tous les textes imaginables mais également une multitude de successions aléatoires de lettres.

« En considérant ces textes comme des ensembles de données dénuées de sens, Borges pensait déjà en terme d’algorithmes », souligne Jonathan Basile, doctorant en littérature comparée à l’université américaine d’Emory (Atlanta). C’est lui qui a créé en 2015 le site libraryofbabel.info. « Il m’a fallu environ trois mois pour concevoir un algorithme générant des pages aléatoires, explique Jonathan Basile. Je souhaitais aussi que le processus soit réversible, c’est-à-dire que chaque page soit toujours rangée au même endroit et que l’on puisse, en cherchant un texte précis, retrouver sa localisation dans la bibliothèque. »

Un océan de non-sens et d’aléatoire

Pour bien comprendre le fonctionnement de celle-ci, mieux vaut commencer petit, avec par exemple des « pages » contenant uniquement un mot de trois lettres. Avec notre alphabet de 26 lettres, il existe précisément 17.576 combinaisons possibles (26 fois 26 fois 26, soit 263). L’algorithme est capable d’attribuer à chacune de ces combinaisons une place qui soit toujours la même. Le mot AAA sera par exemple toujours à la première place, le mot RVH toujours localisé à la position numéro 12.527, etc. Inversement, si l’on cherche ce qui se trouve à la position numéro 12.527, l’algorithme affichera systématiquement le mot RVH.

À ce stade, deux constats s’imposent. Tout d’abord, l’algorithme n’a pas à stocker à l’avance toutes les combinaisons possibles, se contentant de répondre ponctuellement aux questions « quel mot se trouve à telle position » et « où se trouve tel mot ». Mais surtout, le procédé fournit majoritairement des combinaisons de lettres dénuées de tout sens. Seuls quelques centaines de réels mots de trois lettres (en français), comme SAC, MUR ou ARC, sont discernables parmi les milliers de combinaisons abstraites. Si l’on reproduit le même procédé avec cinq lettres, le nombre de combinaisons dépasse les 11 millions (265). Les rares mots compréhensibles de cinq lettres se retrouvent d’autant plus noyés dans un océan de non-sens et d’aléatoire.


Source link