Softwarearchief
Op 10 december 2022 staat de teller op 13.301.978.706 ingecheckte en beheerde source files. Een onwaarschijnlijk getal, dat ieder dag weer groeit. We hebben het hier over de Software Heritage Organisation, een non-profit organisatie die zich ten doel stelt om unieke software te archiveren. Wat zo mooi is aan hun opdracht is dat iedereen zijn stukjes code kan delen, en je kunt er ook naar verwijzen voor hergebruik. Om met Harold Abelson te spreken: Programma’s moeten worden geschreven zodat mensen ze kunnen lezen, en alleen incidenteel voor machines om te uit te voeren’.
En ja, ook virussen zitten er tussen. Net als een medisch lab, of een willekeurige andere bibliotheek zit er van alles in. Er is alleen geen fysieke plek waarin je rustig tussen de rijen van ‘code op the shelf’ kunt rondlopen. Deze geschiedenis vastleggen is essentieel, zeker omdat omgevingen met een profit-karakter soms stoppen te bestaan. Veel software wordt in open omgevingen gedeeld, en in de listings kun je zien welke developer de status van super star heeft bereikt onder zijn vakgenoten. Maar het gebeurt nogal eens dat het commerciële bedrijf dat de software-database onderhoudt, er mee stopt. Denk aan Google Code en Gitorius.org en het verwijderen van codes door BitBucket en GitLab.
Al die codes bijeen – het brengt je op de vraag hoeveel code er nog bij zal komen, zeker nu Machine Learning en AI-routines zichzelf aanleren codes te genereren en zichzelf kunnen reproduceren in betere versies van zichzelf. Dat doet dan weer een beetje denken aan wat Jorge Louis Borges beschrijft in zijn boek uit 1941, over een oneindig universum met daarin een oneindige bibliotheek met alle boeken die ooit geschreven zijn en ooit geschreven zullen worden, in alle talen die er zijn. Met 25 karakters (22 letters, een spatie, komma en punt) zou dat theoretisch mogelijk moeten zijn, hoewel heel veel boeken totaal onleesbaar zullen zijn. Een werkende versie zien? Zoek Jonathan Basile maar op, die het zowel voor teksten als voor foto’s heeft uitgewerkt.
Toch wel interessant om te weten dat in theorie alles al bestaat – ook al is het er nog niet. Als we dat zouden omarmen, scheelt dat heel veel type- en klikwerk. En het zou ook veel tijd schelen voor mijn vrienden die nu via social media geinige mock-ups laten maken (door eenvoudige AI ondersteund) van hun gezicht. Voila doet het in een handomdraai. De foto’s beloven ze weg te gooien na 48 uur, je persoonlijk identificeerbare informatie, zoals telefoon en activiteit online, om te delen met externe partners en adverteerders natuurlijk niet. Hoe zou het zijn als je weet dat je dit allemaal niet meer hoeft te doen – de foto was er namelijk toch al in de Bibliotheek van Babel. Net als deze column overigens.
Wouter Bronsgeest, duo-voorzitter KNVI