sabato 9 febbraio 2019

La putrefazione dei bit

Recentemente mi ha colpito la lettura di una serie di articoli che riportavano il "grido di allarme" di Vint Cerf sul problema della conservazione delle informazioni digitali. Vint Cerf fa parte di quel gruppo di pionieri di Internet che negli anni settanta hanno gettato le basi delle principali tecnologie infrastrutturali della rete informatica mondiale, tecnologie a tutt'oggi funzionanti e che ne costituiscono l'ossatura. In particolare Vint Cerf insieme all'allora suo collega Bob Kahn ha scritto il core dello stack TCP/IP, il protocollo principale di Internet, quello responsabile del trasporto di tutte le informazioni sulla rete. Attualmente gli articoli che parlano di lui lo presentano come Chief Internet Evangelist di Google. Per quanto mi riguarda, a parte la sua fama di "padre di Internet", nel passato mi era capitato di associarlo a un progetto ambizioso e un po' bizzarro, quello della definizione di una Internet Planetaria (InterPlaNet, http://ipnsig.org/).

Comunque un personaggio degno di attenzione. Quello che ha detto recentemente ad un incontro della American association for the advancement of science, e meno recentemente in altre occasioni, riguarda la nostra capacità presente e futura di conservare le informazioni digitali in cui da un po' di tempo stiamo codificando tutto quello che produciamo. Secondo lui questa informazione è destinata in un tempo relativamente breve (e sempre più breve) a scomparire, o meglio, a ridursi ad un cumulo di macerie di bit incomprensibili. Il suo allarme è su due aspetti di questo problema, non indipendenti tra loro. Prima di tutto quello personale. Rischiamo nel corso della nostra vita di perdere quantità considerevoli di dati che ci riguardano, con o senza significato per noi (i bit sono bit, e vengono archiviati tutti allo stesso modo, il senso glielo diamo noi). Questo fatto Cerf lo esprime e lo sintetizza con una frase: “Nel nostro zelo, presi dall’entusiasmo per la digitalizzazione, convertiamo in digitale le nostre fotografie pensando che così le faremo durare più a lungo, ma in realtà potrebbe venir fuori che ci sbagliavamo. Il mio consiglio è: se ci sono foto a cui davvero tenete, createne delle copie fisiche. Stampatele”.

Il secondo aspetto è quello più propriamente storiografico. Cosa riuscirà a ricavare uno storico del futuro, mettiamo tra mille anni, dai nostri dati digitali, ovvero da tutto quello che sarà rimasto di noi e della nostra epoca? Secondo Cerf praticamente niente. Sarà impossibile ricostruire la nostra storia, la nostra cultura, perchè sarà impossibile leggerla nei documenti che lasceremo. Da notare che questo problema è in parte legato al primo. Nel senso che si potrebbe dire a prima vista che la perdita di dati del cittadino medio è ininfluente per la storiografia e che per quest'ultima sono molto più importanti i documenti ufficiali di una società, certamente molto più facili da conservare in qualunque forma. Ma probabilmente questa non è esattamente l'opinione degli storici. Come dice ancora Cerf "a distanza di secoli, anche documenti apparentemente irrilevanti possono rivelarsi importantissimi per la comprensione di un'epoca, con la sua sensibilità e il suo punto di vista". E secondo me non ha tutti i torti.

Fin qui però non ho discusso il punto centrale del problema. Di cosa stiamo parlando esattamente? Di perdere dati e documenti? Ma questo non è sempre successo nel corso dei millenni? E i vari metodi della ricerca storica non ci hanno consentito lo stesso di ricostruire le epoche passate e di conoscerle? In qualche modo lo faranno anche i nostri posteri, no? Ecco, su questo secondo me si possono fare alcune domande e osservazioni di qualche interesse.

Siamo sicuri che noi siamo riusciti a ricostruire bene la storia di tutte le epoche passate? Non ci siamo mai imbattuti nelle situazioni in cui abbiamo dovuto semplicemente ammettere che le informazioni in nostro possesso sono talmente poche da non consentirci una ricostruzione un minimo soddisfacente? E che per questo motivo alcuni periodi storici sono rimasti per noi sostanzialmente un mistero? E non ci viene in mente che di altri periodi storici potremmo avere un'immagine parzialmente sbagliata dovuta alla documentazione largamente incompleta che ci è pervenuta? E soprattutto, possiamo dire di avere un'idea abbastanza precisa di quanto abbiamo perso in termini di fonti storiche importanti per ricostruire la nostra storia?

Che cosa vogliamo tramandare ai nostri posteri? Con che livello di dettaglio ci piacerebbe che i nostri posteri ci conocessero? Sto dando per scontato che ce ne importi qualcosa, in caso contrario, inutile continuare a ragionare su quello che ci dice Vint Cerf. Si sa bene che ci sono dei periodi storici che hanno dei buchi impressionanti nelle loro fonti. Spesso conosciamo periodi importanti delle civiltà che ci hanno preceduto solo attraverso testimonianze indirette, di terza mano (traduzioni di traduzioni), scarse e frammentarie. Abbiamo comunque ricostruito una narrazione abbastanza coerente di quei periodi e di quelle civiltà, ma quante "puntate" abbiamo perso? Ci accontentiamo di dare ai posteri lo stesso livello di qualità delle fonti che ci hanno a loro volta lasciato i nostri antenati o confidiamo in qualcosa di meglio?

In che consisterebbe questo pericolo paventato da Vint Cerf? In fin dei conti la nostra era digitale ci ha consegnato la capacità di produrre e archiviare una quantità di informazioni su di noi mai raggiunta da nessun altra civiltà del passato, neanche lontanamente. E nonostante questo Vint Cerf ci dice che stiamo messi forse peggio dei periodi più oscuri (lui ha fatto riferimento al medio evo). Che intende con l'espressione "putrefazione dei bit"?

L'idea di Cerf per quanto ho capito è grosso modo la seguente. L'accesso ad una qualunque informazione digitale dipende in maniera cruciale da due elementi: l'hardware che la archivia e il software che la legge. Ma noi siamo già molto ben abituati ad assistere alla grande velocità con cui questi due elementi evolvono e si modificano, anche radicalmente. E siamo quindi anche ben abituati ad assistere alla veloce obsolescenza di macchine e programmi. E sappiamo bene che un dato costruito con un certo software e archiviato in un certo hardware diventa presto irrecuperabile se non ci preoccupiamo di aggiornarlo. Ma aggiornarlo ha un costo, di tempo, di risorse e di denaro. E molti di questi aggiornamenti, benchè necessari per conservare l'accessibilità ad un certo dato, potrebbero non essere convenienti. Il problema è questo.

La gravità di questo problema è tanto più grande quanto più archivieremo nel futuro tutte le nostre informazioni in formato digitale. Ma questo è molto probabilmente quello che faremo in misura sempre maggiore. Inutile documentare gli schemi tecnici dei vecchi dispositivi hardware di archiviazione o le logiche dei vecchi codici per la rappresentazione dei dati se tutto questo verrà a sua volta archiviato in digitale. Potremmo essere ottimisti e sostenere che in fin dei conti sarà facile lasciare anche solo involontariamente tracce sufficienti per il lavoro di interpretazione degli storici del futuro, come è sempre successo. Ma è sempre successo? Chi ce lo assicura? E poi forse noi siamo ingenuamente convinti (forse come ogni uomo di ogni epoca) che non perderemo mai le nostre conoscenze, e anzi non faremo altro che arricchirle progressivamente, e saremo sempre più bravi.

In che senso questo potrebbe essere considerato un problema nuovo, specifico della nostra epoca? Che particolarità ha l'era digitale relativamente a questo aspetto della conservazione dell'informazione? Perchè a Vint Cerf è venuta in mente un'idea del genere?

Direi che un aspetto abbastanza peculiare del nostro mondo è la presenza di una enorme complessità tecnologica e della sua grande velocità di cambiamento. Questo potrebbe rendere effettivamente molto più difficile avere gli strumenti adeguati per guardarsi indietro. Il motivo per cui Vint Cerf si è posto questo problema è perchè nell'arco della sua vita (cioè un tempo relativamente breve per la storia) può certamente dire di aver visto passare un'infinità di tecnologie ormai scomparse, e sicuramente avrà avuto modo di constatare l'entità della perdita di dati che questi passaggi tecnologici avranno inevitabilmente determinato. Forse potrebbe essere il caso di domandarsi quale sarà nel futuro il tasso di queste perdite, provare a misurarlo, e pensare a definire una qualche strategia di conservazione dei dati più affidabile di quella che abbiamo. In fondo si tratterebbe di inventare un'altra tecnologia.

NOTA1: Mi ha colpito l'aver constatato che in realtà questo problema è stato preso in seria considerazione anche da SNIA (Storage Networking Industry Association, https://www.snia.org/). E' stata addirittura creata una task force ("100 Year Archive Task Force"). In un suo documento di qualche anno fa ("100 Year Archive Requirements Survey", January 2007) si legge: "Le due grandi sfide tecniche della conservazione delle informazioni digitali a lungo termine sono la migrazione logica e fisica. La migrazione logica è la pratica di aggiornare il formato delle informazioni in un formato più nuovo che può essere letto e interpretato correttamente da applicazioni o lettori futuri senza perdere l'autenticità dell'originale. Migrazione fisica significa copiare le informazioni su nuovi supporti di memorizzazione per preservare la possibilità di accedervi e proteggerli dalla corruzione dei media".

NOTA2: Nel mio piccolo ho anche io un'esperienza abbastanza significativa di "putrefazione dei bit" (è certamente uno dei motivi per cui il pensiero di Vint Cerf mi ha colpito). Ho perduto (direi definitivamente) il mio lavoro di tesi, più esattamente il suo formato digitale. Era certamente in un floppy da 3.5 pollici, scritto con una versione di un word processor direi oggi assolutamente incompatibile con qualunque software analogo reperibile sul mercato. Comunque il floppy è scomparso, insieme a tutti i floppy che piano piano si sono persi senza un backup, senza un aggiornamento, sotterrati dalle faccende della vita. Ma se qualcuno (ma chi poi?) mi chiedesse un bel giorno di vedere per curiosità la mia tesi di laurea, andrei in uno scaffale basso della mia libreria, prenderei il suo tradizionale formato cartaceo, e in pochi secondi quel qualcuno l'avrebbe tra le mani pronta per essere sfogliata.