mercoledì 3 dicembre 2014

La conservazione dei dati digitali

Nello studio delle tecnologie di Internet è abbastanza probabile imbattersi in documenti chiamati "Request for Comments" o più brevemente RFC, numerati con un numero progressivo. In essi gli informatici descrivono protocolli, tecnologie, metodologie, sotto forma di proposte che la comunità di esperti è chiamata a vagliare. Alcuni di questi documenti, dopo un lungo processo, possono diventare degli "Standard Internet".

Quello che colpisce di questi documenti è il fatto che siano scritti tutti rigorosamente in codifica ASCII, un codice per lo scambio di informazioni accettato come standard prima da ANSI e successivamente da ISO a cavallo degli anni sessanta e settanta. Colpisce perché un documento scritto in questo modo risulta estremamente rozzo dal punto di vista tipografico, soprattutto confrontato con i caratteri raffinati introdotti dai moderni word processors. E colpisce altrettanto il motivo per cui questi documenti vengono pubblicati così: essendo fondamentale la garanzia di una loro diffusione certa e illimitata alla totalità della comunità di Internet l'uso di codifiche magari più potenti ed efficaci ma inevitabilmente legate a programmi che le interpretano non è consigliabile in quanto non assicura la loro universalità di accesso.

Quello che non avevo valutato a sufficienza è che questa cosa va vista anche e soprattutto nel tempo. E' necessario assicurarsi che questi documenti possano essere letti facilmente anche dopo molti anni dalla loro pubblicazione, in quanto in essi sono descritti in dettaglio i protocolli costitutivi di Internet e le prescrizioni con cui vanno implementati per assicurare l'interoperabilità di tutti gli host della rete. Perdere un bel giorno l'accesso a queste conoscenze fondamentali perché magari non risultano più disponibili i programmi che sappiano leggere i testi che le documentano è una minaccia molto concreta.

Questo concetto è generalizzabile a tutti i dati digitali, qualunque cosa rappresentino, dal momento in cui si è cominciati a conservarli fino ad oggi. Un qualsiasi dato digitale è di fatto un numero, ovvero una stringa più o meno lunga di bit, che però non ha alcun senso se non si è in possesso del programma giusto per leggerlo (presumibilmente lo stesso utilizzato per produrlo a suo tempo). Può sfuggire l'importanza di questo fatto ma su tempi molto lunghi (molto più lunghi dell'attuale periodo di sviluppo dell'era digitale) può costituire un gravissimo problema di corretta conservazione delle conoscenze dell'umanità. E' in un certo senso un tema un po' controcorrente visto che oggi si parla esclusivamente del fatto che tutto quello che mettiamo in rete diventa automaticamente eterno, sempre disponibile e di fatto incancellabile..... Oppure quest'ultimo aspetto è semplicemente l'altra faccia della stessa cosa.

Vinton Cerf, uno dei padri delle tecnologie di Internet e pioniere dell'era digitale sintetizza questo doppio problema con il seguente commento: "Internet ricorda cose che vorremmo che non ricordasse, e dimentica cose che vorremmo che ricordasse".

Nessun commento: