La Biblioteca Epstein sul sito internet del Dipartimento di Giustizia c’è un modello di disorganizzazione. All’inizio di dicembre, Keller stava sfogliando le decine di migliaia di pagine di documenti nella biblioteca e si sentiva “frustrato incredulo” di fronte al caos: file che potevano essere lunghi centinaia di pagine, testo a volte sfocato o storto, un bonifico senza contesto, una catena di e-mail con metà dei nomi oscurati, un registro di volo con solo le iniziali. “È disorientante”, cube. “Stai leggendo frammenti di qualcosa di enorme e stai cercando di capire quali frammenti contano e come si collegano.”
Una notte, ha trascorso circa quattro ore cercando di rintracciare il nome di una singola persona tra circa 30 documenti presenti nell’archivio. “Mi sono fermato e ho pensato: sto facendo a mano ciò che un database potrebbe fare in millisecondi”, afferma. In qualità di costruttore di infrastrutture di database presso un’azienda di medie dimensioni, sapeva esattamente cosa fare dopo. “Ho aperto un editor di codice e ho iniziato a creare. Alle 3 del mattino avevo un prototipo di ricerca di base che funzionava con alcune centinaia di documenti”, afferma.
In quel periodo, un sito chiamato Jmail.world stava facendo scalpore come strumento per consentire alle persone di esaminare le e-mail di Epstein come se utilizzassero un’interfaccia Gmail. Lanciato a metà novembre e realizzato da un gruppo di volontari esperti di tecnologia, da allora è cresciuto fino a includere, tra le altre cose, le sue foto, i voli e la cronologia degli acquisti su Amazon, visualizzati anche come se il lettore stesse visualizzando gli account di Epstein. Keller ha utilizzato lo strumento e gli è piaciuto. “Jmail è stata la prova che la comunità poteva costruire strumenti migliori di quelli forniti dal governo”, mi ha detto.
Lo ha anche aiutato advert affinare il suo progetto. “Invece di pensare a una categoria di documenti, ho iniziato a pensare alla rete”, afferma. “Come si collega una persona che appare in un’e-mail a un volo su cui si trovava, a un bonifico bancario, a una deposizione resa? Quel problema dei riferimenti incrociati è ciò che volevo risolvere.”
Poi, il 19 dicembre, il Dipartimento di Giustizia ha rilasciato la sua prima grande tranche, aggiungendo centinaia di migliaia di nuovi documenti all’archivio esistente. Immediatamente, il carico di lavoro di Keller raggiunse il massimo storico. Il prototipo che aveva costruito all’inizio del mese è diventato la base per l’elaborazione del tutto.
Quasi tutte le sere lavorava fino alle 3 o alle 4 del mattino, sorseggiando caffè freddo mentre navigava in un mare di schede aperte.
A causa della sua infanzia, racconta, “quando iniziarono advert arrivare i primi documenti, non riuscivo a distogliere lo sguardo. Capivo a livello viscerale cosa veniva descritto in quei fascicoli”. La sera tornava a casa dal lavoro e, una volta che tutti i membri della famiglia erano a letto, si rintanava nel suo ufficio a casa e passava ore a scorrere i PDF scaricati.
Molti documenti venivano pubblicati come immagini e lui eseguiva ogni pagina attraverso livelli di software program per convertirli in testo ricercabile: a volte un sistema non riusciva a convertire il testo e lui lo eseguiva attraverso un secondo o un terzo. Quindi utilizzerebbe un altro sistema per estrarre dettagli importanti come nomi, organizzazioni, date e luoghi. Eseguirebbe la verifica dell’hash—un processo che controlla se i file del Dipartimento di Giustizia sono stati manomessi—e l’analisi della redazione, per cercare incoerenze nel modo in cui il governo ha oscurato le informazioni. Ha tenuto traccia di tutto il suo lavoro in un meticoloso registro digitale, codificato a colori. “Non si tratta di caricare file”, afferma. “Si tratta di ricostruire una scena del crimine a partire da 2 milioni di frammenti di show.”











