Ultimo aggiornamento il
La Wayback Machine è la parte più popolare di Sito Web di Internet Archive. Introdotto per la prima volta nel 2001, lo strumento online gratuito ti consente di tornare "indietro nel tempo" per vedere come apparivano i siti Web in tutto il mondo in determinati momenti. La Wayback Machine dispone di 562 miliardi pagine web al momento della stesura di questo documento, con molte altre aggiunte ogni anno.
Ecco uno sguardo alla Wayback Machine e a cosa la rende speciale.
Introduzione a Internet Archive
Creato da Brewster Kahle e Bruce Gilliat, Internet Archive è un'organizzazione senza scopo di lucro con una missione dichiarata di "accesso universale a tutta la conoscenza". Dall'inizio, l'organizzazione ha fornito l'accesso pubblico gratuito a materiali digitalizzati, come pagine web, libri, registrazioni audio, inclusi concerti dal vivo, video, immagini e software programmi.
Ad oggi, tutto ciò che viene raccolto da Internet Archive ne occupa più di 70
La Wayback Machine
Solo una parte di Internet Archive, la Wayback Machine, è stata progettata per acquisire i contenuti del sito web che vengono modificati o rimossi. Dal lancio, è diventato uno dei luoghi più popolari e riconosciuti sul web. Kahle e Gilliat hanno chiamato il sito dopo il dispositivo immaginario che viaggia nel tempo nella serie animata degli anni '60, The Rocky and Bullwinkle Show.
Sebbene Internet Archive non abbia lanciato il sito al pubblico fino all'ottobre 2001, la Wayback Machine ha iniziato ad archiviare le pagine web memorizzate nella cache a partire da maggio 1996. Fino al 2001, i nastri digitali memorizzavano informazioni accessibili solo a scienziati e ricercatori selezionati. Quando tutto è diventato pubblico cinque anni dopo (come era stato pianificato da tempo), conteneva già oltre 10 miliardi di pagine archiviate.
Archiviazione e collezioni
Oggi, il sito conserva i dati web storici su un cluster di nodi Linux. La Wayback Machine scarica tutte le informazioni ei file di dati accessibili pubblicamente sulle pagine web tramite il suo meccanismo di scansione. Tuttavia, non tutto ciò che viene pubblicato su un sito Web è incluso qui poiché alcuni contenuti sono limitati o archiviati in database, che non sono accessibili. Per questo motivo, alcuni siti Web vengono scansionati meglio di altri, a seconda di come gli sviluppatori hanno creato un sito alla volta.
Noterai anche che più è recente l'archivio, maggiore è il contenuto disponibile per un determinato sito. Un nuovo strumento introdotto da Internet Archive nel 2005 è uno dei motivi per cui i dati più recenti sono più completi. Archive-It.org aiuta a superare le incongruenze nei siti Web parzialmente memorizzati nella cache consentendo alle istituzioni e ai creatori di contenuti di raccogliere e preservare raccolte di contenuti digitali.
Informazioni sulla scansione
I web crawler, a volte chiamati spider o spiderbot, sono vecchi quanto Internet stesso. Questi crawler sono bot di Internet che navigano continuamente sul Web a scopo di indicizzazione, rendendoli una componente importante di qualsiasi motore di ricerca moderno. I crawler utilizzati dalla Wayback Machine per creare istantanee digitali di siti Web provengono da varie fonti, che sono cambiate nel tempo.
Come noterai rapidamente, la frequenza delle acquisizioni di istantanee varia notevolmente in base al sito web. In genere, più un sito Web è grande (e forse più popolare), maggiore è la scansione. Inoltre, molto dipende dalla frequenza con cui un sito web cambia pagina. Anche i siti web più piccoli vengono infine sottoposti a scansione a meno che non ci sia un motivo per cui non lo sono. Ad esempio, i siti protetti da password non vengono sottoposti a scansione e nemmeno i siti web i cui proprietari hanno richiesto che non vengano inclusi.
Utilizzo della Wayback Machine
Il sito web Wayback Machine è facile da usare per chiunque. Per trovare istantanee storiche di un sito web, digita il suo nome nel motore di ricerca del sito. Nella pagina dei risultati di ricerca, i collegamenti ipertestuali indicano le date e le ore in cui un sito è stato archiviato. Fare clic sul collegamento per visualizzare il sito "indietro nel tempo".
Nei seguenti esempi, è possibile vedere la prima pagina del sito Web di Apple registrata nel febbraio 2005 e nel novembre 2014 e la home page della CNN da una data nel marzo 2004 e nel settembre 2010.
Nota: queste scansioni includono anche collegamenti ad altre pagine registrate nelle date indicate, non solo le home page.
Strumenti avanzati
Creata sia per i ricercatori che per il pubblico, la Wayback Machine ha alcuni strumenti incorporati che gli utenti occasionali potrebbero perdere. Ad esempio, per impostazione predefinita, le pagine dei risultati di ricerca sono facili da consultare. Come spiegato, "Se trovi una pagina archiviata a cui desideri fare riferimento sulla tua pagina Web o in un articolo, puoi copiare l'URL. Puoi persino utilizzare la corrispondenza URL fuzzy e la specifica della data... ma questo è un po 'più avanzato. "
La Wayback Machine consente inoltre ai proprietari dei siti di utilizzare una funzione "Salva pagina adesso" per salvare una pagina specifica. Eppure non è perfetto. Al momento, la funzione non aggiunge l'URL del sito a nessuna scansione futura. Inoltre, la richiesta non salva più di una pagina. Tuttavia, è un buon primo passo per archiviare la home page del tuo sito web per il record storico.
Non è necessario visitare la Wayback Machine ogni volta per eseguire una nuova ricerca. Invece, puoi trovare il contenuto digitando l'indirizzo nella barra degli strumenti del browser web. Usa questo formato per tutte le ricerche: http://web.archive.org/*/www.yoursite.com/*. Ad esempio, usa http://web.archive.org/*/www.groovypost.com/* per trovare pagine archiviate per GroovyPost!
Strumenti per dispositivi mobili e sviluppatori
Infine, la Wayback Machine non si trova solo attraverso il Web. Puoi trovare un'app Wayback Machine per iOS e Android. Esistono anche estensioni per Chrome, Safari e Firefox. Gli sviluppatori vorranno anche controllare le API Internet Archive Wayback Machine. Questi rendono più facile per gli sviluppatori recuperare le informazioni sui dati di acquisizione Wayback.
Internet Archive Wayback Machine supporta diverse API differenti. In questo modo, è più facile per gli sviluppatori recuperare le informazioni sui dati di acquisizione Wayback.
Andare "indietro nel tempo" per i tuoi siti web preferiti è il motivo numero 1 per visitare la Wayback Machine. È anche un ottimo strumento per chiunque cerchi la cronologia del sito web per progetti scolastici o per uso aziendale. Qualunque cosa tu faccia, visita la Wayback Machine e guarda cosa puoi scoprire in pochi semplici passaggi.
Per ulteriori informazioni sul servizio di abbonamento Archive-It di Internet Archive, visitare il Sito ufficiale e inizia a contribuire oggi stesso!