Da Archie a Google

Google, Google e ancora Google!

Quando si utilizza di Internet è quasi scontato che si acceda al noto motore di Mountain View per iniziare le proprie ricerche o approfondire specifici argomenti.

Eppure c’è stata un’epoca in cui Sergey Brin e Larry Page erano assenti dalla scena della Rete, un’epoca in cui uno degli eventi più attesi era il rilascio della nuova versione di MS-DOS (;-)).

Stiamo parlando del periodo tra la fine degli anni ’80 e l’inizio degli anni ’90, in cui era pratica comune usare Internet per lo scambio dei file tramite protocollo FTP.

Lo svantaggio però è chiaro ed evidente: bisognava conoscere a quale host FTP collegarsi per poter scaricare il file desiderato. Gli utenti, in prima battuta, pubblicizzavano la disponibilità di un nuovo file tramite una e-mail inviata ad una message list o aprendo una discussione su di un forum.

Archie nel 1990 cambia tutto ciò, grazie alla geniale intuizione di Alan Emtage, allora studente all’università McGill di Montreal.

Alan Emtage

Quello che viene oggi accreditato come il “papà” dei motori di ricerca era chiaramente profondamente diverso dagli attuali search engine, oltretutto il Web non era neanche nato al momento del suo rilascio (bisognerà aspettare fino al 6 agosto 1991).

Emtage pensò inizialmente di chiamare il proprio sistema “Archives”, ma decise di allinearsi alla pratica Unix di assegnare ai programmi nomi semplici e criptici (es: grep, cat, troff, sed, awk, perl, ecc.). Archie- (con il trattino) indicava il core del sistema, ovvero “Archie servers” composto da una serie di programmi in grado di gestire un database di FTP Anonimi in cui effettuare la ricerca dei file per nome.

Automaticamente Archie si connetteva agli host presenti nei propri archivi e, oltre a verificarne il funzionamento, scaricava l’elenco completo dei file pubblici.

La base dati che così si creava veniva interrogata tramite espressioni regolari al fine di effettuare il match tra la stringa specificata dall’utente e il nome del file. Una volta trovato quanto richiesto, veniva presentato all’utente l’host FTP relativo da cui recuperare il file.

Nel libro “The daemon, the gnu, and the penguin: A History of Free and Open Source” si riporta che, nel 1992, Archie conteneva informazioni inerenti circa 2,6 milioni di file per un totale di 150 gigabytes di informazioni, mentre nel documento Research Problems for Scalable Internet Resource Discovery si evidenzia che nel 1993 Archie era al massimo del suo splendore, anche se cominciava a dare i primi segni di difficoltà nei tempi di risposta:

“The global collection of Archie servers process approximately 50,000 queries per day, generated by a few thousand users worldwide. Every month or two of Internet growth requires yet another replica of Archie. A dozen Archie servers now replicate a continuously evolving 150 MB database of 2.1 million records. While it responds in seconds on a Saturday night, it can take five minutes to several hours to answer simple queries during a weekday afternoon”

Chiaramente l’ascesa del Web cambia completamente gli scenari e Archie lascia presto lo spazio ai nuovi search engine basata su indicizzazione automatica delle pagine. In particolare, però, ispira il lavoro di Martijn Koster che realizza ALIWEB (Archie-Like Indexing in the Web), fondamentale per lo sviluppo dei robot automatici di indicizzazione. Sempre nel 1993 compare anche JumpStation che introduce gli spider, consentendo agli utenti di cercare parole chiave nei titoli e nelle intestazioni delle pagine web.

JumpStation può essere considerato a tutti gli effetti il primo motore di ricerca in chiave moderna, anche se, dopo solo un anno, non era più in grado di stare al passo con la crescita esponenziale del Web.

Nel 1994 viene lanciato WebCrawler, più efficiente di JumpStation e in grado di analizzare l’intero contenuto della pagina, seguito da Lycos che aggiunge caratteristiche innovative come la scelta dei risultati in base alla similitudine con l’elemento cercato e l’ordinamento dell’elenco risultante in base alla rilevanza.

Primo logo di Lycos

Nel 1996 viene lanciato MetaCrawler il primo meta-motore di ricerca, in grado di utilizzare a sua volta altri motori di ricerca per effettuare le ricerche e poi elaborarne il risultato.

L’anno successivo entrano in scena David Filo e Jerry Yang, i due studenti della Stanford University che lanciano il famosissimo Yahoo, mentre all’incirca nello stesso periodo, si afferma Altavista, in grado di indicizzare milioni di pagine al giorno grazie al proprio spider.

David Filo e Jerry Yang

Ma la vera rivoluzione arriva verso la fine del 1997, quando viene lanciato quello che diventerà il Re dei motori di ricerca: stiamo chiaramente parlando di Google e del suo strabiliante “page ranking”.

Il resto è storia recente.

Top Comments: Leonardo Ascorti su Windows 8 e monodevice

Dall’elica a Mach1 – gli albori del volo supersonico

Sfoglia categorie

Programmazione

Genesi di un videogame ai tempi dell’Amiga: La lunga e tetra ora del tè dell’anima

Not always “big is better”: the importance of choosing data types – An example with CPython

Non sempre “big is better”: l’importanza della scelta dei tipi di dati – Un esempio con CPython

No, i limiti dell’HAM non sono svaniti!

L’abuso di assembly nuoce gravemente alla salute (mentale)

Amiga in modalità HAM: gioia per gli occhi, ma per pochi giochi

Non erano pigri certi sviluppatori Amiga che spremevano la macchina

Con Unity 3D è un gioco – Parte 2

Con Unity 3D è un gioco!

Genesi di un videogame ai tempi dell’Amiga: Verkosoft al Salvataggio!

Genesi di un videogame ai tempi dell’Amiga: La lunga e tetra ora del tè dell’anima

Not always “big is better”: the importance of choosing data types – An example with CPython

Da Archie a Google

Sfoglia categorie

Programmazione

Tag Clouds

Press ESC to close