Il mondo di Internet è immenso: milioni di pagine Web, database e server attivi 24 ore al giorno, 7 giorni su 7. Tuttavia, il cosiddetto “Internet visibile”, termine che si riferisce a siti che possono essere trovati attraverso motori di ricerca come Google e Yahoo, rappresenta solo la punta dell’iceberg. Al di sotto della superficie si trova il dark Web, che comprende circa il 90% di tutti i siti Web. In realtà, questa rete è talmente ampia che risulta impossibile scoprire esattamente quante pagine o siti siano attivi contemporaneamente. Il dark Web costituiva una volta la specialità degli hacker, degli agenti delle forze dell’ordine e dei criminali. Tuttavia, l’avvento di nuove tecnologie quali la crittografia e l’anonimizzazione del software dei browser, Tor, ha fatto sì che chiunque potesse navigare nella parte “nascosta” del Web, se lo desiderasse.
Cosa si trova
La mole incredibilmente vasta di contenuti documenti e informazioni presenti sul web sommerso sono divisibili in precise categorie. Vediamo quali.- Contenuti dinamici, ossia quelle pagine web dinamiche il cui contenuto è generato al momento dal server e che sono richiamabili solo compilando un form o come risposta ad una particolare richiesta.
- Pagine non collegate, ossia quelle pagine web non collegate ad altre: se l’accesso non viene impedito attraverso impostazioni di sicurezza, il motore di ricerca indicizza la parent directory del sito, che contiene le pagine visibili e tutto ciò che è caricato nel server ospitante.
- Pagine ad accesso ristretto, cioè quei siti che chiedono una registrazione o limitano l’accesso alle proprie pagine, così che i motori di ricerca non possano accedervi.
- Script, quindi pagine raggiungibili solo tramite link in JavaScript o Flash, che richiedono procedure d’accesso particolari.
- Contenuti non testuali, quali file multimediali, documenti in linguaggio non HTML, archivi Usenet, non collegati a tag testuali; alcuni motori di ricerca, come Google ad esempio, però, sono in grado di rintracciare file del genere.
- Contenuti illegali estromessi dai normali motori di ricerca, come siti pedopornografici, snuff, commercio e produzione di droghe, commercio e produzione illegali di armi, siti sottoposti a censura governativa, siti warez e malware.
- Software speciali, come Tor, I2P o altri darknet software, che consentono l’accesso a contenuti nascosti intenzionalmente ad internet e accessibili solo tramite software appositi.