Ultime Notizie

mercoledì 13 gennaio 2010

Web Invisibile - I motori di ricerca sono inefficaci?

Molti internauti inesperti pensano ingenuamente di essere in grado di accedere a qualsiasi contenuto presente in rete utilizzando i maggiori motori di ricerca come Google o Yahoo. La potenza di questi strumenti è notevole, nessuno lo mette in dubbio, ma molti non sanno che l'indice dei motori di ricerca copre meno del 10% del contenuto totale del Web! Il restante 90% è chiamato il "Web Invisibile", o in altre parole, "Web Cloaked" o "The Deep Web". Questo è il contenuto di massa che è a disposizione del pubblico, ma nascosto dai motori di ricerca.

In effetti, questo è un concetto difficile da afferrare. La realtà è però che miliardi di pagine web non possono essere trovate da Google. Miliardi di pagine sono al di là della capacità del motore di ricerca. I famosi "spiders" che scansionano e catalogano il world wide web sono limitati e non possono vedere tutto.

Iniziamo a dare qualche numero:
  • indici Google.com: 20,5 miliardi le pagine web pubbliche.
  • 80 miliardi di pagine web statiche sono pubblicamente disponibili. Queste pagine possono essere facilmente trovate da Google e altri motori di ricerca.
  • 9,5 miliardi le pagine statiche sono nascoste al pubblico. Come contenuto intranet private, queste sono le pagine aziendali, che sono aperte solo ai lavoratori dipendenti di imprese specifiche.
  • 300 miliardi di pagine di database sono completamente invisibili a Google. Queste pagine invisibili non sono le normali pagine web. Si tratta di database dinamici che esistono solo quando vengono "chiamati" tramite comandi specifici.
Google, considerato il miglior database di ricerca di oggi, può catalogare solo una frazione del contenuto sopra citato. Gli indici di Google in corso coprono 12,5 miliardi di pagine dei 220 miliardi di pagine esistenti ed in aumento. Stiamo parlando del 6% scarso di tutti i contenuti disponibili su internet.

Google copre solo il 6% del World Wide Web, gli altri motori di ricerca ancora meno, allora dove è il restante 90% di contenuti web nascosto?
« PREV
NEXT »