Que hay otra parte -unas 9 veces mayor- a la que normalmente no podemos acceder; la WEB profunda.
Podríamos pues definir la WEB superficial como todos sitios cuya información puede ser indexada por los robots de búsqueda convencionales.
Esto quiere decir que son sitios de libre acceso, no contenida en base de datos, no hace falta registrarse para acceder y mayoritariamente con páginas estáticas, es decir, con una URL fija a lo largo del tiempo.
Sin embargo, la WEB profunda o invisible -aunque algunos autores como Lluis Codina prefieren el término "no indizable"- no es accesible desde un buscador convencional, ya que los resultados generalmente no tienen una URL fija, son temporales y se generan en el mismo momento que son pedidos mediante páginas dinámicas.
Podemos identificar cuatro tipos de contenidos invisibles:
- La WEB opaca: Archivos no incluidos en los índices de los buscadores por diferentes motivos -frecuencia de indización, economía, exceso del número máximo de resultados visibles, enlaces desconectados, etc-
- La WEB privada: Páginas excluidas deliberadamente por tener contraseñas, contienen alguna solución técnica para no ser indizadas ("robots.txt" o "noindex").
- La WEB propietaria: Páginas en las que es preciso registrarse previamente. Pueden o no ser gratuitas.
- La WEB realmente invisible: Debido a limitaciones técnicas de los buscadores, hay páginas que no pueden ser indizadas. Son páginas dinámicas (se generan a partir de una petición del usuario).
No obstante, hay algunos recursos muy útiles para ayudarnos a realizar busquedas en la WEB profunda:
- WWW Vitual Library. Es el catálogo mas antiguo de la WEB. http://vlib.org/
- Infoplease. WEB de consulta de la enciclopedia Columbia. Puede buscar biografías y efemérides de una fecha concreta (Biosearch). http://www.infoplease.com/
- DeepWebTech. Con sus 5 motores de búsqueda por temas concretos. http://www.deepwebtech.com/
- TechXtra. Ingeniería, matemáticas e informática. Incluye también revistas especializadas, descargas y podcast. http://www.techxtra.ac.uk/


Buen trabajo.
ResponderEliminar