viernes, 13 de noviembre de 2015

Web Superficial y la Web Profunda

La Web Superficial o visible
La Web Superficial comprende todos aquellos sitios cuya información puede ser indexada por los robots de los buscadores convencionales y recuperada casi en su totalidad mediante una consulta en sus formularios de búsqueda.
Las características principales de los sitios de la Web visible son:
  • su información no está contenida en bases de datos.
  • es de libre acceso.
  • no se requiere la realización de un proceso de registro para acceder a la información.
  • mayoritariamente está formada por páginas Web estáticas, es decir páginas o archivos con una URL fija y accesibles desde otro enlace.

La Web Profunda o invisible
Web invisible es el término utilizado para describir toda la información disponible en Internet que no se recupera interrogando a los buscadores convencionales. Generalmente es información almacenada y accesible mediante bases de datos.
Parte de la información es "invisible" a los robots de los buscadores convencionales, ya que los resultados se generan en la contestación a una pregunta directa mediante páginas dinámicas (ASP,PHP, etc.) es decir páginas que no tienen una URL fija y que se construyen en el mismo instante (temporales) desapareciendo una vez cerrada la consulta.

Sherman y Price identifican cuatro tipos de contenidos invisibles en la Web: la Web opaca (the opaque Web), la Web privada (the private Web), la Web propietaria (the proprietary Web) y la Web realmente invisible (the truly invisible Web).

herramientas de búsqueda

Buscadores:
Los buscadores o motores de búsqueda utilizan tipos de software especiales que localizan e indexan, en forma automática, las páginas Web y además todos los documentos referenciados en ellas.

  • Un buscador está compuesto por cuatro componentes básicos:
  • un robot,
  • un motor de indexación,
  • los índices
  • un motor de búsqueda

El robot, también llamado spider, es un programa que se encarga de recorrer la Web obteniendo información relevante, de cada una de las páginas que visita.
Una vez obtenida la información de la página, debe ser analizada y condensada, para su organización y su posterior presentación a los usuarios. Esta tarea la realiza el denominado motor de indexación.

Entre los buscadores más importantes se encuentran:

  • Google (http://www.google.com): el más utilizado.
  • Lycos (http://www.lycos.com/):un portal web que incluye un buscador.
  • que surgió como un proyecto de desarrollo de un motor de búsqueda.
  • Bing (http://www.bing.com/): anteriormente Live Search, Windows Live Search y MSN Search, es un buscador Web de Microsoft.

    Metabuscadores

    Los metabuscadores son “buscadores en buscadores”, es decir, son servidores web que realizan búsquedas en los índices de un gran número de buscadores y/o directorios, eliminan las duplicaciones y nos presentan un resumen de los resultados obtenidos, ordenados por relevancia y, en algunos casos, nos indican cuál ha sido el buscador de origen de dicha información.
    Cada uno de los motores de búsqueda de los metabuscadores funciona de una manera distinta, aunque existe un proceso interno común a todos ellos.
    Los pasos en el funcionamiento de un metabuscador son los siguientes:
    • El usuario realiza su petición al metabuscador.
    • El metabuscador da formato a dicha petición de acuerdo a la interfaz de cada uno de los buscadores y les pasa la solicitud.
    • Los buscadores realizan la búsqueda utilizando sus medios habituales a partir de los sitios web en Internet.
    • Éstos devuelven la información obtenida al metabuscador, el cual analiza los datos.
    • El metabuscador organiza la información de acuerdo a los criterios del mismo y se la muestra al usuario.

    Podría decirse entonces que el metabuscador aporta resultados seleccionados y ordenados mediante puntos de vista distintos y su ventaja principal es que amplía el ámbito de las búsquedas que realizamos.

     Directorios:
    directorios más importantes se encuentran:

    Yahoo (http://ar.search.yahoo.com/) El equipo de Yahoo! se encargan de visitar, analizar y evaluar los sitios web y organizarlos según su contenido en categorías y/o subcategorías, como por ejemplo Educación y Formación, Salud, Gastronomía, Viajes, etc... como si de una gran biblioteca virtual se tratase.
    Las categorías del Directorio van de lo general a lo más específico.

    DMOZ (http://www.dmoz.org/World/Español/) El Open Directory Project (ODP),
    también conocido como DMoz (por directory.mozilla.org su nombre de dominio original) es un proyecto colaborativo multilingüe, en el que editores voluntarios listan y categorizan enlaces a páginas web.
    Cualquier persona puede sugerir un enlace en una categoría determinada, que luego ha de ser aprobada por un editor El proyecto está dividido en varias ramas según el idioma, y las categorías de páginas se organizan jerárquicamente dentro de cada una de las ramas.

    Portal SEO (http://www.portal-seo.com/directorio-web.php) Dedicado al SEO (Search Engine Optimization) es decir al posicionamiento en buscadores u optimización en motores de búsqueda, un proceso que bu
    sca mejorar la visibilidad de un sitio web en los resultados orgánicos de los diferentes buscadores.

    Excite (http://www.excite.com/) Es una colección de sitios y servicios web, lanzado en diciembre de 1995. Ofrece una gran variedad de contenido, incluyendo un portal de Internet que muestra noticias y el tiempo, etc., incluye además un motor de búsqueda, un servicio de correo electrónico basado en la web, mensajería instantánea, cotizaciones de bolsa, y una página de inicio personalizable por el usuario.

    Recordar tambien

    guías temáticas y Software especializado


Mi nombr es Marce Alegre
 infoxicación
Se denomina infoxicación o sobrecarga informacional a la situación de tener más información de la que podemos procesar.
La posibilidad de acceder a gran cantidad de información es una de las grandes virtudes de Internet, pero a la vez es un problema, ya que tanta información desestructurada se vuelve incontrolable.
La “sobrecarga informativa” (information overload) es una expresión que acuñó Alvin Toffler en su libro “Future Shock” (1970) y hace referencia al estado de contar con demasiada información para tomar una decisión o permanecer informado sobre un determinado tema.

Ante una gran cantidad de información para analizar, o contradicciones en la información disponible, o no disponemos de un método para comparar y procesar diferentes tipos de información, estamos frente a una “infoxicación”.
Este último término, introducido por Alfons Cornella en 1996, refiere actualmente a la idea de que la sobrecarga de información que recibe un usuario, en especial de Internet en todas sus formas, puede causarle la sensación de no poder abarcarla ni gestionarla y, por tanto, llegar a generarle una gran angustia.

Este término, infoxicación,surge de la unión de las palabras información e intoxicación.
José Ignacio Aguaded Gómez, en su artículo "Desde la infoxicación al derecho a la comunicación"
expresa:
"Asistimos, sin duda, a una hiper conexión compulsiva y una sobre información global, a una obsesión por la comunicación perpetua vacía de contenidos... La infoxicación, la infopolución... se ha hecho realidad en nuestras vidas".

En una entrevista realizada al escritor italiano Humberto Eco le preguntaron lo siguiente:

"A pesar de la evolución, ¿ve Internet como un peligro para el conocimiento?"
y parte de su respuesta fue:
"Internet es todavía un mundo salvaje y peligroso. Todo llega allí sin jerarquía. La inmensa cantidad de cosas que circula es peor que la falta de información.
El exceso de información provoca amnesia.
El exceso de información es malo".

Los problemas derivados de la sobre información pueden afectar nuestro rendimiento personal y profesional.
Si prestamos demasiada atención a una gran cantidad de información de manera sostenida en el tiempo y no finalizamos una tarea para continuar con otra diferente, esto dificulta la desconexión de la mente,y la obliga a realizar un sobreesfuerzo.

Es por esto que, debemos reflexionar acerca de cómo nos informamos y qué métodos y herramientas utilizamos para gestionar la información.