Motor de búsqueda
Un 'motor de búsqueda es un sistema informático que indexa archivos almacenados en servidores web. Un ejemplo son los buscadores de Internet (algunos buscan sólo en la Web pero otros buscan además en News, Gopher, FTP, etc.) cuando se pide información sobre algún tema. Las búsquedas se hacen con palabras clave o con árboles jerárquicos por temas; el resultado de la búsqueda es un listado de direcciones Web en los que se mencionan temas relacionados con las palabras clave buscadas. Se pueden clasificar en dos:
- Índices temáticos: Son sistemas de búsqueda por temas o categorías jerarquizados (aunque también suelen incluir sistemas de búsqueda por palabras clave). Se trata de bases de datos de direcciones Web elaboradas "manualmente", es decir, hay personas que se encargan de asignar cada página web a una categoría o tema determinado.
- Motores de búsqueda: Son sistemas de búsqueda por palabras clave. Son bases de datos que incorporan automáticamente páginas web mediante "robots" de búsqueda en la red.
Como operan en forma automática, los motores de búsqueda contienen generalmente más información que los directorios. Sin embargo, estos últimos también han de construirse a partir de búsquedas (no automatizadas) o bien a partir de avisos dados por los creadores de páginas (lo cual puede ser muy limitativo). Los buenos directorios combinan ambos sistemas.
Clases de buscadores
Buscadores jerárquicos (Arañas o Spiders)
La mayoría de grandes buscadores internacionales de uso habitual y conocidos son de este tipo. Requieren muchos recursos para su funcionamiento. No están al alcance de cualquiera.
- Recorren las páginas recopilando información sobre los contenidos de las páginas. Cuando se busca una información en los motores, ellos consultan su base de datos y presentan resultados clasificados por su relevancia. De las webs, los buscadores pueden almacenar desde la página de entrada, a todas las páginas que residan en el servidor.
- Si se busca una palabra, por ejemplo, “ordenadores”. En los resultados que ofrecerá el motor de búsqueda, aparecerán páginas que contengan esta palabra en alguna parte de su texto.
- Si consideran que un sitio web es importante para el usuario, tienden a registrarlas todas. Si no la consideran importante, sólo almacenan una o más páginas.
- Cada cierto tiempo, los motores revisan las sitios, para actualizar los contenidos de su base de datos, por lo que no es infrecuente que los resultados de la búsqueda estén desactualizados.
- Los buscadores jerárquicos tienen una colección de programas simples y potentes con diferentes cometidos. Se suelen dividir en tres partes. Los programas que exploran la red -arañas (spiders)-, los que construyen la base de datos y los que utiliza el usuario, el programa que explota la base de datos.
- Si se paga se obtiene un bono que permitirá aparecer en las primeras páginas de resultados. Hasta el momento, aparentemente, esta forma de publicidad, es indicada explícitamente. Los buscadores jerárquicos se han visto obligados a este tipo de publicidad para poder seguir ofreciendo a los usuarios el servicio de forma gratuita.
Directorios
Una tecnología barata, ampliamente utilizada por gran cantidad de scripts en el mercado. No se requieren muchos recursos de informática. En cambio, se requiere más soporte humano y mantenimiento.
- Los algoritmos son mucho más sencillos, presentando la información sobre los sitios registrados como una colección de directorios. No recorren los sitios web ni almacenan sus contenidos. Solo registran algunos de los datos de nuestra página, como el título y la descripción que se introduzcan al momento de registrar el sitio en el directorio.
- Los resultados de la búsqueda, estarán determinados por la información que se haya suministrado al directorio cuando se registra sitio. En cambio, a diferencia de los motores, son revisadas por operadores humanos, y clasificadas según categorías, de forma que es más fácil encontrar páginas del tema de nuestro interés.
- Más que buscar información sobre contenidos de la página, los resultados serán presentados haciendo referencia a los contenidos y temática del sitio.
- Su tecnología es muy barata y sencilla.
Ejemplos de directorios: Antiguos directorios, Open Directory Project, Yahoo!, Terra (Antiguo Olé). Ahora, ambos utilizan tecnología de búsqueda jerárquica, y Yahoo! conserva su directorio. Buscar Portal, es un directorio, y la mayoría de motores hispanos son directorios.
Mixtos Buscador - Directorio
Además de tener características de buscadores, presentan los sitios web registrados en catálogos sobre contenidos, por ejemplo informática, cultura, sociedad y a su vez se dividen en subsecciones.
Permite lanzar varias búsquedas en motores seleccionados respetando el formato original de los buscadores. lo que hacen, es realizar busquedas en auténticos buscadores, analizan los resultados de la página, y presentan sus propios resultados.
FFA - Enlaces gratuitos para todos
FFA (acrónimo del inglés "Free For All"), página de enlaces gratuitos para todos. Cualquiera puede inscribir su página durante un tiempo limitado en estos pequeños directorios. Los enlaces no son permanentes.
Buscadores de Portal
Bajo este título se engloban los buscadores específicos de sitio, aquellos que buscan información solo en su portal o sitio web, y podrían ser considerados como un directorio.
Buscadores verticales
Buscadores especializados en un sector concreto, lo que les permite analizar la información con mayor profundidad, disponer de resultados más actualizados y ofrecer al usuario herramientas de búsqueda avanzadas.
Historia
El primer buscador fue "Wandex", un índice (ahora desaparecido) realizado por la World Wide Web Wanderer, un robot desarrollado por Mattew Gray en el MIT, en 1993. Otro de los primeros buscadores, Aliweb, también apareció en 1993 y todavía está en funcionamiento. El primer motor de búsqueda de texto completo fue WebCrawler, que apareció en 1994. A diferencia de sus predecesores, éste permitía a sus usuarios una búsqueda por palabras en cualquier página web, lo que llegó a ser un estándar para la gran mayoría de los buscadores. WebCrawler fue también el primero darse a conocer ampliamente por el público. También apareció en 1994 Lycos (que comenzó en la Carnegie Mellon University).
Muy pronto aparecieron muchos más buscadores, como Excite, Infoseek, Inktomi, Northern Light y Altavista. De algún modo, competían con directorios (o índices temáticos) populares tales como Yahoo!. Más tarde, los directorios se integraron o se añadieron a la tecnología de los buscadores para aumentar su funcionalidad.
Antes del advenimiento de la Web, había motores de búsqueda para otros protocolos o usos, como el buscador Archie, para sitios FTP anónimos y el motor de búsqueda Verónica, para el protocolo Gopher.
En la actualidad se aprecia una tendencia por parte de los principales buscadores de internet a dar el salto hacia entornos móviles creando una nueva generación de buscadores: los buscadores móviles
Google
Alrededor de 2001, el buscador Google adquirió prominencia. Su éxito estaba basado en parte en el concepto de popularidad basado en PageRank, bajo la premisa de que las páginas más deseadas eran más enlazadas por otras páginas que el resto. Esta idea permitió a Google disponer las páginas de una determinada búsqueda en función de su importancia, basada en este algoritmo, esto es, las páginas más enlazadas por otras páginas se mostraban en primer lugar. La interfaz minimalista de Google se hizo muy popular entre los usuarios y desde entonces ha tenido un gran número de imitadores
Google y muchos otros buscadores no sólo usaban PageRank, sino más de 150 criterios para determinar la pertinencia de una página.
Virgilio.it
Buscador Italiano que sirve para buscar también en español. Potente y con un interfaz agradable.
Yahoo Search
En 2004, Yahoo! lanzó su propio buscador basado en una combinación de tecnologías de sus adquisiciones y proporcionando un servicio en el que ya prevalecía la búsqueda en Webs sobre el directorio.
Microsoft
El más reciente de los grandes buscadores es Live (antes MSN Search), de Microsoft, que previamente dependía de otros para listar sus búsquedas. En 2004 debutó una versión beta con sus propios resultados, impulsada por su propio robot (llamado msnbot). Al principio de 2005 comenzó la versión definitiva.
El mercado está ahora dominado por Google, Yahoo y Microsoft. El resto de grandes buscadores tienden a ser portales que muestran los resultados de otros buscadores y ofrecen, además, otro tipo de contenidos que tienen mayor o menor importancia en la página como hace el propio Yahoo!
Noxtrum
Noxtrum es el primer motor de búsqueda global diseñado por una empresa española, Telefónica Publicidad e Información, S. A. (TPI), lanzado al mercado en versión Beta el 1 de diciembre de 2005. Búsquedas en internet del mundo hispanohablante, y para ello está especializado en las búsquedas locales, actualmente sólo operativas en España.
Noxtrum parte de la implementación de FAST para construir su propio motor de búsqueda, con lo que realmente no cuenta con tecnología de búsqueda propia, sino que adapta al español la tecnología usada en su día por navegadores como AllTheWeb, hoy propiedad de Yahoo.
Nutch
Nutch es un buscador basado en tecnología de código abierto.
Rollyo
Es un buscador no muy completo pero sirve para diversas busquedas, sus páginas la mayoría son en inglés, amenos que tu busqueda la especifiques en español, es un buscador donde puedes encontrar varias páginas donde está tu información, cuenta con links directos a las páginas de interés donde se localiza lo que buscas, es efectivo para busquedas precisas.
Ask
Ask es un buscador donde puedes (como dice su nombre en inglés "ask" es preguntar) preguntar por lo que estas buscando, ya sea que busques la respuesta a una duda o que simplemete quieres encontrar un archivo concreto. |