Recuperacion y Organizacion de la InformacionArquitectura de bbdd para buscadores web |
| Principal | Indexación | arquitectura |
|---|
Para realizar de forma eficiente debemos de realizar una indexación de la información de la bases de datos. Anteriormente se podría haber guardado la información como datos dentro de un modelo relacional.
En los principios de los buscadores, sus bases de datos estaban indexadas por los nombres de las páginas. Esto se vió claramente que eran totalmente ineficientes, puesto que se penalizaban al realizar las búsquedas.
Actualemente, los índices que se utilizan son las palabras, las cuales enlazan a las páginas que las contienen. Dependiendo del algoritmo de búsqueda, el buscador devolverá unos resultados y otros.
Como se puede observar en la figura, se podrán realizar las búsquedas por palabras, las cuales estan enlazadas con una serie de urls. Además, se podrá añadir información adicional para el algoritmo de búsqueda.
Sin embargo, no todos los índice
se basan únicamente en las palabras, sino que se tienen en cuenta
la categoría de la página. Este es el caso del directorio
yahoo, dmoz... Aquí se realizan las búsquedas en una categoría
definida, lo que restringe el número de resultados.
Pagina creada por Marco Antonio Sanz Molina-Prados email:100030224@eresmas.com
Fecha ultima actualizacion: 27de Abril de 2.006