recuperacion y organizacion de la informacion

Recuperacion y Organizacion de la Informacion

Arquitectura de bbdd para buscadores web

Recuperacion y organizacion de la informacion

documento doc documento pdf

Para realizar de forma eficiente debemos de realizar una indexación de la información de la bases de datos. Anteriormente se podría haber guardado la información como datos dentro de un modelo relacional.

En los principios de los buscadores, sus bases de datos estaban indexadas por los nombres de las páginas. Esto se vió claramente que eran totalmente ineficientes, puesto que se penalizaban al realizar las búsquedas.

Actualemente, los índices que se utilizan son las palabras, las cuales enlazan a las páginas que las contienen. Dependiendo del algoritmo de búsqueda, el buscador devolverá unos resultados y otros.

arquitectura bbdd web 

Como se puede observar en la figura, se podrán realizar las búsquedas por palabras, las cuales estan enlazadas con una serie de urls. Además, se podrá añadir información adicional para el algoritmo de búsqueda.

Sin embargo, no todos los índice se basan únicamente en las palabras, sino que se tienen en cuenta la categoría de la página. Este es el caso del directorio yahoo, dmoz... Aquí se realizan las búsquedas en una categoría definida, lo que restringe el número de resultados.

Pagina creada por Marco Antonio Sanz Molina-Prados email:100030224@eresmas.com

Fecha ultima actualizacion: 27de Abril de 2.006

CSS Valido Valid XHTML 1.0 Strict Icono de conformidad con el Nivel Triple-A, de las Directrices de Accesibilidad para el Contenido Web 1.0 del W3C-WAI Test de accesibilidad web versión 3 Google Sitemap Rdf for foaf [Valid Atom 1.0]

FOAF RSS 10 RSS 20 [Valid RSS] [Valid RSS]