Portada » Otras materias » Optimizando la Recuperación de Información: Metadatos, Técnicas y Calidad
Los metadatos en la navegación y recuperación de información se utilizan para detectar información relevante de una forma rápida y eficaz. Las etiquetas describen el contenido del recurso web, que posteriormente utilizan las herramientas de búsqueda para localizar y acceder al recurso. Principalmente son las etiquetas de palabra clave y título las que dan paso a localizar el documento.
Sistemas de recuperación de lógica difusa:
Esta técnica permite establecer consultas con frases normales, de forma que la máquina al realizar la búsqueda elimina signos de puntuación, artículos, conjunciones, plurales, tiempos verbales, palabras comunes (que suelen aparecer en todos los documentos), dejando sólo aquellas palabras que el sistema considera relevantes. La recuperación se basa en proposiciones lógicas con valores de verdadero y falso, teniendo en cuenta la localización de la palabra en el documento.
Técnicas de ponderación de términos:
Es común que unos criterios en la búsqueda tengan más valor que otros, por tanto, la ponderación pretende darle un valor adecuado a la búsqueda dependiendo de los intereses del usuario. Los documentos recuperados se encuentran en función del valor obtenido en la ponderación. El valor depende de los términos pertinentes que contenga el documento y la frecuencia con que se repita. De forma que, el documento más pertinente de búsqueda sería aquel que tenga representado todos los términos de búsqueda y además el que más valor tenga repetidos más veces, independientemente de donde se localice en el documento.
Técnica de clustering:
Es un modelo probabilístico que permite las frecuencias de los términos de búsqueda en los documentos recuperados. Se atribuyen unos valores (pesos) que actúan como agentes para agrupar los documentos por orden de importancia, mediante algoritmos ranking.
Técnicas de retroalimentación por relevancia:
Esta técnica pretende obtener el mayor número de documentos relevantes tras establecer varias estrategias de búsqueda. La idea es que, tras determinar unos criterios de búsqueda y observar los documentos recuperados se vuelva a repetir nuevamente la consulta, pero esta vez con los elementos interesantes, seleccionados de los documentos primeramente recuperados.
Técnicas de stemming: Morfológicamente las palabras están estructuradas en prefijos, sufijos y la raíz. La técnica de Stemming lo que pretende es eliminar las posibles confusiones semánticas que se puedan dar en la búsqueda de un concepto, para ello trunca la palabra y busca solo por la raíz.
A continuación, se presentan unos criterios básicos para que la recuperación llevada a cabo sea de calidad.
Relevancia: Característica de un documento recuperado que cumple con la necesidades de información.
Precisión: Es la capacidad que tiene el sistema de búsqueda en coordinar la ecuación con los documentos más relevantes. De otra forma, son aquellos documentos relevantes recuperados.