Tecnología

Inicio

Cómo mejorar el rendimiento de recuperación por Relevancia Comentarios

Cómo mejorar el rendimiento de recuperación por Relevancia Comentarios


Los sistemas de recuperación de información (IR) funcionan como herramientas que consulta de entrada y cualquier información pertinente como salida. Un ejemplo de una IR moderno es el motor de búsqueda. El término "relevancia retroalimentación" se introdujo hace más de veinte años como una forma de denotar un proceso automático. El sistema desarrollado formulaciones de consulta implicados después de la puesta de recuperación. Tipos de retroalimentación relevancia pueden incluir lo que es explícita, implícita, y la pseudo o lo que puede ser categorizado como retroalimentación ciego. Los sistemas de recuperación de información se involucran sistemas de retroalimentación de relevancia con el fin de utilizar los resultados de determinadas consultas para evaluar su idoneidad general.

Instrucciones

1 Entender las dos técnicas IR comunes, utilizados por la mayoría de los sistemas modernos. El primero es el proceso resultante, que consiste en extraer los sufijos de las palabras de base. Por ejemplo, "ayudar", "asistido" y "ayudas" que todo ser referido como "ayudar". Los sistemas que utilizan derivados requeriría que todas las palabras ser detenidas antes de la indexación. La otra técnica IR común utiliza comúnmente encontrado palabras de los documentos utilizados en lo que se denominan "dejan de listas." Palabras como "y", "a" y "pero" generalmente comprenden la mayor parte de esa lista.

2 Evaluar y comparar los sistemas de infrarrojos para determinar cuál sería el mejor para el propósito. Mira precisión y la recuperación dentro de un conjunto dado de documentos recuperados. Determinar el nivel de porcentaje de precisión. Decidir el nivel de recordación por el porcentaje de documentos relevantes que fueron recuperados.

3 Aplicar otros aspectos de evaluación, tales como qué tan bien el sistema satisface la consulta, la rapidez con que satisface la consulta, lo que los recursos que requiere y lo fácil que es para los usuarios obtener respuestas.

4 Llevar a cabo experimentos utilizando diversos términos de búsqueda y cadenas de palabras en el IR. Tome nota de los tiempos de respuesta y los datos recuperados. Siga ajustando las palabras de términos de búsqueda en todo el experimento en diferentes RI. Revisar los registros para determinar qué RI funcionan mejor. Pruebe el estudio y la investigación de cómo los usuarios experimentados se adaptan las técnicas de búsqueda usando los sistemas de recuperación de motor de búsqueda en línea tradicionales. Tienen más usuarios nuevos encuentran maneras de incorporar nuevos términos de búsqueda en el mismo experimento. Incluir diferentes tipos de RI.

5 Crear un experimento en el que todos los sujetos de usuario tratan el mismo motor de búsqueda de recuperación exacta con el mismo grupo de documentos (por ejemplo, un grupo de artículos de un periódico). Tienen los usuarios a realizar las mismas búsquedas en contra de los mismos temas en los mismos intervalos de tiempo.

6 Comparación de los resultados de todos los experimentos realizados. Hacen rejillas, tablas y gráficos para mostrar los datos encontrados. Esto proporcionará una herramienta visual desde el que extraer información útil. Utilice el análisis de datos para determinar cómo los usuarios finales formados mínimamente pueden utilizar un sistema de base de reciente desarrollo de una manera razonablemente eficaz. Interpretar la retroalimentación pertinente con el fin de aumentar la eficacia global de recuperación. Optar por una mayor oportunidad de interacción con el usuario. Controlar la retroalimentación pertinente para que las interacciones más eficientes y mantener o aumentar la eficacia de la búsqueda de resultados.

Consejos y advertencias

  • Use un análisis detallado de los datos de comportamiento, tales como los comentarios de los usuarios, la edad y el género para que los resultados del experimento más rica y más específica.
  • Puede ser necesario llevar a cabo múltiples experimentos para determinar resultados procesables ya que a veces pueden existir limitaciones del mundo real.