Dime cómo planteas tu problema, y te diré qué tan difícil es

June 6, 2022 Daniel Gacitúa

Daniel Gacitúa, InTeractiOn Lab, Departamento de Ingeniería Informatica, Universidad de Santiago de Chile

Muchas veces a la hora de plantear una consulta en un motor de búsqueda web nos enfrentamos con el dilema de no saber cómo verbalizar la necesidad de información que deseamos resolver. Encontrar las palabras correctas para recibir los resultados deseados se puede volver una tarea difícil, y hasta frustrante, donde muchas veces los resultados parciales obtenidos no satisfacen nuestras necesidades de información (Feild et al., 2010).

—Encontrar las palabras correctas para recibir los resultados deseados se puede volver una tarea difícil, y hasta frustrante—

Existen dos conceptos esenciales que predominan en este problema (Li & Belkin, 2008; Wildemuth et al., 2014): La complejidad (inherente a la tarea de búsqueda en sí, por ende, objetiva) y la dificultad (apreciación del usuario respecto al esfuerzo que le implica resolver una tarea de búsqueda, por ende, subjetiva). Este trabajo se centra en el segundo concepto.

Generalmente cuando estamos realizando una tarea de búsqueda que puede ser considerada difícil, tendemos a tener comportamientos que muestran esta característica (Kuhlthau, 1991), como puede ser realizar más consultas de búsqueda, un aumento en el número de reformulaciones en la consulta, visitar más documentos en la página de resultados de búsqueda (SERP) y pasar más tiempo revisando los documentos visitados, entre otros. Si bien estos comportamientos pueden ser identificados por un observador humano, existe un campo de investigación relacionado con la detección de la dificultad de la tarea de búsqueda de forma automatizada.

Predecir la dificultad de una tarea de búsqueda: ¿Cómo y cuándo?

Una pregunta interesante que surge en este campo es cómo lograr determinar la dificultad de manera oportuna. Esto depende de los comportamientos considerados para hacer la predicción y resulta importante para los usos que se le puede dar al modelo predictivo que se genera.

La literatura actual sobre este campo se centra en la predicción de la dificultad de la tarea en las acciones tras ser enviada la consulta al motor de búsqueda, principalmente buscando patrones en los tiempos de permanencia y cantidad de acciones realizadas (visitas, marcadores y clicks, entre otros) en los SERPs y documentos visitados.

Como parte del laboratorio InTeractiOn, estamos estudiando formas de determinar la dificultad de una tarea de búsqueda de manera oportuna. Una de las estrategias con la que hemos estado experimentando se focaliza en aquellos comportamientos que se exhiben antes de enviar la consulta al motor de búsqueda. Específicamente, nos focalizamos en aquellos comportamientos que emergen durante la escritura de una consulta en la caja de búsqueda. Comportamientos como la velocidad de tipeo, la cantidad de reformulaciones, la cuenta de palabras y stopwords en la consulta, entre otros. Para realizar esta predicción empleamos algoritmos de aprendizaje de máquina ampliamente usados en la literatura (Naïve Bayes, Random Forest, SVM, Redes Neuronales, entre otros), en base a características propias del ritmo de tipeo (conocido como Keystroke Dynamics) y los comportamientos recién descritos.

El objetivo de este trabajo es realizar la predicción de la dificultad de la tarea antes de inicializar una nueva consulta, solo con las características que se puedan obtener durante la formulación de la consulta, con el fin de alcanzar rendimiento en la predicción similar a los modelos detallados en la literatura (que utilizan los comportamientos después de formular la consulta).

¿Qué potenciales usos tendría la predicción oportuna de la dificultad de una tarea de búsqueda?

Uno de los principales usos de conocer la dificultad de una tarea de búsqueda, es el poder desplegar sistemas de ayuda y asistentes virtuales para facilitar la búsqueda cuando ésta es difícil (Capra et al., 2015). Otros usos se pueden ver en el campo de la educación, donde se pueden emplear motores de búsqueda personalizados implementando estos modelos predictivos con el fin de que el docente sepa si sus estudiantes están experimentando problemas a la hora de recolectar información para satisfacer sus necesidades o completar las tareas propuestas. Con nuestro trabajo, al tener la predicción antes que los modelos actuales, se puede ofrecer retroalimentación de manera más oportuna al proceso de búsqueda del usuario, disminuyendo su carga cognitiva y frustración durante la realización de ésta.

Otra de las ventajas de estos modelos de predicción es que no requieren hardware adicional por parte del usuario, usando en la captura de datos unicamente tecnologías de software implementables directamente en el navegador web, y realizando peticiones al servidor web para llevar a cabo la predicción.

Desafíos y oportunidades

Los motores de búsqueda web no siempre consideran variables cognitivas (como la dificultad de la tarea) o de comportamiento (como las acciones explícitas del usuario) como parte del proceso de búsqueda. Esto implica que se pierde una oportunidad importante de dar retroalimentación al usuario en base a estas variables con el fin de mejorar su experiencia de búsqueda y permitirle satisfacer de mejor manera sus necesidades de información. Uno de los desafíos pendientes en esta área es dar a conocer a los investigadores y diseñadores de sistemas de búsqueda web este tipo de modelos predictivos, junto con sistemas de ayuda que permitan apoyar de mejor manera la ejecución de tareas de búsqueda percibidas como difíciles.

Referencias

Capra, R., Arguello, J., Crescenzi, A., & Vardell, E. (2015). Differences in the use of search assistance for tasks of varying complexity. In Proceedings of the 38th international ACM SIGIR conference on research and development in information retrieval (pp. 23-32).

Feild, H. A., Allan, J., & Jones, R. (2010). Predicting searcher frustration. In Proceedings of the 33rd international ACM SIGIR conference on Research and development in information retrieval (pp. 34-41).

Kuhlthau, C. C. (1991). Inside the search process: Information seeking from the user’s perspective. Journal of the American society for information science, 42(5), 361-371.

Li, Y., & Belkin, N. J. (2008). A faceted approach to conceptualizing tasks in information seeking. Information processing & management, 44(6), 1822-1837.

Cite this article in APA as: Gacitúa, D. (2022, June 30). Dime cómo planteas tu problema, y te diré qué tan difícil es. Information Matters, Vol. 2, Issue 6. https://informationmatters.org/2022/06/dime-como-planteas-tu-problema-y-te-dire-que-tan-dificil-es/