Aparte de desvirtualizar a @FernandoCheca he pasado un par de días en la UEM por el interés que, a priori, podía despertar la visita de Andreas Nürnberger, que aprovechaba para cumplir con sus anfitriones impartiendo un breve taller sobre la "recuperación" de información multimedia.
El Workshop resultó muy básico y dedicó su segunda mitad a un buen repaso del MPEG-7 muy útil para cualquier recién llegado a este campo de investigación.
Lo que realmente resultaba más interesante era ver cómo se dibujaba hoy, a la luz de tantísimo revuelo alrededor de la Web 2.0, el escenario de la interacción con un usuario supuestamente mucho más activo y responsable de la generación de un número y tipo creciente de contenido cada vez más rico. Intentaré ordenar mis notas mentales de forma que provean de un contexto más o menos consistente a las dudas que me surgen pensando en este particular.
El planteamiento básico del problema de las búsquedas nos enfrenta a una situación en la que se encuentran los documentos web, organizados en colecciones y un usuario que necesita encontrar y recuperar uno solo en concreto con la información que necesita, la que es "relevante" para él o ella. La pregunta que motiva el interés por el desarrollo de esta disciplina (Information Retrieval, IR) es si es suficiente con la búsqueda de palabras clave en Google, por ejemplo.
Normalmente los sistemas automáticos se suelen clasificar, siguiendo un cierto orden de complejidad creciente, en Document Retrieval Systems, Information Retrieval Systems y Question Answering Systems, que se han trabajado durante mucho tiempo en el ámbito del procesado del lenguaje natural (Natural Language Processing, NLP) y que ya hacen sus pinitos en el renovado entorno de los motores de búsqueda con iniciativas como Wolfram Alpha.
El caso es que el proceso que todos conocemos --consulta + recuperación del documento en cuestión + evaluación de la bondad del resultado- ha cambiado: se ha convertido en un proceso interactivo en el que interviene (de forma explícita y/o implícita) el usuario que realizara la consulta inicial; de tal manera que el sistema en su conjunto se convierte en una herramienta para la "provisión del conocimiento".
Si nos situamos en un contexto de Web Social, lo primero que a uno se le ocurre es introducir la capacidad de cooperación colectiva en alguno de los elementos de ese esquema clásico: ¿Por qué no pensar en un sistema de recomendación de filtrado cooperativo en red como elemento para el ajuste fino del proceso, introduciendo la realimentación del usuario? Lo normal es que los sistemas más modernos consideren ya un modelo de comportamiento del usuario, así como información de contexto, especialmente útil en entornos de movilidad, cada vez más habituales; de la misma forma las interfaces se vuelven más complejas, integrando la estructuración y visualización de los resultados de las consultas lanzadas a la base de datos.
De hecho, si uno se plantea el problema básico de la búsqueda textual, basada en la identificación de palabras clave (text-based retrieval), lo siguiente es pensar en la búsqueda por contenidos, donde las consultas se hacen sobre la base de algunos ejemplos (content-based retrieval)... Parece natural que la evolución lógica será la recuperación de información basada en el contexto (context-based retrieval).
Aparte de la broma (context = content + text) la idea podría tener todo su sentido ¿Por qué no podemos sugerir diferentes niveles de "recomendación" dentro del proceso de "recuperación"? Pensemos en la máxima KISS (soluciones TOntas a Problemas Estúpidos, TOPE) que aplica en el caso de OpenID, por ejemplo; es decir ¿Para qué me voy a preocupar de garantizar quién es quién si el escenario no lo requiere?
Es más, ¿Por qué no podemos replantear el problema de la "recuperación" de información o la "recomendación" de servicios/contenidos/personas como un problema de conectividad social? Siempre hemos dicho que lo importante no es saber algo, sino tener el número de teléfono de quien lo sabe. Desde el punto de vista del sesudo investigador que destila estas palabras [risas de fondo] este tipo de planteamientos nos podría llevar a plantear un escenario nuevo en que utilizamos el grafo social de cualquier comunidad --de la Web, o la Red por extensión- para convertir el problema de la búsqueda, localización y extracción (recuperación) de información en uno distinto para la localización del "proxi" social --si es que la acepción del término nos lo permite- que nos lleve a ese contenido/persona o servicio.
La cuestión es que, en un campo más afín, desde el punto de vista ortodoxo, como es el de los sistemas de recomendación, se ha avanzado en cierto sentido en esa dirección: a partir de los sistemas de filtrado cooperativo pensados para contenido y servicios, por ejemplo, se ha comenzado a recomendar personas, con el problema evidente de las métricas de reputación y confianza, así como la propia definición de la identidad online. Quizás tengamos que volver a las bases del análisis de redes sociales para redefinir el problema de la recomendación --y el de la recuperación- de "cosas" a partir de la recomendación o búsqueda de personas en una red (social).
El Workshop resultó muy básico y dedicó su segunda mitad a un buen repaso del MPEG-7 muy útil para cualquier recién llegado a este campo de investigación.
Lo que realmente resultaba más interesante era ver cómo se dibujaba hoy, a la luz de tantísimo revuelo alrededor de la Web 2.0, el escenario de la interacción con un usuario supuestamente mucho más activo y responsable de la generación de un número y tipo creciente de contenido cada vez más rico. Intentaré ordenar mis notas mentales de forma que provean de un contexto más o menos consistente a las dudas que me surgen pensando en este particular.
El planteamiento básico del problema de las búsquedas nos enfrenta a una situación en la que se encuentran los documentos web, organizados en colecciones y un usuario que necesita encontrar y recuperar uno solo en concreto con la información que necesita, la que es "relevante" para él o ella. La pregunta que motiva el interés por el desarrollo de esta disciplina (Information Retrieval, IR) es si es suficiente con la búsqueda de palabras clave en Google, por ejemplo.
Normalmente los sistemas automáticos se suelen clasificar, siguiendo un cierto orden de complejidad creciente, en Document Retrieval Systems, Information Retrieval Systems y Question Answering Systems, que se han trabajado durante mucho tiempo en el ámbito del procesado del lenguaje natural (Natural Language Processing, NLP) y que ya hacen sus pinitos en el renovado entorno de los motores de búsqueda con iniciativas como Wolfram Alpha.
El caso es que el proceso que todos conocemos --consulta + recuperación del documento en cuestión + evaluación de la bondad del resultado- ha cambiado: se ha convertido en un proceso interactivo en el que interviene (de forma explícita y/o implícita) el usuario que realizara la consulta inicial; de tal manera que el sistema en su conjunto se convierte en una herramienta para la "provisión del conocimiento".
Si nos situamos en un contexto de Web Social, lo primero que a uno se le ocurre es introducir la capacidad de cooperación colectiva en alguno de los elementos de ese esquema clásico: ¿Por qué no pensar en un sistema de recomendación de filtrado cooperativo en red como elemento para el ajuste fino del proceso, introduciendo la realimentación del usuario? Lo normal es que los sistemas más modernos consideren ya un modelo de comportamiento del usuario, así como información de contexto, especialmente útil en entornos de movilidad, cada vez más habituales; de la misma forma las interfaces se vuelven más complejas, integrando la estructuración y visualización de los resultados de las consultas lanzadas a la base de datos.
De hecho, si uno se plantea el problema básico de la búsqueda textual, basada en la identificación de palabras clave (text-based retrieval), lo siguiente es pensar en la búsqueda por contenidos, donde las consultas se hacen sobre la base de algunos ejemplos (content-based retrieval)... Parece natural que la evolución lógica será la recuperación de información basada en el contexto (context-based retrieval).
Aparte de la broma (context = content + text) la idea podría tener todo su sentido ¿Por qué no podemos sugerir diferentes niveles de "recomendación" dentro del proceso de "recuperación"? Pensemos en la máxima KISS (soluciones TOntas a Problemas Estúpidos, TOPE) que aplica en el caso de OpenID, por ejemplo; es decir ¿Para qué me voy a preocupar de garantizar quién es quién si el escenario no lo requiere?
Es más, ¿Por qué no podemos replantear el problema de la "recuperación" de información o la "recomendación" de servicios/contenidos/personas como un problema de conectividad social? Siempre hemos dicho que lo importante no es saber algo, sino tener el número de teléfono de quien lo sabe. Desde el punto de vista del sesudo investigador que destila estas palabras [risas de fondo] este tipo de planteamientos nos podría llevar a plantear un escenario nuevo en que utilizamos el grafo social de cualquier comunidad --de la Web, o la Red por extensión- para convertir el problema de la búsqueda, localización y extracción (recuperación) de información en uno distinto para la localización del "proxi" social --si es que la acepción del término nos lo permite- que nos lleve a ese contenido/persona o servicio.
La cuestión es que, en un campo más afín, desde el punto de vista ortodoxo, como es el de los sistemas de recomendación, se ha avanzado en cierto sentido en esa dirección: a partir de los sistemas de filtrado cooperativo pensados para contenido y servicios, por ejemplo, se ha comenzado a recomendar personas, con el problema evidente de las métricas de reputación y confianza, así como la propia definición de la identidad online. Quizás tengamos que volver a las bases del análisis de redes sociales para redefinir el problema de la recomendación --y el de la recuperación- de "cosas" a partir de la recomendación o búsqueda de personas en una red (social).








