lunes, octubre 16, 2006

NOW, I'M A RETRIEVER!



Bueno, ahora sí, voy a contar a lo que me dedíco hoy por hoy, sin detrimento, espero, de la documentación de las anteriores etapas del aburridísimo señor Lanark.

Para los lectores de este blog para quienes sea algo obscura la referencia de este post, tendré que contar algo sobre la canción del grupo de rock cla-cla-cla-clásico de los Monkees, que se llama I'm a believer. Se supone que la canta un tipo que se volvió crédulo porque está enamorado.

En mi caso, enamorado o no, estoy dedicado a una rama de la informática que se llama Information Retrieval, y no he podido traducir de manera satisfactoria al español. De modo que podría decirse que soy un retriever, aunque no cobro patos heridos por los cazadores, como hacían los retrievers originales (de ahí su gusto por echarse a cualquier charco) sino que desarrollo modelos matemáticos para "cobrar" (o recuperar, o pescar) documentos

Todo empezó cuando estaba terminando mi tesis en teoría de juegos cuánticos, cuando me comencé a embobar con las particularidades geométricas de los espacios en los que se representan los estados cuánticos. Como de costumbre, dejé a un lado el objeto que estaba mirando, para embobarme con la lupa que había hecho a la medida del objeto.

Cada observable, es decir, cada característica de un estado cuántico, se representa por un conjunto de direcciones perpendiculares, y los que comparten subconjuntos de éstas, son compatibles, y se pueden medir y determinar simultáneamente. Pero si dos observables son incompatibles, es decir, si al medir uno se borra la invormación sobre el otro, entonces se representan con direcciónes que están en ángulos distintos a 90 grados.

¿y qué tiene eso que ver con las búsquedas en google, por ejemplo? Ahí llegamos a donde apareció un bombillito sobre la cabeza de mi actual director de doctorado, el profesor Keith van Rijsbergen...

Él llevaba algunas décadas estudiando el criterio errático, indisciplinado y complejo con el que los seres humanos reales hacen búsquedas en bases de datos grandes (y últimamente, en internet), y llegó a la conclusión de que los criterios de búsqueda humanos pueden ser bien representados por modelos cuánticos. Digamos que un usuario tiene una capacidad de enfoque limitada para su búsqueda, y al aplicarla completamente a una cosa, se desenfoca en otras. Un modelo cuántico sería como una cámara que uno puede enfocar en una cosa, desenfocando las que importan menos, y usando por lo tanto menos recursos informáticos.

Y heme acá. Mi primera idea, es desarrollar métodos cuantitativos para detectar esa limitación de la capacidad de enfoque en las búsquedas de usuarios en un corpus de textos grandes, y en base a eso, determinar cuál es el tamaño (dimensión) del modelo geométrico (cuántico) adecuado.

Eso sí, no he comenzado a discutir lo que finalmente haga con nadie, estoy a penas enterándome bien de las técnicas existentes para lidiar con el carácter poco formalizable de los criterios de búsqueda humanos.

COMPREN, COMPREN