Mostrando las entradas con la etiqueta modelos cuánticos. Mostrar todas las entradas
Mostrando las entradas con la etiqueta modelos cuánticos. Mostrar todas las entradas

miércoles, junio 04, 2008

BORRAR Y MAS BORRAR (III)

Imagen: A Thom Yorke también le gustan los borradores. Ya me dirán cómo es la cosa sus fanáticos. Tomada de la página de Thom Yorke en Amie Street.

Se alargó y se alargó la trilogía sobre la conferencia de Oxford, hasta tal punto que ya no voy a hablar en ella de las charlas más importantes de mis gurúes académicos: Sven Aerts, Dominic Widdows y Peter Bruza. Y de otras charlas muy interesantes. Voy a saltar de una vez a la parte donde se entiende por qué la trilogía hace referencia a los borradores. No es porque las penas no se borren con un borrador de tiza, ni con el trago que me embriaga.

La idea es la siguiente: Aerts, Widdows y Bruza han mostrado cómo el lenguaje natural tiene rasgos que se acomodan más a una descripción construída sobre la lógica cuántica que sobre la lógica booleana normal , pero yo pretendo extender eso un poco: tal vez las mediciones lexicográficas que se hacen sobre documentos de texto en lenguaje natural también funcionen mejor representadas con un esquema cuántico.

De acuerdo con la teoría cuántica, cuando se escoge un conjunto de observables para medir en un sistema, al medirlos se borrará irremediablemente la información acerca de otros observables que no se midieron. Es decir, al medir una cosa, se borra otra.

Mi modesto aporte, para decirlo de una vez, consiste en tres cosas:
  1. Definir borradores selectivos, que borran todo lo que no está en la vecindad de la aparición de una palabra en el texto, y mostrar que tienen muchas de las características de mediciones cuánticas ideales: se comportan como un cierto tipo de operadores llamados proyectores.
  2. Explorar las posibles relaciones lógicas entre los borradores selectivos definidos con diferentes palabras y diferentes tamaños de vecindad, todo bajo la luz de lo que se conoce sobre lógica cuántica
  3. Proponer la manera como se pueden utilizar estas características cuánticas de las mediciones lexicográficas para representar documentos de texto en un sistema de búsqueda de información.
La idea es que un documento de texto puede pensarse como un estado de un sistema físico. Hay un sistema físico, no importa si es un disco, un papel, o lo que sea, y lo que está escrito ahí es un estado del sistema. Lo que está escrito, además, no está definido hasta que el lector no ha escogido el punto de vista desde el cual lo va a leer. Las palabras se consideran, en este enfoque, como entes con un significado muy dependiente del contexto, cuya representación, si pretende llevar un contenido semántico, debería depender fuertemente del punto de vista.

Cuando dos borradores son compatibles, el orden en el que se aplican no importa, y con ellos se pueden definir las operaciones lógicas habituales (uno Y el otro, uno O el otro, etc.). Cuando no son compatibles , la lógica booleana no tiene mucho que decir de sus relaciones, y hay que comenzar a escarbar en lo que se ha desarrollado de la lógica cuántica, una lógica con puntos de vista (hay otras, pero son bastante más complicadas).

Como tengo que aplicar este esquema a experimentos prácticos de búsqueda de información, ya comencé a aprender a poner ese tipo de cosas a funcionar con un computador. Algo que estoy haciendo, es practicar con texto sacado de blogs. Lo que he hecho hasta ahora a nivel informal (de mi trabajo formal no hablo aún) es encontrar la manera de sacar una matriz de similaridad entre palabras según su uso, partiendo de un documento de texto.

El lector suficientemente geek puede encontrar en este enlace un programa que calcula la matriz de co-ocurrencias. Se baja como documento de texto a CoOcurrencias.sh, y se le fijan los permisos como ejecutable. Eso se puede hacer con

wget http://www.dcs.gla.ac.uk/~alvaro/CoOcurrencias.sh
chmod +x CoOcurrencias.sh
# La siguiente linea hay que añadírsela a /etc/rc.local con privilegios de administrador:
alias CoOcurrencias="/CoOcurrencia.sh"

Para usarlo, sugiero crear una carpeta con sólo la lista de palabras y el archivo de texto. Se ubica en esa carpeta, y le da el siguiente comando:

CoOcurrencias [lista de términos] [archivo de texto] [ancho de ventana]


El programa creará algunos archivos temporales que se borran solos, y una carpeta "ventanas" donde pondrá unos archivos .dat con los conteos alrededor de cada palabra. Finalmente, quedan los siguientes archivos:

TerminosContados.txt - Conteo de los términos que aparecen
resultadosCC.out - Los pares de palabras, con las veces que aparecen cerca
resultadosCCN.out - Las palabras reemplazadas por números, para procesamiento matemático posterior.


Recomiendo que para estos cálculos se utilicen archivos de texto de al menos cientos de miles de palabras, pues de otro modo la matriz de coocurrencias queda muy vacía.

Inicialmente, apliqué este procedimiento al primer pantallazo del blog Pensemos País Bizarro, de donde saqué 223044 palabras (tokens) que son distintas ocurrencias de 19701 términos, 12958 aparecen sólo una o dos veces, 6743 aparecen más veces. Por ahora, sólo mencionaré un par de datos curiosos que encontré en el citado blog:

  • Entre las palabras más frecuentes está "Colombia" que sale 598 (mas frecuente que 19292 palabras, menos que 31)
  • La palabra "nunca", una muletilla epistemológica que me causa gracia del autor del blog, aparece 90 veces (mas frecuente que 19090 términos, menos frecuente que 233)
  • La palabra "siempre", otra cara de la misma muletilla, aparece 229 veces (mas frecuente que 19240 términos, menos frecuente que 83)
  • La palabra "izquierda" tiene una frecuencia de co-ocurrencia con la palabra "antepasado" que es toda una rareza en el lenguaje natural. Altísima. "antepasado" sólo aparece en la vecindad de "izquierda". Habría que juntar este pantallazo con otros, para validar este resultado en un texto más largo.
Finalmente, ya que estamos hablando de lenguaje, les dejo acá un video hilarante que se encontró Shoegazer sobre el lenguaje que se usa en Glasgow:



Buen provecho. Ya me dirán los que la conocen si la presentadora no se parece a mi mamá cuando era joven.

lunes, mayo 19, 2008

BORRAR Y MAS BORRAR (II)

Imagen: el profesor Peter Rowlands aprovecha la charla en la conferencia para mostrar el libro de su teoría del universo generándose desde la nada. (le hago más propaganda porque me cayó bien)

Después de la pausa más larga en este blog entre texto y texto, y desatendiendo la recomendación del troll residente de comentar el Informe de Desarrollo Humano, continúo la serie de informes sobre la conferencia de Oxford. Esta va menos por el lado de "esta mañana me levanté y me preparé un pan tostado", y más por el lado de "si no me entienden no se preocupen, yo tampoco me entiendo".

EL ORDEN IMPLICADO

La primera charla la dio Basil Hiley, coautor con David Bohm del famoso libro "El Universo no Dividido", libro que estableció las bases de lo que se ha llamado el "paradigma holográfico". Esta idea sencilla pero poco comprendida ha hecho las delicias de los pensadores nueva era; tanto los que están seguros de sus cosas, como los que buscan desesperadamente justificaciones en la ciencia tradicional.

Lo del orden implicado es una de esas ideas tan poderosas que uno no puede creer que sea tan simple. Es en realidad una manera de interpretar la mecánica cuántica donde en lugar de despreciar la existencia de lo que no se observa como un "seudoproblema" (escuela de Copenhagen) se le da un carácter de realidad latente.

La idea es que todo estado físico está determinado por una información explícita (explicate) y otra implícita (implicate). Al escoger un esquema experimental de observación, uno escoge qué obsrvables van a ser explícitos y cuáles quedarán escondidos como implícitos. El resultado de las medidas de estos observables, desde luego, no lo determina el observador sino el sistema, y no entender este detalle ha llevado a muchos a confundir la influencia del conjunto de observables escogido como una versión trivial e ingenua de "la mente creando la realidad" budista. (para un ejemplo dramático hasta la carcajada, ver acá.)

El orden implicado es otra forma de ver ese cuento de los puntos de vista, que ha inspirado otro tipo de aproximaciones matemáticas. Creo que algunos biólogos teóricos serios y otros medio sospechosos se han inspirado mucho en esta interpretación de la teoría cuántica para desarrollar sus modelos. Sobre los biólogos teóricos serios que menciona el enlace, por cierto, una física australiana me comentó que conocía el trabajo de Eugenio Andrade y sus "demonios de Darwin". Para que vean que no sólo Shakira triunfa en el exterior...

¿CUÁNTICO? ¿DÓNDE?
Otra serie de chaŕlas abordaron el tema de lo que es y no es cuántico. La conferencia se centraba en el uso de descripciones inspiradas en la teoría cuántica para fenómenos fuera de la física, de modo que el tema de dónde funcionan bien es central.

Kirstin Kitto, la física australiana, hizo una especie de inventario de cosas extrañas que tienen representación sencilla dentro de la Teoría Cuántica. Peter Rowlands y Peter Marcer propusieron la imagen del "sistema reescritor universal" algo así como examinar los procesos físicos como un proceso computacional de procesamiento de información. El enfoque de Rowlands, me parece, se trata de buscar cómo la realidad compleja que conocemos puede generarse continuamente. Y las estructuras matemáticas que propone para describir esa generación parecen muy poderosas y razonables. Sin embargo, hay algo en esa teoría que despierta suspicacias en la teoría de Rowlands: tiene vuelos demasiado altos. Es muy extraño que de la noche a la mañana aparezca alguien con una trayectoria poco conspicua diciendo que derivó toda la física contemporánea desde primeros principios. O mejor aún, como él mismo dice, desde "nada".

Como mi tiempo no se genera desde la nada a través de un juego elegantísimo de 5 operadores nilpotentes, paro acá, y cruzo los dedos para que pronto pueda continuar con esta serie de informes. Para que parezca que esto se trata de física de la seria, voy a poner a continuación un diagrama de las raíces de un álgebra de Lie asociadas con unas propiedades de unas partículas fundamentales. Eso lo encontré en un blog de físicos aficionados a hacer dibujitos en LaTeX.

jueves, marzo 20, 2008

PASEO CUÁNTICO

Imagen: Universidad de Oxford. El laboratorio de ciencias de la computación debe estar por ahí, pero no sé cuál es. Tomada de la página web del departamento análogo de la Universidad de Sheffield.


Después de un buen tiempo sin actividades académicas, por fin voy a retomar actividades sociales-científicas, y esta vez, en grande.

Por allá en el 2002, cuando comencé a engolosinarme con este cuento de la Lógica Cuántica, pasé mucho tiempo buscando publicaciones en esa área, y era bastante difícil hallarlas. El trabajo fundacional de von Neumann, un par de trabajos clásicos de Asher Peres, los diagramas de Greechie. Y, claro, alguien que quería poner los aspectos lógicos novedosos de la mecánica cuántica a jugar a favor de los cómputos clásicos implicados en la búsqueda de información. Un matemático bastante prestigioso en el campo intraducible de IR (Information Retrieval) que publicó un libro, que yo en su momento compré, y a quien después contacté, y terminó siendo mi director de doctorado.

Pero además de eso, unos cuantos matemáticos medianamente tostados, o algo así, que mientras otros iban tras efectos cuánticos en las neuronas, células, organelos y demás, buscaban efectos cuánticos en el mismo comportamiento humano, lo cual implica una reflexión mucho más profunda (me parece a mi) e interesante que la cacería del bio-cuanto. Estos pocos, bastante marginales en el panorama académico mundial, lograron, parece, atraer una cantidad modesta de atención, y el número de publicaciones por año crece ahora lenta pero notoriamente.

Y resulta que ahora, no sólo tendré la oportunidad de conocer en persona a la mayoría de estos investigadores marginales, sino de mostrarles mi modesta propuesta de contribución al área. A ver qué opinan. Y todo eso, en la hermosa ciudad de Oxford, en el segundo simposio llamado Interacción Cuántica. Suena bien, ¿no?

Por el momento, además de las obligaciones usuales del doctorado, estoy dedicado a recopilar lo que más pueda de la producción de los participantes, y leerla. Cosas muy interesantes. Los que publican en econofísica me dan un poco más de trabajo, pero todo, hasta ahora, está interesantísimo. En especial, me interesan unos trabajos sobre descripciones de tipo cuántico de ciertos aspectos del comportamiento humano. Y me produce también mucha curiosidad el trabajo de un econofísico ecuatoriano que trabaja en Italia en mi viejo campo de la Teoría de Juegos Cuántica.

Mientras hay algo más que contar, remito también al lector intenso a mi blog en inglés, donde comento sobre la mano de Iván Ríos y otras manos.

lunes, octubre 16, 2006

NOW, I'M A RETRIEVER!



Bueno, ahora sí, voy a contar a lo que me dedíco hoy por hoy, sin detrimento, espero, de la documentación de las anteriores etapas del aburridísimo señor Lanark.

Para los lectores de este blog para quienes sea algo obscura la referencia de este post, tendré que contar algo sobre la canción del grupo de rock cla-cla-cla-clásico de los Monkees, que se llama I'm a believer. Se supone que la canta un tipo que se volvió crédulo porque está enamorado.

En mi caso, enamorado o no, estoy dedicado a una rama de la informática que se llama Information Retrieval, y no he podido traducir de manera satisfactoria al español. De modo que podría decirse que soy un retriever, aunque no cobro patos heridos por los cazadores, como hacían los retrievers originales (de ahí su gusto por echarse a cualquier charco) sino que desarrollo modelos matemáticos para "cobrar" (o recuperar, o pescar) documentos

Todo empezó cuando estaba terminando mi tesis en teoría de juegos cuánticos, cuando me comencé a embobar con las particularidades geométricas de los espacios en los que se representan los estados cuánticos. Como de costumbre, dejé a un lado el objeto que estaba mirando, para embobarme con la lupa que había hecho a la medida del objeto.

Cada observable, es decir, cada característica de un estado cuántico, se representa por un conjunto de direcciones perpendiculares, y los que comparten subconjuntos de éstas, son compatibles, y se pueden medir y determinar simultáneamente. Pero si dos observables son incompatibles, es decir, si al medir uno se borra la invormación sobre el otro, entonces se representan con direcciónes que están en ángulos distintos a 90 grados.

¿y qué tiene eso que ver con las búsquedas en google, por ejemplo? Ahí llegamos a donde apareció un bombillito sobre la cabeza de mi actual director de doctorado, el profesor Keith van Rijsbergen...

Él llevaba algunas décadas estudiando el criterio errático, indisciplinado y complejo con el que los seres humanos reales hacen búsquedas en bases de datos grandes (y últimamente, en internet), y llegó a la conclusión de que los criterios de búsqueda humanos pueden ser bien representados por modelos cuánticos. Digamos que un usuario tiene una capacidad de enfoque limitada para su búsqueda, y al aplicarla completamente a una cosa, se desenfoca en otras. Un modelo cuántico sería como una cámara que uno puede enfocar en una cosa, desenfocando las que importan menos, y usando por lo tanto menos recursos informáticos.

Y heme acá. Mi primera idea, es desarrollar métodos cuantitativos para detectar esa limitación de la capacidad de enfoque en las búsquedas de usuarios en un corpus de textos grandes, y en base a eso, determinar cuál es el tamaño (dimensión) del modelo geométrico (cuántico) adecuado.

Eso sí, no he comenzado a discutir lo que finalmente haga con nadie, estoy a penas enterándome bien de las técnicas existentes para lidiar con el carácter poco formalizable de los criterios de búsqueda humanos.

COMPREN, COMPREN