lunes, diciembre 11, 2006

PROBABILIDADES Y GEOMETRÍA (II)

Imagen: Mandala Discordiano, tomada de PRINCIPIA DISCORDIA

Un rasgo muy importante de las representaciones estadísticas es la correlación, que tiene que ver con qué tan frecuentemente un resultado aparece en conjunto con otro. Si suelen ir juntos, o por el contrario, se evitan.

OBSERVABLES CORRELACIONADOS Y NO CORRELACIONADOS

Los dos resultados excluyentes que teníamos en un principio se representan como dos rayos perpendiculares; llamémosles el resultado A=0 y el resultado A=1.
Habíamos dicho que hay otros observables que se pueden representar; tomemos por ejemplo nuestro observable A, y uno que no tenga ninguna información sobre A. Eso significa que cualquiera de los rayos del nuevo observable está tan cerca del resultado 0 como del resultado 1.
El resultado de medir A no nos dará ninguna pista sobre el resultado para el segundo (B); las probabilidades serán 1/2 y 1/2 y las amplitudes serán las raíces cuadradas de 1/2, con cualquier signo. Decimos entonces que B es no sesgado respecto a A, o que no está correlacionado.
La receta para interpretar estas amplitudes relativas, entre un resultado y otro, es que son la raiz cuadrada de una probabilidad condicional, es decir, la probabilidad de un resultado del observable B, dado que el observable A dio tal resultado. En este caso, los resultados del observable A dijimos que eran 0 y 1, y digamos que los del observable B sean S y N. Hay 4 probabilidades condicionales acá, y todas tienen valores de 1, 1/2, y 0:

PROBABILIDADES CONDICIONALES



P(Overtical=Rvertical\Ohorizontal=Rhorizontal)

Probabilidad de que el Observable vertical Overtical de un resultado Rvertical,
dado que el Observable horizontal Ohorizontal ha dado un resultado Rhorizontal


A=0A=1B=NB=S
A=0101/21/2
A=101 1/21/2
B=N1/21/210
B=S1/21/201

Si escogemos los resultados de A como los ejes X y Y, los rayos serían:
  • A=0: mas o menos (1,0)
  • A=1: mas o menos (0,1)
  • B=S: mas o menos (raiz(1/2), raiz(1/2))
  • B=N: mas o menos (raiz(1/2), -raiz(1/2))
Hay una operación entre dos vectores que nos da un número, y ésta se llama producto interno, producto escalar o producto punto. Consiste en multiplicar el X del uno por el X del otro, y a eso sumarle el producto del Y del uno por el Y del otro:

(ax,ay)·(bx,by) = ax·bx + ay·by

Ese producto, es el que nos permite calcular las amplitudes de las probabilidades relativas. A veces, en mecánica cuántica se les llama amplitudes de transición. Al elevarlas al cuadrado, dan las probabilidades. El lector intenso puede calcular los productos internos de los cuatros vectores que doy (con signo indeterminado, y todo) y verificar que los cuadrados de las amplitudes son las probabilidades de la tabla. Tiene que tomar en cuenta, eso sí, que aunque en el caso de B=N, los signos de las componentes X y Y pueden ser indeterminados, pero tienen que ser contrarios.

UNA REPRESENTACIÓN ELEGANTE

La verdad, estar cargando con esas flechas de doble signo (los rayos) no deja de ser fastidioso. Para poder hablar de geometría más comodamente, vamos a escoger una representación en la cual tengamos vectores comunes y corrientes. Para eso, vamos a tomar medio círculo que tenga sólo una punta de cada rayo, y vamos a hacer con ese medio, un círculo entero.
En esta representación, los resultados opuestos A=0 y A=1 quedan como vectores opuestos en el eje Y, y los resultados opuestos B=0 y B=1 quedan como vectores opuestos en el eje X. Esta representación de los estados binarios es parte de lo que se llama la esfera de Bloch, en honor al suizo Felix Bloch. Es una manera muy elegante y bonita de representar rayos con vectores. ¿porqué no es esfera sino círculo? porque no hemos usado números complejos. Ya vamos para allá.

En la esfera de Bloch, los productos escalares no nos dicen la amplitud de la probabilidad, sino algo relacionado con la correlación. Fíjense que el producto de un vector consigo mismo es 1; con su resultado opuesto es -1 y con los estados no sesgados, es 0. Para encontrar la probabilidad condicional, por ejemplo P(A=0) usamos una fórmula un poco distinta:

P (O2=R2\O1=R1) = (1+V1·V2)/2
El lector intenso también puede verificar que esto se cumple, para los vectores
  • V(A=0) = (0,1)
  • V(A=1) = (0, -1)
  • V(B=S)=(1,0)
  • V(B=N)=(-1,0)
En nuestro círculo de Bloch, los vectores se encuentran organizados en un polígono regular, y la simetría de eso se refleja en la tabla de probabilidades. Si tuviéramos, por ejemplo un hexágono, habría tres observables binarios A, B y C:

Los productos escalares variarían entre 1 1/2 y 0, con sus correspondientes valores negativos. Todas las probabilidades condicionales serían 0, 1/4, 3/4 o 1. Todos los resultados de un observable implican que hay un resultado de los otros que es 3 veces mas probable que su contraparte. Serían entonces observables correlacionados.

Encontrar las amplitudes de probabilidad para estos es relativamente fácil, ya que sabemos cómo deducir la probabilidad de la amplitud (es el cuadrado) y cómo deducir la probabilidad del producto punto en el círculo de Bloch. Igualando, obtenemos las amplitudes, que, si uno de los observables es los ejes, nos dan exactamente las coordenadas:

  • (0,1) y (1,0) Ya lo sabíamos
  • (raiz de 3/4, 1/2), (-1/2, raiz de 3/4)
  • (1/2, raiz de 3/4), (-raiz de 3/4, 1/2)
¿MAS SIMETRÍA? HAY QUE PONERSE COMPLEJO
En nuestra representación de los estados con vectores (o rayos de amplitudes) hemos mostrado como la información sobre dos observables está codificada diferente; en el caso de el observable A, tenemos vectores ±(1,0) y ±(0,1) y la información está simplemente codificada en los números, mientras que en el observable B está codificada en la diferencia de signos entre ambas coordenadas, porque los vectores son ±raiz(1/2)·(1,1) y ±raiz(1/2)·(1,-1). Podemos, además, hacer un truco para tener una tercera manera de codificar la información, que no se correlacione con ninguna de los otros, y es introducir un número que al cuadrado sea - 1. Eso, es un número imaginario que se suele denotar i. Esta tercera manera de codificar, nos permite tener una dirección perpendicular más en la representación de Bloch, y, por lo tanto, ya podemos hablar de la esfera de Bloch.

Los juegos de rayos serían:
  • Observable A: ±(0,1) y ±(1,0)
  • Observable B: ±(1,1) y ±(1,-1) Multiplicado todo por raiz de 1/2, para que las probabilidades sumen 1
  • Observable B: ±(1,i) y ±(1,-i) Multiplicado también todo por raiz de 1/2
Para que esto funcione, tenemos que establecer una regla: que cuando un vector que contenga i multiplica por la izquierda, se le cambia el signo al i; a eso le llamamos conjugado complejo. Hay que hacer eso, para que el producto consigo mismo de 1. Los fasores pueden representarse también como números en un plano, que se llama el plano complejo. Los reales van en la dirección horizontal, y los imaginarios en la vertical:
Lo que antes era el signo, ahora es algo mas general, que puede incluir números imaginarios. Teníamos dos números que eran la raiz cuadrada de 1, el propio 1 y el -1. Ahora, el propio i es en cierto modo una raiz cuadrada de 1, si tomamos la regla de cambiarle el signo cuando multiplica por la izquierda. (-i)·(i)=1. Y hay otros números que tienen la misma propiedad, que al multiplicarlos por su conjugado complejo, dan 1.
  • (raiz de 1/2)(1+i) Multiplicando su conjugado: (raiz de 1/2)(1-i)·(raiz de 1/2)(1+i)=(1/2)(1-(-1))=1
  • (raiz de 1/2)(1- i) Multiplicando su conjugado: (raiz de 1/2)(1+i)·(raiz de 1/2)(1-i)=(1/2)(1-(-1))=1
En la gráfica, los números conjugados complejos aparecen igualmente separados del eje real, pero uno arriba y otro abajo. Y su producto, en estos casos, siempre es uno.
Esos números, se llaman fases, fasores. Una fase tiene una parte real y una imaginaria, y al multiplicarla por su conjugado complejo, da siempre 1. Cuando trabajamos con números complejos, podemos codificar información en las fases, que es exactamente lo que se hace cuando se aplica la transformada de Fourier.

La fase nos permite codificar la información de mas formas, sin necesidad de que sea más información (sigue siendo 2 el número de opciones que se excluyen).

Los seis estados que he mencionado, dos por cada observable no correlacionado, se ubican en la esfera de Bloch en los vértices de un octaedro. Todas las probabilidades condicionales son 1, 1/2 o 0.

Todos los polihedros regulares corresponden a conjuntos de estados con relaciones probabilísticas relativamente sencillas. Por ejemplo, veamos los estados que corresponderían al cubo:
Son ocho estados, y cada uno tiene 3 cercanos, 3 lejanos, y uno contrario. Las probabilidades condicionales son 1, 2/3, 1/3 y 0. Se pueden representar en un grafo, donde los puntos son estados, y la probabilidad condicional es (3-distancia)/3. La distancia es la mínima cantidad de lineas que hay que recorrer para llegar de un estado a otro.

Los 6 estados de los observables completamente no correlacionados, habíamos visto, forman un octoedro. Si ponemos un estado extra en la mitad de cada una de las caras (8 caras), obtendremos un poliedro (no platónico, pero simétrico) de 14 puntas. El grafo que representa a este sería:
Para interpretarlo, la regla es simple: cada distancia (definida como mínimo número de lineas entre dos puntos) corresponde a una probabilidad condicional. La tabla es:
  • Distancia 0: probabilidad 1
  • Distancia 1: probabilidad (3+raiz de 3)/6 Mas o menos 0.7887
  • Distancia 2: progabilidad 1/2 si es entre los rojos, y 2/3 si es entre los azules
  • Distancia 3: probabilidad (3-raiz de 3)/6 Mas o menos 0.2113
  • Distancia 4: probabilidad 0 si es entre rojos, 1/3 si es entre los azules.
  • Distancia 6: probabilidad 0. Sólo se da entre los azules.
La razón por la que hay dos casos para distancia 2, es que hay dos tipos de estados, los rojos, que son del octaedro (los tres observables incompatibles), y los azules, que son del cubo. El hecho de que haya dos tipos de estados, tiene que ver con que el polihedro que escogimos tiene dos tipos distintos de vértices, porque sus caras no son polígonos regulares, sino unos triángulos no equiláteros.

En el siguiente post al respecto, pondré algo mas sobre los poliedros regulares, antes de pasar a hablar de las transformaciones de simetría.

1 comentario:

shoegazer dijo...

Creo que para lo único que me ha servido este post es para alegrarme de que yo haya estudiado una cosa de absoluto sentido común y nunca me toque explicarle nada a nadie...
Estoy convencida de que no es tu culpa, en todo caso. Hasta lo de las probabilidades iba bien (me recuerda a Bourdieu), pero ya llegando a los fasores me iba perdiendo. De ahí en adelante, me sentí leyendo un manifiesto dadá. De eso que uno ni siquiera se pregunta "WTF???", sino que sigue leyendo y deja que las palabras y los números se paseen a su albedrío en el cerebro, a ver si por pura casualidad se tropiezan con un viejo aprendizaje. No sucedió.

COMPREN, COMPREN