Latest Posts:

Mostrando las entradas con la etiqueta algebra. Mostrar todas las entradas
Mostrando las entradas con la etiqueta algebra. Mostrar todas las entradas

19 de marzo de 2013

Situación de las raíces de la derivada, o “el teorema más maravilloso de las matemáticas”


Decir que un teorema es “el teorema más maravilloso de las matemáticas” es mucho decir teniendo en cuenta la gran cantidad de maravillas en forma de resultado matemático que podemos encontrar a lo largo y ancho del conocimiento de esta ciencia. Pero lo que no se le podrá negar al teorema que os presento en este post es que reúne una gran cantidad de detalles (enunciado simple, conclusión realmente sorprendente e inesperada y demostración relativamente elemental) de esos que convierten un resultado matemático en un teorema maravilloso.

Como puede leerse en el título, la cuestión trata sobre situar las raíces de una derivada. Bien, vamos a especificar un pelín más. Concretamente de la derivada de un polinomio de grado 3. ¿De un polinomio de grado 3 habitual, de esos con coeficientes reales? No solamente de esos, sino de, en general, cualquier polinomio con coeficientes números complejos, y cuya variable también es compleja.


Sabemos que estos polinomios, como todos los polinomios con variable y coeficientes complejos, cumplen que todas sus raíces (raíz de un polinomio: solución de la ecuación polinómica que nos queda al igual a cero dicho polinomio) son números complejos. Por tanto, nuestro polinomio de grado 3 tiene sus tres raíces dentro de los números complejos.

Supongamos que esas tres raíces no están alineadas (única condición que le vamos a poner al polinomio, que sus tres raíces no estén en la misma recta). Entonces con ellas podemos construir un triángulo, uniéndolas dos a dos con segmentos. Calculemos ahora la derivada del polinomio, que será un polinomio de grado 2. ¿Dónde estarán situadas las raíces de esta derivada? ¿Dentro de dicho triángulo? ¿Fuera de él? ¿Una dentro y otra fuera? ¿O tal vez sobre los propios segmentos que forman los lados del polinomio? Y estén donde estén, ¿podemos decir algo sobre su situación en relación con el triángulo o su situación es azarosa?

Bien, pues como muchos de vosotros podréis imaginar la situación de estas raíces de la derivada no es ni muchísimo menos azarosa, de hecho está muy relacionada con el propio triángulo cuyos vértices son las raíces del polinomio inicial. Veamos el enunciado del teorema que relaciona todo esto y después os sigo contando cosas.
Teorema de Marden:
Dado un polinomio p(z) de grado 3 con variable y coeficientes complejos, supongamos que sus raíces no están alineadas. Si consideramos el triángulo T cuyos vértices son dichas raíces, entonces las raíces de p^\prime (z), la derivada del polinomio, son los focos de la única elipse inscrita en T que es tangente a los tres lados de T exactamente en sus puntos medios.
Es decir, si tomamos los puntos medios de T existe una única elipse inscrita en T que es tangente a esos tres puntos, ¡¡y además los focos de dicha elipse son las raíces de la derivada del polinomio!! Para quedarse con la boca abierta…

Como hemos comentado antes, este teorema puede demostrarse utilizando técnicas y conocimientos relativamente elementales. Pero antes hablemos un poco sobre la historia de este resultado.

¿Por qué teorema de Marden? Pues porque en 2009 el matemático Dan Kalman escribió un interesante artículo (que fue premiado con el Lester R. Ford Award, premio que entrega la Mathematical Association of America) sobre este resultado, dando una demostración completa del mismo, y comentando que él había sabido de su existencia después de leer el libro Geometry of Polynomials, de Morris Marden y publicado en 1966. En realidad parece que fue Jörg Siebeck quien publicó inicialmente este resultado en 1864, o al menos es a él a quien el propio Marden se lo atribuye.

El caso es que la demostración que dio Marden de este teorema estaba incompleta. Demostró gran parte del mismo, pero se dejó un detalle: no demostró la unicidad de la elipse. Kalman comenta también que el propio Marden cita nueve trabajos más en los que se habla de este resultado, destacando uno publicado por Maxime Bôcher en 1892 con una demostración que, en cierto modo, también estaba incompleta.
Bien, pues lo que hizo Kalman en su artículo premiado, An Elementary Proof of Marden’s Theorem, es desarrollar una demostración de este teorema de Marden uniendo las ideas de las demostraciones de Bôcher y del propio Marden. Aunque podéis verla completa en su artículo, a continuación comento algunas cosas sobre ella.

Las claves de la demostración que nos propone Kalman son tres lemas previos a la propia demostración del teorema, cuyas demostraciones vamos a obviar en este post (os remito al artículo de Kalman si estáis interesados en verlas). El primero de ellos es quizás el más engorroso de explicar aquí, por lo que no lo vamos a citar aquí (tranquilos, no hay que aplicarlo directamente en la demostración del teorema).
El lema 2 dice lo siguiente
Lema 2:
Sea p(z) un polinomio de grado tres cuyas raíces son no colineales y T el triángulo cuyos vértices son dichas raíces. Si Q es el punto medio de uno de los lados de T, entonces existe una única elipse, cuyos focos son las raíces de p^\prime (z), que pasa por Q, y de hecho esa elipse es tangente a ese lado de T en el propio punto Q.
Bueno, vamos bien. De hecho podría parecer que esto es el propio teorema de Marden, pero faltan cosas. Por ejemplo, ¿quién me asegura que esa elipse sea tangente también a los otros dos lados? Pues el lema 3:
Lema 3:
Sea p(z) un polinomio de grado tres cuyas raíces son no colineales y T el triángulo cuyos vértices son dichas raíces. Consideramos la elipse con los focos en las raíces de p^\prime (z) y que es tangente a un lado de T en su punto medio. Entonces esa elipse es tangente a los otros dos lados de T.
Ya está, ¿verdad? Con esto concluiríamos la demostración del teorema…Pues no, nos falta algo, concretamente demostrar que esa elipse es tangente a los otros dos lados exactamente en sus puntos medios. Vamos a concluir:
Demostración del teorema de Marden:
Tenemos nuestro polinomios y sus raíces formando T, como antes. Con las raíces de p^\prime (z) como focos dibujamos la elipse E que pasa por el punto medio de uno de los lados de T. El Lema 2 nos dice que E es tangente a ese lado del triángulo en su punto medio, y el Lema 3 dice que entonces E también es tangente a los otros dos lados. Lo que queremos es demostrar que exactamente es tangente a esos dos lados en sus puntos medios.
Si no fuera así, repetimos la construcción sobre otro de los lados del triángulo T, obteniendo así la elipse E’. Tenemos entonces dos elipses, E y E’, que tienen los mismos focos y que son tangentes a las mismas rectas (a las que contienen a los tres lados de T), por lo que E y E’ deben ser, efectivamente, la misma elipse. Pero eso significa que esta elipse es tangente a dos de los lados del triángulo en sus puntos medios. Para ver que también lo es en el punto medio del lado que falta, construimos la elipse que tiene los mismos focos que la anterior y que es tangente al otro lado en su punto medio. Al repetir el proceso anterior vemos que esta elipse debe ser de hecho la propia E. Por tanto, esta elipse es tangente a los tres lados en sus puntos medios, terminando así la demostración.
Para terminar, comentar que esta elipse se conoce con el nombre de inelipse de Steiner, y que las sorpresas no se quedan en la primera derivada. Si calculamos la segunda derivada, la única raíz de la misma está situada exactamente en el punto medio del segmento que une las dos raíces de p^\prime (z), siendo esta raíz por tanto el baricentro del propio triángulo. Impresionante.

Ah, y como no podía ser de otra manera este resultado se presta a ciertas generalizaciones: una de ellas tomando polinomios de mayor grado pero que sigan conservando exactamente tres raíces distintas y no colineales y otra con polígonos de un número mayor de lados. En la entrada de la Wikipedia inglesa dedicada al teorema de Marden podéis encontrar algo más de información al respecto.

Otro de esos resultados sorprendentes, inesperados, en los que parece que, milagrosamente, todo cuadra a la perfección. Otro de esos resultados por los que dedicarle algo de tiempo a las Matemáticas merece muy mucho la pena.

Fuente:

Gaussianos

12 de marzo de 2013

El acertijo matemático en el epitafio de Diofanto



La muerte del matemático alejandrino Diofanto nos trajo el siguiente acertijo, al menos según recoge una colección griega de acertijos del siglo V:

En esta tumba reposa Diofanto. ¡Ah, qué gran maravilla! La tumba cuenta científicamente la medida de su vida. Dios le concedió ser un muchacho durante la sexta parte de su vida, y añadiendo una doceava parte a ésta, revistió su mejilla de pelusa. Encendió la luz del connubio pasada una séptima parte, y cinco años después de su matrimonio le dio un hijo. ¡Ay! ¡Desdichado hijo tardío! Después de consolar su pena mediante el estudio de los números durante cuatro años, Diofanto terminó su vida.
¿Cuál fue la edad de muerte de Diofanto?

La respuesta es 84 años de edad (aunque ello no esté acreditado desde un punto de vista histórico). Los cálculos son los siguientes (siendo x la edad de Diofanto):

X = 1/6x + 1/12x + 1/7x + 5 + 1/2x + 4

Conocer Ciencia: Ciencia sencilla, ciencia divertida, ciencia fascinante...

13 de noviembre de 2012

Una razón recreativa para conocer sobre la división sintética (o método de Ruffini)

La división sintética, aquél proceso simplificado para dividir polinomios por un factor lineal para poder factorizarlas y graficarlas con efectividad. Hasta hace dos semana pensaba que ese era el único uso que tenía, hasta que en el pulguero me compré con uno de los volúmenes de Matemáticas Modernas de Dolciani de finales de la década de 1960.

Entre las páginas del texto de séptimo grado se encuentran varios temas que ahora servirían dentro del salón como método de avalúo: husos horarios, latitudes y longitudes, máquinas de funciones, números romanos, números egipcios, y los sistemas numéricos no-decimales. Con éstos útimos podemos descubrir que un caso específico del algoritmo de división sintética es usado para convertir numerales de base
n a numeros de base decimal.

Primero,
¿como convertimos un numeral de base decimal a uno no-decimal? 
  • Usted toma el numeral decimal y lo divide por la base n deseada, al estilo de escuela primaria (cociente entero y residuo). Si el residuo es mayor o igual que 10 sustituya con una letra del abecedario en mayúscula (10 = A; 11 = B; etc.)
  • El cociente entero resultante se convierte en el nuevo numeral decimal a dividir y repite el primer paso hasta que el cociente entero sea cero.
  • Fíjese en todos los residuos. Ordénelos desde el último encontrado hasta el primero. ésta secuencia será la conversión a base n del número decimal.
En términos matemáticos, utilizamos el algoritmo de división para convertir números base 10 a base n.
Ejemplo: Convierta el numeral decimal 255 a uno de base 6.

Ahora bien,
¿qué tiene que ver la división sintética en éste asunto? En el caso específico donde el término constante del factor lineal es negativo (del cual se usa su opuesto en la sustitución sintética) y los coeficientes de un polinomio son positivos, se puede utilizar como convertor de numerales base n a base decimal. A diferencia de la división sintética donde utiliza todos los totales resultantes,para esta aplicación solamente necesitaremos el último total, ya que éste es el numeral base n convertido a base 10.

Para demostrarlo vamos a revertir el numeral base seis del caso anterior a un numeral decimal:



Para aquellos que no han conocido la división sintética, les proveo una explicación del algoritmo de división sintética del caso expuesto arriba:

  • Colocamos en el recuadro la base del numeral y al lado cada uno de los dígitos que componen dicho numeral.
  • Inmediatamente bajamos el primer dígito
  • Colocamos el producto del primer dígito y la base n debajo del segundo dígito.
  • Sume el segundo dígito y el producto.
  • El total generado se vuelve a multiplicar por la base y el producto se coloca debajo del próximo dígito y los suma.
  • Repita el paso anterior hasta que llegue al último dígito. El último total será la conversión a base 10.
 ¿Por qué ocurre ésto? Sencillamente éste caso específico de la división sintética es un casi un proceso inverso al algoritmo de división, inclusive en las operaciones que usa:
  • En el algoritmo de división, se divide, se resta y se separan los residuos, del último dígito numeral base n al primero
  • En el caso aplicativo de la división sintética, del primer dígito numeral base n al último, se juntan los residuos en la suma y se multiplica.
¿Y ésto, tiene alguna utilidad? En parte si. Recuerdo que hace unos meses atrás estaba dándole tutorías a un grupo de estudiantes de secundaria que tomaban clases de electrónica y una de las destrezas era poder convertir números decimales a numerales binarios, octales y hexadecimales. Como ya estaban al nivel de Álgebra II, mostrale éstos métodos hubiese sido bastante beneficioso, de haberlo conocido a tiempo.

Fuente:


El método de Ruffni tambén se puede aplicar a las matrices... vea el blog Series Divergentes: "De la división sintética al álgebra lineal"

4 de noviembre de 2012

Criptografía: Matemática para guardar secretos


No soy una persona que tenga mucho que esconder, pero hay cosas que más vale mantener en secreto. Por mi parte, lo típico: el pin del móvil y el de la tarjeta de crédito, las claves del banco, de las cuentas de correo, del ordenador, y poco más. Si alguien llegara a acceder a mi cuenta bancaria, dependiendo del día del mes, igual hasta le tocaba pagar, y en mi cuenta de correo tampoco hay ningún secreto de estado.

Sin embargo, hay secretos de los que dependen cosas mucho más importantes. A nadie se le escapa que la clave del correo de un presidente de gobierno o de un empresario importante es harina de otro costal. Con un poco de información privilegiada, ganar en la bolsa puede llegar a ser un juego de niños (está claro que no hay otra forma de acceder a esa información privilegiada que accediendo ilegalmente a sus correos, porque nadie duda de la integridad de los que manejan esa información ¿verdad?).

El caso es que aquella mañana de Lunes, durante el desayuno, alguien sacó el tema -creo que el sr. Lego- y, por supuesto, a pesar de mis intentos por desviar la conversación a ámbitos más mundanos, Sofía no podía resistir la tentación de enfrascarse en cualquier conversación que oliera a seguridad informática.

Ya, de perdidos al río -pensé- así que traté de volver a entrar en la conversación:

- ¿Os imagináis tener que mantener en secreto algo como los códigos de lanzamiento de unos misiles nucleares?

¡Vaya! Ya está Alberto con sus paranoias -pude leer en la expresión de el Sr. Lego.

Sofía, sin embargo, fue mucho más directa y menos sutil:

- ¡No digas tonterías! ¿tu te fiarías de alguien tanto como para darle las claves de lanzamiento de un misil nuclear? ¿Y si se vuelve loco y le da por desatar la tercera guerra mundial?

- Quizás se podría dividir la clave en varios fragmentos y repartirlos entre varias personas, así nadie sabe la clave completa y nadie puede lanzar los misiles por su cuenta -dije tratando de impresionar a Sofía.

- Entonces, si fuera un país enemigo sólo tendría que matar a uno de los que tienen la clave para evitar que pudiera lanzar los misiles... o bastaría esperar a que a alguno le de un infarto... ¡jaque mate!

- A ver -continuó el Sr. Lego- necesitamos una forma de repartir fragmentos de la clave entre varias personas de forma que ninguna conozca la clave completa, y además, queremos ser capaces de reconstruir la clave si falla una o más de una de las personas que tienen los fragmentos. Me parece que no es posible.

- Pues siento decir que te equivocas -sonrió Sofía.


En criptografía -continuó Sofía- para resolver este tipo de asuntos se utilizan los llamados esquemas de compartición de secretos. Para este caso concreto se utilizan los esquemas de umbral. Por ejemplo, si queremos repartir un secreto entre m personas y que el secreto pueda recuperarse con n personas, hablamos de un esquema de umbral (m,n), donde n es el umbral.

Parar a Sofía a estas alturas, estaba ya fuera del alcance de cualquier mortal, así que mi única salida fue preguntar, no sin cierta resignación:

Vale, pero ¿cómo funcionan esos esquemas?

Sofía apuró el café que le quedaba en el vaso, se detuvo unos instantes como para componer en su cabeza lo que iba a decir, y continuó:

Hay varios métodos, el más sencillo, quizás, es usar el esquema vectorial, introducido por el matemático George Blakley de la universidad A&M de Texas: Si queremos compartir un secreto con un esquema de umbral (m,n) hacemos corresponder el secreto con un punto P del espacio m-dimensional, y los fragmentos serán hiperplanos de dimensión m-1 que tienen a P como punto de intersección. De esta forma, con m hiperplanos, podemos reconstruir el secreto.

- Por la cara del Sr. Lego, hacía rato que ya no seguía a Sofía. Yo, por mi parte tampoco, pero creía que estaba controlando mejor mi expresión facial hasta que Sofía me miró y sonrió con esa sonrisa piedosa del que se sabe muy por encima de su interlocutor.

Está bien -dijo Sofía tratando de simplificar un poco el asunto- imaginemos que quiero compartir en secreto las tres siguientes cifras: 3,10,5. Y lo quiero hacer entre 4 personas, de forma que sólo con 3 pueda recuperar la clave. Como son tres cifras, podemos pensar en ellas como en un punto P(x,y,z) del espacio de 3 dimensiones. Sólo tendríamos que crear 4 ecuaciones como las siguientes.



Si damos una ecuación a cada una de las cuatro personas, ninguna de ellas podrá conocer el valor del punto P(x,y,z). Sin embargo, si cualquiera de ellas tres se reúnen y resuelven el sistema que forman sus tres ecuaciones, habrán conseguido descifrar el secreto P(3,10,5), aunque no esté una de las personas.

Bastante ingenioso -pensé- no se me hubiera ocurrido, y eso que una vez que conoces el sistema, es bastante obvio.

Otro esquema, algo más elaborado -continuó Sofía- es el esquema de Shamir, que inventó el matemático Adi Shamir. Este esquema es conceptualmente bastante simple, aunque su uso implica algo más que resolver un simple sistema de ecuaciones.

Sofía paró un momento como tratando de ordenar toda la información que tenía en la cabeza y seguidamente preguntó:

- Si dibujo dos puntos en un papel, ¿cuantas líneas rectas existen que pasen exactamente por esos dos puntos?

El Sr. Lego y yo nos miramos unos instantes antes de responder al unisono: una.

- Bien -continuó Sofía- del mismo modo que sólo necesito dos puntos para definir una recta, sólo necesito tres para definir una parábola ¿verdad?

Esto ya no era tan obvio, pero haciendo un acto de fe el Sr. Lego y yo asentimos con la cabeza.

En general, necesitamos n+1 puntos en el plano para definir una curva (polinomio) de grado n ¿os lo demuestro? -preguntó Sofía.

Me apresuré a decir que no era necesario antes de que se lanzara a hacer la demostración matemática.

En general -siguió Sofía- si quiero compartir un secreto repartiéndolos en m fragmentos y con un umbral de n fragmentos, tengo que construir un polinomio de grado n-1.

Imaginemos entonces que quiero compartir en secreto el pin de mi tarjeta de crédito que, digamos, es 3254. Y lo quiero hacer entre 4 personas con un umbral de 3. Necesito, por lo tanto, un polinomio de grado 2 (es decir n-1) que tendrá la forma siguiente:



A los términos a0, a1 y a2 los llamamos coeficientes del polinomio. A a0, que es el término independiente, le asignamos el valor del secreto: en este caso a0=3254. Al resto de coeficientes le asignamos valores aleatorios.

Por ejemplo: a1=12 y a2=25. Una vez definido nuestro polinomio, como quiero repartir el secreto entre 4 personas, necesito el valor de cuatro puntos cualesquiera de la función. Por ejemplo:



En este caso hemos escogido los puntos 1, 2, 3 y 4, pero podrían ser cualesquiera.

A cada una de las personas les damos un par con uno de los puntos y el valor que toma la función en dicho punto. Es decir tendríamos los siguientes cuatro fragmentos:

(1, 3291)
(2, 3378)
(3, 3515)
(4, 3702)

Pero según hemos dicho antes, un polinomio de grado n está definido de forma inequívoca por por n+1 puntos, así que como nuestro polinomio era de grado 2, sólo necesitamos 3 de los puntos (fragmentos) para poder reconstruirlo.

La idea está clara -respondí- pero ¿cómo se reconstruye un polinomio a partir de unos puntos?

No te preocupes, Alberto, eso lo resolvió Lagrange hace ya algunos añitos. Podemos usar el polinomio interpolador de Lagrange para obtener el polinomio original, pero ¿realmente necesitamos todo el polinomio original? -nos desafió Sofía.

No, sólo el término independiente del polinomio, que es el que contiene el secreto -respondió el Sr. Lego sorprendiendo a propios y a extraños.

Efectivamente Sr. lego. No voy a entrar en detalles matemáticos, que son un poco aburridos, pero tras jugar un poco con el polinomio de Lagrange, podemos llegar a la siguiente formulita que nos devuelve el término independiente del polinomio.



Siendo las x los puntos y las y los valores que toma la función en dichos puntos.

Como véis, la formulita de marras se puede modelar muy bien con un par de bucles así que es fácil hacer un programa para generar y develar secretos con el esquema de Shamir.

A la vuelta del desayuno, ya en la oficina, Sofía nos envió las siguientes dos funciones para generar secretos y para desvelarlos. Eso sí -nos advirtió- ningún secreto está a salvo para siempre.


  1. from math import ceil
  2. from random import random
  3. def gen_secret(secret, users, threshold):
  4.     out = []
  5.     max_value=100   # valor maximo factores
  6.     n=threshold     # grado del polinomio
  7.     # generar polinomio grado n
  8.     factores=[]
  9.     fragmentos=[]
  10.     factores.append(secret)
  11.     for i in range (1,n):
  12.         t=ceil(random()*max_value)
  13.         factores.append(t)
  14.    
  15.     # generar n fragmentos
  16.     for i in range(users):
  17.         # escogemos punto t de la funcion aleatorio
  18.         t=int(ceil(random()*max_value))
  19.         # calcular valor de f(t)
  20.         v=factores[0]
  21.         for j in range(1,n):
  22.           v=v+factores[j]*(t**j)
  23.      
  24.         fragmentos.append([t, int(v)])
  25.     out=fragmentos
  26.     return out
  27. def recover_secret(fragments, threshold):
  28.     out = 0
  29.     if len(fragments)<threshold:
  30.         print "faltan fragmentos"
  31.     else:
  32.         for i in range(threshold):
  33.             tmp_j=1
  34.             for j in range(threshold):
  35.                 if j!=i:
  36.                     tmp_j=tmp_j*(fragments[j][0]/float((fragments[j][0]-fragments[i][0])))
  37.             out=out+(fragments[i][1]*tmp_j)
  38.     return int(out)
  39. # calculamos 4 fragmentos para secreto 1234 con umbral 3
  40. s=gen_secret(1234,4,3)
  41. # recuperamos el secreto con 3 fragmentos
  42. print recover_secret(s, 3)

Fuente:

26 de septiembre de 2012

Por qué no hay solución general de la ecuación de quinto grado

La resolución de ecuaciones polinomicas es un tema al que quien más quien menos se ha acercado en su etapa de estudiante. Todos sabemos cómo resolver una ecuación de primer grado (despejando la incógnita) y la gran mayoría recordamos la famosa fórmula para resolver ecuaciones de segundo grado. También muchos, aunque posiblemente menos, sabrán que hay fórmulas del mismo tipo para las ecuaciones de grados tres y cuatro. Y algunos menos que no se puede resolver de manera general la ecuación de quinto grado. Pero, ¿sabemos por qué?

Lo que sacamos como conclusión del párrafo anterior es que existen fórmulas generales para la resolución de ecuaciones de grados uno, dos, tres y cuatro, pero no existe tal fórmula para las de grado cinco (ni para grados superiores). ¿Esto significa que ninguna ecuación de grado cinco puede resolverse? No. Esto significa que dada una ecuación cualquiera de grado cinco, no podemos calcular de manera general sus soluciones con el simple conocimiento de sus coeficientes, mientras que con ecuaciones hasta grado cuatro sí que tenemos fórmulas que nos las calculan.

Entendido esto, surge de manera natural preguntarse por qué ocurre esto. ¿Por qué dejamos de tener solución general cuando llegamos al grado cinco? Lo que vamos a hacer en esta entrada es explicar matemáticamente por qué esta fórmula general no existe para ecuaciones de quinto grado. Y, sin lugar a dudas, los matemáticos protagonistas de esta historia son Évariste Galois y Niels Henrik Abel.
Las matemáticas encargadas de ayudarnos a demostrar que tal fórmula general no existe no son sencillas, y ni mucho menos evidentes. La teoría encargada de echarnos una mano para recorrer este camino será la teoría de grupos, teoría perteneciente a lo que podríamos llamar matemáticas avanzadas, y más concretamente la teoría de Galois. Pero que esto no os asuste, intentaremos hacer el camino lo más llevadero posible para que nadie esté obligado a abandonar a mitad de travesía.

Évariste Galois

Évariste Galois (Fuente: MacTutor)

La idea brillante, y la verdadera clave de todo este asunto, fue el descubrimiento de que a cada ecuación polinómica se le podía asignar un cierto grupo (grupo: estructura algebraica que cumple ciertas propiedades), denominado grupo de Galois de la ecuación. No nos interesa saber qué es exactamente un grupo, ni cómo contruir este grupo de Galois en cada caso, simplemente que cada ecuación polinómica está asociada a su grupo de Galois.

Una de las muchas propiedades interesantes que puede tener (o no) un grupo es la solubilidad. Es decir, hay grupos solubles (también llamados resolubles) y grupos que no lo son. La definición de grupo resoluble es algo avanzada (para los interesados está al final del post), pero para continuar leyendo no es necesario conocerla. Lo que sí es interesante saber, y de hecho es uno de los pasos importantes en todo esto, es que Galois demostró que se pueden expresar convenientemente las soluciones de una ecuación polinómica si y sólo si el grupo de Galois de dicha ecuación es resoluble. Esto, si os fijáis, es bastante fuerte, ya que el hecho de expresar convenientemente las soluciones de una ecuación se reducía simplemente al estudio del grupo de Galois de dicha ecuación, y sobre grupos ya se conocían muchas cosas.

Niels Henrik Abel

Niels Henrik Abel (Fuente: MacTutor)

Bien, vamos con el segundo y último paso. El grupo de Galois de una ecuación cualquiera de grado uno, dos, tres o cuatro es siempre resoluble, por lo que siempre podemos expresar las soluciones de dichas ecuaciones en radicales (esto de en radicales es la forma de llamar a la expresión de dichas soluciones, lo que hemos llamado antes expresar convenientemente, no nos asustemos). ¿Y el de una ecuación de grado mayor o igual que 5? Pues…en general no. Es decir, el grupo de Galois de una ecuación cualquiera de grado cinco (o mayor) no es resoluble. Eso es lo que dice el teorema de Abel-Ruffini, también conocido como teorema de imposibilidad de Abel (también al final de este post tenéis algún detalle más matemático de este asunto).

Por tanto, no podemos aspirar a tener una fórmula general que nos dé todas las soluciones de una ecuación cualquiera de grado cinco o superior. Podremos expresar en radicales las soluciones de algunas (las que tengan grupo de Galois asociado resoluble), pero siempre habrá ecuaciones de grado cinco o mayor cuyo grupo de Galois no sea resoluble.

Fin de la historia, y esta vez con final feliz…¿o no? Bueno, depende. Por un lado quizás el hecho de que no existan esas fórmulas para el caso general con grado mayor o igual que cinco puede dejarnos una sensación de vacío difícil de llenar, pero por otra parte dejamos el problema totalmente resuelto: hasta grado cuatro tenemos fórmulas y de grado cinco en adelante no tenemos que preocuparnos de buscarlas porque no las hay. ¿En qué bando estáis, en final feliz o final vacío?

Vamos con el contenido más difícil en:

20 de agosto de 2012

La estructura algebraica del Universo


Para el profano toda la matemática es lo mismo y, sin embargo, no todas las matemáticas son creadas iguales. Existe una rama de ellas que es tremendamente abstracta, tanto que sólo los matemáticos especializados en ella le encuentran algún sentido: el álgebra abstracta. Paradójicamente el universo parece recogerse en ella.

El álgebra como abstracción comenzó su camino a finales del siglo XVIII y floreció en el XIX. Sin embargo, cada uno de sus pasos se encontró con la incomprensión de la mayoría de los matemáticos con mentalidades más clásicas (enfocadas a la geometría) o más modernas (fascinadas por el análisis y sus aplicaciones en física e ingeniería). Este fue el caso de Abel, Ruffini, Galois o Grassmann. El caso de este último es muy ilustrativo: hoy día cualquier estudiante universitario que haya tenido un curso de matemáticas ha estudiado a Grassmann sin saberlo, es lo que llamamos álgebra lineal. Grassmann en su día tuvo que abandonar las matemáticas por la incomprensión de un Cauchy, un Möbius o un Hamilton y dedicarse a su otra pasión, el sánscrito, lo que, esta vez sí, le granjeó un doctorado honorífico por la Universidad de Tubinga. Y es que esas abstracciones suyas de vectores y espacios vectoriales no tenían utilidad alguna, no digamos ya grupos, anillos o cuerpos.

En 1960 Eugene Wigner escribió un ensayo titulado “La irrazonable efectividad de las matemáticas en las ciencias naturales” en el que se maravillaba de que estos productos de la pura abstracción humana, estos grupos y matrices, estos espacios y variedades, terminasen siendo imágenes de cosas reales o procesos reales en el mundo real. Y es que la revolución de la física de la primera mitad del siglo XX encontró apoyo en las ideas más abstractas del siglo XIX para la descripción tanto del universo a gran escala como del interior del átomo. De hecho, las física más especulativa del siglo XXI también se apoya en los aspectos más abstractos del álgebra del siglo XX. Veamos, a título de ilustración y sin ánimo de ser exhaustivos, algunos ejemplos.

Teoría especial de la relatividad (1905)

Las mediciones del espacio y el tiempo realizadas en un marco de referencia pueden ser “traducidas” a mediciones hechas en otro (que se mueve, por supuesto, a una velocidad constante con respecto al primero) mediante la transformación de Lorentz. Estas transformaciones pueden incluirse en un modelo como rotaciones de un sistema de coordenadas en un cierto espacio de cuatro dimensiones. En otras palabras, un grupo deLie (1870).

Teoría general de la relatividad (1916)

El espacioteimpo de cuatro dimensiones se curva (distorsiona) por la presencia de materia y energía. Para describir este fenómeno adecuadamente hemos de recurrir al cálculotensorial, iniciado por Hamilton (1846), desarrollado por Ricci-Curbastro (1890) basándose en Riemann y Grassmann, y popularizado por Levi-Civita (1900).

Mecánica cuántica matricial (1925)

Cuando el joven Werner Heisenberg estaba trabajando con las frecuencias de las radiaciones emitidas por un átomo que “salta” de un estado cuántico a otro, se encontró mirando varios cuadros de datos que tenían como característica que el número de la columna n-ava de la fila m-ava representaba la probabilidad de que un átomo “saltase” del estado m al estado n. La lógica de la situación le indicaba que tenía que multiplicar estos cuadros entre sí y sugirió la única técnica adecuada para hacerlo. Pero, cuando intentó llevar a cabo la multiplicación efectiva, se encontró con la sorpresa de que no era conmutativa. Multiplicar el cuadro A por el cuadro B no era lo mismo que multiplicar el cuadro B por el cuadro A. ¿Qué estaba pasando? Su suerte fue que investigaba en la Universidad de Gotinga y Emmy Noether y David Hilbert le explicaron muy amablemente la teoría de matrices que Cayley ya recogía en un libro de texto (1858), y las contribuciones posteriores de Hamilton, Frobenius y Cauchy, entre otros.

Hadrones y quarks (1964)
Para comienzo de los años 60 del siglo XX los físicos habían descubierto todo un mundo de partículas subatómicas llamadas hadrones. Murray Gell-Mann, a la sazón un joven investigador en el Instituto de Tecnología de California, se dio cuenta de que las propiedades de los hadrones, si bien no seguían un patrón lineal evidente, adquirían sentido como parte de un grupo de Lie, uno que aparece cuando estudiamos las rotaciones en un espacio bidimensional cuyas coordenadas sean números complejos. Trabajando con esta idea y los datos, Gell-Mann se dio cuenta de que su primera impresión era superficial. El grupo equivalente de 3 dimensiones complejas explicaba muchas más cosas pero requería de la existencia de partículas que aún no se habían observado. Gell-Mann se fió de su intuición, sus datos y las matemáticas y publicó lo que había encontrado. Las partículas que había predicho Gell-Mann dieron en llamarse quarks.

Teoría de cuerdas (1985)

Trabajando con algunas ideas de Riemann, Erich Kähler propuso en los años 30 del siglo XX una familia de variedades que tienen una propiedades generales muy interesantes. Cada superficie de Riemann, por ejemplo, es una variedad de Kähler. Entre 1954 y 1957 Eugenio Calabi identificó una subclase de variedades de Kähler y conjeturó que su curvatura debía tener un tipo de simplicidad muy interesante. Esta conjetura de Calabi fue demostrada por Shing-tung Yau en 1977.

En 1985 el grupo de investigación de Edward Witten se refirió a esta subclase de variedad como Calabi-Yau en un trabajo en el que identificaban su lisura (suavidad, ausencia de irregularidades), la simplicidad de su curvatura, como el trasfondo ideal en el que ubicar los movimientos de las cuerdas que, según la teoría, nuestros instrumentos interpretan como toda la variedad de partículas subatómicas y fuerzas, incluida la gravedad. El hecho de que la variedad de Calabi-Yau tenga 6 dimensiones parece muy raro, pero resulta que 3 de ellas están “plegadas” desde nuestra perspectiva macroscópica, de la misma forma que una maroma de barco manifiestamente tridimensional parece unidimensional a una distancia suficiente.

Una vez dije en una conferencia que la física del futuro, la descripción del universo que compartirán nuestros nietos, existe ya en la facultad de matemáticas. Eso sí, puede que la distribución no sea isótropa, y haya algo más concentración en los departamentos de álgebra.
 
Fuente:
 

3 de agosto de 2010

Los inventores de los ceros y unos

Vamos a volver al colegio. Hagamos un ejercicio sencillito. Vamos a contar de cero en adelante: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10... ¡eh! ¡Quieto parao! Este último número es ya distinto: tiene dos dígitos, y los que le siguen también. Si examinamos la serie veremos que en realidad sólo tenemos diez cifras distintas. De ahí viene el nombre de este modo de hacer números: el sistema decimal.

Las razones por las que contamos de diez en diez son sencillas. Mírese las manos y cuente. Salvo que la genética o una máquina de picar carne le hayan hecho una gracieta tendrá usted diez dedos. Por eso ha sido empleado de forma casi universal, aunque algunas culturas como la de los mayas hayan empleado un sistema de numeración vigesimal. Quizá porque iban descalzos por ahí.

En cualquier caso, no es difícil imaginar un sistema de numeración distinto. Pensemos en cómo sería un sistema octal, es decir, uno en el que hubiera sólo ocho cifras distintas. Contaríamos así: 0, 1, 2, 3, 4, 5, 6, 7, 10, 11, 12... en este caso, el 10 del sistema octal sería equivalente al 8 del decimal.

Pues bien, allá por el siglo XVII, el alemán Gottfried Leibniz publicó un artículo titulado Explicación de la Aritmética Binaria. Consistía, resumiéndolo mucho, en lo mismo que yo he hecho en el párrafo anterior pero limitándose a dos cifras: el cero y el uno, así como el estudio de las distintas operaciones aritméticas que podían hacerse con estos números. Curiosamente, unos años antes, el monje español Juan Caramuel también estudió el sistema binario, así como los que tienen las bases 3, 4, 5, 6, 7, 8, 9, 10, 12 y 60, aunque no con tanta profundidad.

Leibniz, que también inventaría el cálculo diferencial de forma independiente a Newton, se inspiró en el I Ching y el asunto del yin y el yang, y concluyó que los 64 hexagramas del famoso libro chino no son más ni menos que los números del 0 al 63 expresados en binario. Eso lo llevó a considerar este sistema numérico como una suerte de lenguaje universal que uniría a todas las naciones y razas; también a percibir en él la creación, en la que el uno era Dios y el cero el Vacío. Ser un genio no supone necesariamente tener la azotea en su sitio.

Boole, el creador del álgebra de Boole (claro)

Durante un par de siglos, aquello del sistema binario no tuvo mucho más recorrido, principalmente porque no servía para nada útil. En esto llegó un señor llamado George Boole, matemático y el principal responsable junto a De Morgan del nacimiento de la disciplina de la lógica formal, un campo que desde Aristóteles había avanzado más bien poquito.

Boole nació en 1815 en Lincolnshire, un condado rural del que salieron, entre otros, personajes como Isaac Newton o Margaret Thatcher. Era hijo de un zapatero remendón, así que a pesar de que su familia le permitió estudiar, tuvo que abandonar el colegio a los dieciséis para ayudar en casa. Dado que en su escuela no lo enseñaban, aprendió latín y griego de forma autodidacta, lo que le permitió encontrar empleo como profesor y hallar en las matemáticas su vocación.

Boole creía ya entonces que todo el pensamiento humano podía formularse en términos matemáticos, pero no pudo dedicarle tiempo a desarrollar su idea, que si no su familia se moría de hambre. Sólo cuando prosperó, abriendo su propia escuela de matemáticas, empezó a investigar y a publicar su trabajo, que le valió un puesto en la Queen’s College de Cork, Irlanda, donde se casó con la sobrina de George Everest, el de la montaña, y publicó su trabajo fundamental sobre lógica: Las leyes del pensamiento. En su obra, redujo todos los razonamientos humanos a decisiones de sí o no, o lo que es lo mismo, de uno o cero. Encontró la forma de formalizar lo que pensamos a fórmulas matemáticas y poder operar con ellas para extraer conclusiones nuevas. En definitiva, se adelantó como cien años al trabajo que harían los ordenadores y quienes los programan.

En 1864, George Boole murió de una neumonía tras caminar dos millas bajo una intensa lluvia para ir a dar una clase. Su último trabajo eran tan raro que ni los miembros de la Royal Society pudieron descifrarlo. No obstante, sus "leyes del pensamiento" fueron más o menos ignoradas por los científicos al no encontrarle una utilidad práctica. Eso no significa que no tuvieran influencia en nadie; Lewis Carroll era un gran fan suyo y buena parte de sus libros sobre Alicia están escrito con la lógica de Boole en mente, como muestra este diálogo de A través del espejo:

– Es larga – dijo el Caballero – pero es muy, muy hermosa... A todo el que me la oye cantar, o se le llenan los ojos de lágrimas...

– ¿O qué? – preguntó Alicia, al ver que el Caballero se había quedado a media frase.

– O no se le llenan.

Shannon, el santo patrón de los telecos

Claude Shannon ha hecho tantas contribuciones a la ciencia de la informática y las telecomunicaciones que vamos a empezar por la menor: buscando una palabra para los dígitos binarios inventó el bit, resultado de contraer BInarydigiT. También creó la disciplina conocida como teoría de la información, que es la base matemática que permite, entre otras cosas, que a ratos a usted le funcione el móvil. También publicó un artículo en 1949 sobre la automatización del juego del ajedrez que es la base de todos los jugadores computerizados, incluyendo al célebre Deep Blue. No obstante, su mayor contribución fue también la primera, la que puso negro sobre blanco en su tesis, comenzada en 1935 y terminada en 1937.

Nacido en un distrito rural, aunque en este caso del medio oeste norteamericano, Shannon hizo el doctorado en el Instituto Tecnológico de Massachusetts, el célebre MIT. Allí abordó el problema al que se enfrentaban los creadores de computadoras: el diseño de circuitos electrónicos que pudieran realizar funciones útiles, como pueda ser la suma de dos números. Sin ningún sustento teórico que les facilitara la vida, el problema resultaba enormemente complejo. En realidad, ya estaba casi resuelto, solo que nadie lo sabía.

Shannon se encontró por casualidad con un ejemplar de Las leyes del pensamiento y se dio cuenta rápidamente de que el libro contenía la solución a sus problemas. Bastaba con considerar que falso, o cero, era equivalente a estar apagado, o lo que es lo mismo, no tener corriente eléctrica; y verdadero, o uno, a estar encendido. A partir de ahí, construyó sobre las operaciones lógicas del álgebra de Boole (AND, OR y NOT), que podían implementarse con válvulas de vacío, y terminó su tesis mostrando que un circuito que sumara en sistema binario podía hacerse con veintiuna operaciones lógicas: doce "y", seis "o" y tres "no".

Desde entonces, la tecnología ha evolucionado mucho, primero con la invención del transistor y luego con el circuito integrado. Pero todos los ordenadores emplean las llamadas "puertas lógicas", que no son más que implementaciones de las operaciones de lógica binaria, de síes y noes, de ceros y unos. Eso sí, en un microprocesador actual puede haber varios centenares de millones.

Shannon siempre fue muy modesto, y parecía avergonzarse cuando los alumnos a los que enseñaba teoría de la información en el MIT le recordaban que la disciplina la había inventado él. En 2001, Bell Labs organizó una exposición en la que detallaba la importancia de sus contribuciones en el día a día del hombre del siglo XXI. No apareció por la inauguración y murió sólo dos semanas después, recibiendo un breve obituario en algunos periódicos. Pocos saben cuánto le debemos, a él y a sus predecesores. Gracias al trabajo teórico de Leibniz, Boole y Shannon, aunque sólo el último lo hiciera consciente de su objetivo, tenemos ordenadores.

Pinche aquí para acceder al resto de la serie CEROS Y UNOS.

google.com, pub-7451761037085740, DIRECT, f08c47fec0942fa0