El Libro De Las Demostraciones

  • Uploaded by: Edwin Rodriguez
  • 0
  • 0
  • March 2021
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View El Libro De Las Demostraciones as PDF for free.

More details

  • Words: 92,926
  • Pages: 231
Loading documents preview...
1111111111111111111111

1111111111111

BIBLIOTECA CENTRAL ------

---,,-

! !

11-

tercera edición inglesa de

Figueiras Julian Pedro

Ramos

o L B R S EDICIONES

Traslation from the English language edition: Proofs /rom THE BOOK by Martin Aigner, Günter M. Ziegler Copyright © Springer-Verlag Berlin Heidelberg 1998,2001,2004 Springer is a part of Springer Science+Business Media All Rights Reserved

1a edición en castellano: junio de 2005

Imagen de cubierta: Detalle de paramento de La Alhambra (Archivo NIVOLA). © Martín Aigner, Günter M. Ziegler, 2005 © NIVOLA libros y ediciones, S.L. Apartado de Correos 113. 28760 Tres Cantos Te\.: 918045817. Fax: 9180493 17 www.nivola.com correo electrónico: [email protected] ISBN: 84-95599-95-3 Depósito legal: M-25.892-2005 Impreso en España

Sin la autorización escrita de los titulares del copyright, queda rigurosamente prohibida la reproducción parcial o total de esta obra por cualquier medio o procedimiento, comprendidos la reprografía y el tratamiento informático.

De acuerdo con la acertada afirmación de G. H. Hardy que reza que no hay lugar permanente para las matemáticas feas, a Paul Erd6s le gustaba hablar de El Libro, en el que Dios recopila demostraciones perfectas de los teoremas matemáticos. Erd6s también decía que, si eres matemático, no es necesario que seas creyente, pero sí que creas en El Libro. Hace unos años le sugerimos escribir una primera y modesta versión de El Libro. Estaba encantado con la idea y empezó a trabajar inmediatamente con su entusiasmo habitual, llenando páginas y páginas de sugerencias. Estaba previsto que este libro se publicara en marzo de 1998, como regalo en el día que Erdos cumpliese ochenta y cinco años. Su desafortunada muerte en el verano de 1996 ha hecho que dediquemos este libro a su memoria, en lugar de que él mismo aparezca como autor. No tenemos una definición que caracterice las demostraciones de El Libro: todo lo que ofrecemos es una colección de ejemplos, que hemos seleccionado con la esperanza de que nuestros lectores puedan compartir nuestro entusiasmo cuando nos encontramos ante ideas brillantes, maneras geniales de acercarse a un problema, o bonitas y precisas observaciones. También esperamos que los lectores puedan disfrutar a pesar de las imperfecciones que pudiera tener nuestra exposición. La selección de los temas está muy influida por Paul Erdos: una buena parte de ellos fueron sugeridos por él mismo, y además de las demostraciones que llevan su firma, muchas otras fueron iniciadas gracias a su suprema cualidad para formular la pregunta precisa o dar con la conjetura adecuada. De modo que, en gran parte, este libro refleja el punto de vista de Paul Erdos respecto a lo que debería ser una demostración de El Libro. Uno de los factores que nos han limitado en la selección de los contenidos ha sido que todas las demostraciones que se incluyen en este libro deberían resultar accesibles para cualquier lector con un dominio modesto de técnicas y conceptos matemáticos. Un poco de álgebra lineal, análisis y teoría de números y un buen puñado de conceptos elementales de matemática discreta deberían ser suficientes para comprender y disfrutar la lectura. Hacemos público nuestro agradecimiento más profundo a muchas personas que nos han ayudado y brindado su apoyo en este proyecto, y entre ellas a los estudiantes de un seminario en el que discutimos una versión peliminar, a Benno Artmann, Stephan Brandt, Stefan Felsner, Eli Goodman, Torsten Heldmann, y Hans Mielke. Agradecemos también a Margrit Barrett, Christian Bressler, Ewgenij Gawrilow, Michael Joswig, Elke Pose, y Jbrg Rambau por su ayuda técnica en la composición del libro, a Tom Trotter que leyó el original desde la primera a la última página, a Karl H. Hofmann por sus maravillosos dibujos y, sobre todo, a Paul Erdos. Berlín, marzo de 1998

Martin Aigner . Günter M. Ziegler

Paul Erdos

El Libro

La primera edición de este libro tuvo una estupenda acogida y recibimos un número inusual de cartas que contenían comentarios, correcciones, pasos más abreviados en algunas ocasiones, demostráciones alternativas y nuevos temas para considerar. (Aunque intentamos recoger demostraciones peifectas, nuestra exposición no lo es.) Esta segunda edición nos brinda la oportunidad de presentar una nueva versión: hemos incluido tres capítulos adicionales, revisiones sustanciales y nuevas demostraciones, además de algunas mejoras y enmiendas menores, muchas de ellas basadas en las sugerencias que hemos recibido. Hemos suprimido también uno de los capítulos antiguos, "sobre el problema de las trece esferas," cuya demostración necesitaba introducir algunos arreglos que no podían ser completados de forma que resultara una demostración breve y elegante. Gracias a todos los lectores que nos escribieron y nos ayudaron, entre ellos, Stephan Brandt, Christian Elsholtz, Jürgen Elstrodt, Daniel Grieser, Roger Heath-Brown, Lee L. Keener, Christian Lebceuf, Hanfried Lenz, Nicolas Puech, John Scholes, Bernulf WeiBbach, y muchos otros. Gracias de nuevo por su ayuda y apoyo a Ruth Allewelt y Karl-Friedrich Koch de la editorial Springer en Heidelberg, a Christoph Eyrich y Torsten Heldmann en Berlín, y a Karl H. Hofmann por los nuevos e igualmente estupendos dibujos. Berlín, septiembre de 2000

Martin Aigner . Günter M. Ziegler

Nunca hubiéramos soñado con el éxito que ha alcanzado este libro mientras preparábamos su primera edición en 1.998. Ha sido traducido a una gran cantidad de idiomas y contamos con las respuestas entusiasmadas de muchos lectores que han aportado sugerencias interesantes para su mejora, adendas y nuevos temas, que nos podrían mantener ocupados aún unos cuantos años. En esta tercera edición aparecen dos nuevos capítulos, el primero acerca de las identidades de Euler para particiones y el segundo sobre diferentes estrategias de barajar un mazo de naipes. Hemos incluido a lo largo del libro algunas mejoras, como el método de Calkin, Wilf y N ewman en la enumeración de los racionales, y en un capítulo independiente tres demostraciones de las series de Euler. Por ahora, eso es todo. Expresamos nuestro agradecimiento a quienes han apoyado este proyecto en los últimos cinco años y cuya implicación ha marcado la diferencia en esta nueva edición. Gracias a David Bevan, Anders Bjorner, Dietrich Braess, John Cosgrave, Hubert Kalf, Günter Pickert, Alistair Sinclair, y Herb Wilf. Berlín, julio de 2003

Martin Aigner . Günter M. Ziegler

____________________________ 1 1. Seis demostraciones de la infinidad de números primos .............. 3 2. El postulado de Bertrand .......................................... 7 3. Los coeficientes binomiales casi nunca son potencias ............... 13 4. Representación de enteros como suma de dos cuadrados ............ 17 5. Cualquier anillo de división finito es un cuerpo ..................... 23 6. Algunos números irracionales .................................... 27 7. Tres veces 1f2/6 ................................................ 35

8. El tercer problema de Hilbert: descomposición de poliedros ......... 45 9. Rectas en el plano y descomposición de grafos ..................... 53 10. El problema de la pendiente ...................................... 59 11. Tres aplicaciones de la fórmula de Euler ........................... 65 12. El teorema de rigidez de Cauchy ................................. 71 13. Símplices en contacto ........................................... 75 14. Cualquier conjunto con muchos puntos tiene un ángulo obtuso ...... 79 15. La conjetura de Borsuk .......................................... 85

16. Conjuntos, funciones y la hipótesis del continuo ................... 93 17. Aquellas maravillosas desigualdades ............................. 109 18. Un teorema de Pólya sobre polinomios ........................... 117 19. Sobre un lema de Littlewood y Offord ........................... 123 20. La cotangente y el truco de Herglotz ............................. 127 21. La aguja de Buffon ............................................ 133

~

___________________________ 1

22. El principio del palomar y el doble recuento ...................... 139 23. Tres teoremas famosos sobre conjuntos finitos .................... 151 24. Barajando el mazo ............................................. 157 25. Caminos, retículas y determinantes .............................. 167 26. La fórmula de Cayley para el número de árboles .................. 173 27. Completando cuadrados latinos ................................. 179 28. El problema de Dinitz .......................................... 185 29. Identidades y biyecciones ....................................... 191

_____________________________ 1 30. Cinco-coloración de grafos planos ............................... 199 31. Cómo vigilar un museo ......................................... 203 32. El teorema de Turán ............................................ 207 33. Comunicar sin errores .......................................... 213 34. Sobre amigos y políticos ....................................... 223 35. La probabilidad nos 10 pone fácil (a veces) ....................... 227

Sobre índice temático ________________________

1 Seis demostraciones de la infinidad de números primos 3 2 El postulado de Bertrand 7

3 Los coeficientes binomiales casi nunca son potencias 13

4 Representación de enteros como suma de dos cuadrados 17

5 Cualquier anillo de división finito es un cuerpo 23

6 Algunos números irracionales 27

7 Tres veces Jr2/6 35

"La irracionalidad y Jr"

1

Es natural que comencemos estas páginas con la que probablemente es la más antigua de las demostraciones de El Libro, que se atribuye a Euclides (Ele20). Demuestra que la sucesión de números primos es infinita . mentos

• La demostración de Euclides. Para cualquier conjunto finito {PI, ... ,Pr } de números primos, consideramos el número n = PIP2 ... Pr + l. Este n tiene un divisor primo p. Pero P no es uno de los Pi; de otro modo, P sería un divisor de n y del producto PIP2 ... Pr, Y en consecuencia también de la diferencia n - PIP2 ... Pr = 1, lo cual es imposible. Por lo tanto, un conjunto finito D {PI, ... ,Pr } no puede recoger todos los números primos. Antes de continuar, acordaremos qué notación utilizaremos en adelante: para el conjunto de los numero s naturales escribiremos N = {1, 2, 3, ... }, para el de los números enteros Z = { ... , -2, -1, O, 1, 2, ... }, y lP' = {2, 3, 5, 7, ... } denotará el conjunto de los números primos. A continuación exponemos algunas otras demostraciones (de las muchas que existen) y que esperamos que agraden a los lectores tanto como a nosotros. Aunque utilizan diferentes puntos de vista, la siguiente idea es común a todas ellas: los números naturales crecen más alla de todo límite, y todo número natural n :::: 2 tiene un divisor primo. Estos dos hechos tomados conjuntamente obligan a que el conjunto lP' sea infinito. La siguiente demostración es de Christian Goldbach (en una carta a Leonhard Euler en 1730); la tercera es anónima y muy popular; la cuarta es del mismo Euler; la quinta fue propuesta por Harry Fürstenberg y la última es de Paul Erdos . • Segunda demostración. Fijémonos en primer lugar en los números de 2n Fermat Fn = 2 + 1 para n = 0,1,2, .... Demostraremos que cualesquiera dos números de Fermat son primos entre sí; de aquí se deduce que debe haber infinitos números primos. Para ello, comprobaremos que se verifica n-I

(n:::: 1), k=ü

a partir de lo cual nuestra afirmación se demuestra de manera inmediata. En efecto, si m es un divisOf, digamos de Fk Y Fn (k < n), entonces m es divisor de 2, y deducimos que m = 1 ó m = 2. Pero la opción m = 2 es imposible ya que todos los números de Fermat son impares.

3 Fo FI 5 17 F2 257 F3 65537 F4 641 . 6700417 Fs Los primeros números de Fermat

4

Seis demostraciones de la infinidad de números primos

= 1 tenemos Fo = 3 Y

Probamos la recursión por inducción sobre n. Para n Fl - 2 = 3. Por inducción concluimos

Teorema de Si G es un grupo multiplicativo finito y U un subgnlpo, entonces IUI divide a IGI.

• Demostración. Consideramos la relación binaria a ~ b: {==} ba- 1 E U. A partir de los axiomas de grupo se sigue que ~ es una relación de equivalencia. La clase de equivalencia que contiene a un elemento a es pre~ cisamente la clase

Ua={xa:xEU}. Puesto que IU al IUI, encontramos que G se descompone en clases de equivalencia, todas de tamaño IUI, de donde deducimos O que IUI divide a IGI. En el caso esencial en el que U sea un subgrupo cíclico {a,a 2 , .•. ,a"'}, resulta que m (el más pequeño de los enteros positivos tales qne a m = 1, llamado el orden de a) divide al cardinallGI del grupo.

n-l

n

Fk = (

Fk )Fn = (Fn - 2)Fn

k=O

k=O

= (2 2n _1)(2 2n

+ 1)

=

22n+l - 1

=

Fn+1

-

2.

O

• Tercera demostración. Supongamos que lP' es finito y P es el mayor de todos los números primos. Consideraremos los llamados números de Mersenne 2P - 1 Y demostraremos que cualquier factor primo q de 2P - 1 es mayor que p, lo cual nos conducirá a la conclusión deseada. Sea q un divisor primo de 2P - 1, por lo tanto tenemos 2P == 1 (mod q). Puesto que p es primo, el elemento 2 tiene orden p en el grupo multiplicativo Zq \ {O} del cuerpo Zq. Este grupo tiene q - 1 elementos. Por el teorema de Lagrange (ver el margen), sabemos que el orden de cualquier elemento.divide O al cardinal del grupo, esto es, p I q - 1, Y de aquí que p < q. La demostración que presentamos a continuación utiliza cálculo elemental.

• Cuarta demostración. Sea 7r(x) := #{p ~ x : p E lP'} el cardinal del conjunto de números primos que son menores o iguales que el número real x. Enumeramos los primos lP' = {Pl,P2,P3, ... } en orden creciente. Consideramos el logaritmo neperiano log x, definido como log x = tdt.

J;

t

Comparando el área bajo la gráfica de f(t) = con una función escalera superior (véase también el apéndice en la página 10 para más información sobre este método), concluimos que para n ~ x < n + 1 se tiene que logx

1

1

2

3

1 n-l

1 n

< 1+-+-+ ... + - - + <

¿

~,

donde la suma se extiende sobre todos los m E N m que sólo tienen divisores primos p ~ x.

Puesto que cualquiera de estos m puede escribirse de manera única como producto de la forma pk p , deducimos que esta última suma es

n

1

p~X

rr (¿--\:).

pElP'

k;:O:O P

p~X

1

2

Escalera superior para f (t)

n n+l

=

t

La suma en el interior del paréntesis es una serie geométrica de razón ~, con lo cual sabemos que 1f(X)

Pk -1 Pk k=l

logx <

Ahora es claro que Pk 2: k

+ 1, Y en consecuencia

k + 1 1 1 Pk --=1+--<1+-= k ~-1

~-1

-

k

Seis demostraciones de la infinidad de números primos

5

----------------------------------------------------

por tanto lr(X)

logx <

k

+1

-k- = 1f(x)

+ l.

k=l

De todos es sabido que log x no está acotado, y por tanto concluimos que 1f(.T) tampoco está acotado, así que existe un número infinito de primos. O • demostración. Después del análisis ... ¡le toca el turno a la topología! Consideramos una curiosa topología en el conjunto Z de los números enteros. Para a, b E Z, b > O, sea Na,b

{a

=

+ nb : n

E

Z}.

Cada conjunto Na,b es una progresión aritmética infinita en los dos sentidos. Un conjunto O <;;; Z es abierto si, o bien O es vacío, o si para todo a E O existe algún b > O tal que Na,b <;;; O. Es evidente que la unión de abiertos es un abierto. Si 0 1 , O 2 son abiertos, y a E 0 1 n O 2 con Na,b 1 <;;; 0 1 Y N a,b2 <;;; O 2 , entonces a E N a,b 1 b2 <;;; 0 1 n O 2 . Por tanto, podemos concluir que la intersección finita de abiertos es abierto. Así, esta familia de conjuntos abiertos induce una topología en Z. Nótese que se verifican las afirmaciones siguientes: (A) Cualquier conjunto abierto no vacío es infinito. (B) Cualquier conjunto Na,b también es cerrado. Efectivamente, la primera afirmación se sigue inmediatamente de la definición. Para la segunda, observamos que b-1

Na,b

=

.z \ UNa+i,b, i=l

lo cual prueba que Na,b es el complementario de un conjunto abierto, y por tanto es cerrado. Hasta ahora, los números primos todavía no han entrado en escena -- pero ya llegan. Puesto que cualquier número n distinto de 1 y -1 tiene un divisor primo p, y por lo tanto está contenido en No,p, concluimos que

.z \ {1, -1}

=

U No,p' pElP'

Ahora, si lP' fuera finito, entonces UpElP' No,p sería unión finita de cerrados (por (B)), y por lo tanto, cerrado. En consecuencia, {1, -1} debería ser un conjunto abierto, lo que contradice (A). O • Sexta demostración. Nuestra última demostración va considerablemente más allá de la existencia de infinitos números primos, ya que además demuestra que la serie ¿PElP' diverge. La primera demostración de este importante resultado fue dada por Euler (y es interesante en sí misma), pero la que presentamos aquí, elaborada por Erd6s, tiene un atractivo especial.

i

"Hacer la rana, hasta el infinito"

El postulado de Bertrand

8 A continuación probamos que

n

p

:::;

4x~1

para todo x 2: 2 real,

(1)

donde nuestra notación - aquí y en lo que sigue - quiere decir que el producto se toma sobre todos los primos p ~ x. Demostraremos este hecho por inducción sobre el número de estos primos. No está tomada del trabajo original de Erd6s, pero también se debe a él (véanse sus apuntes en el margen), y es realmente una demostración tomada de El Libro. En primer lugar, nótese que si q es el mayor número primo con q :::; x, entonces p = p<:;x

4q -

Y

p

1

:::;

4x -

1

.

p<:;q

Por tanto, es suficiente comprobar (1) para el caso en el que x = q es primo. Para q = 2 obtenemos "2 :::; 4," de modo que procedemos a considerar primos impares q = 2m+ 1. (Aquí podemos suponer, por inducción, que (1) es válido para todos los enteros x en el conjunto {2, 3, ... , 2m}.) Para q = 2m + 1 desarrollamos el producto y calculamos p p<2m+l

=

p::;m+l

:::; 4m

P

p'

Cmm+1) : :; 4

m

2 2m

=

4 2m.

m+l
Es fácil verificar paso a paso esa cadena de desigualdades. De hecho,

se verifica por inducción. La inecuación

rr

P

<

m+l
Teorema El número n! contiene el factor primo p exactamente

es cierta porque (2~+1) = ~~0~t:{;! es un entero, en el cual los primos que estamos considerando son todos factores del numerador (2m + 1)!, pero no del denominador m!(m + 1)! . Finalmente, se verifica

Cmm+ 1) : :; 2

2m

ya que

Cmm+ 1)

yademás

C::11)

veces.

son dos sumandos (iguales) que aparecen en

Demostración. Exactamente de los factores de p n! 1 . 2 . 3 ..... n son divisibles entre p, de dond.e se obtienen l ~ J p-factores. Además l ;Z J de los factores de n! son incluso divisibles entre p2, lo que aumenta nuestro contador en [.I!:.-J _p2 factores primos p de ni, etc. O

(3) Del teorema de Legendre (véase el margen) obtenemos que contiene el factor primo p exactamente

(2:)

=

~~i

El postulado de Bertrand

9

cada sumando es a lo sumo 1, ya que satisface

veces.

< 2n _ pk

2(~ - 1) . pk

=

2,

y es un entero. Aún más, los sumandos se anulan siempre que pk > 2n. De contiene p exactamente

e:)

veces. Por tanto, la mayor potencia de p que divide a (2:) no es mayor que 2n. En particular, los primos p > V2ií aparecen en a lo sumo una vez. Más aún, - y esto, según Erd6s, es la clave de la demostración - ¡los primos p que satisfacen ~n < p :::; n no dividen a (2:)! De hecho, 3p > 2n implica (para n ~ 3, Y por tanto p ~ 3) que p y 2p son los únicos múltiplos de p que aparecen como factores en el numerador de ~~i, mientras que en el denominador hay exactamente dos factores p.

e:)

e:).

Ahora ya podemos estimar Para n ~ 3, utilizando una estimación de la página 12 para la cota inferior, obtenemos n

-42n -< (2n) < n -

2n

p

p

p-:;.ffn

y por tanto, como no hay más de V2ií primos p :::; p

rr

V2ií, p

para

n

~

3.

(2)

n
(5) Asumimos ahora que no hay ningún primo p con n < p :::; 2n, de modo que el segundo producto en (2) es 1. Substituyendo (1) en (2) obtenemos 4 n < (2n)Hffn 4~n o (3)

una desigualdad que no es cierta para n suficientemente grande. De hecho, es tan falsa que (para n ~ 4000) lo podemos ver sin siquiera utilizar una calculadora: Utilizando a + 1 < 2a (lo cual se verifica por inducción para todo a ~ 2), obtenemos

y de aquí, para n ~ 50 (y por tanto 18 <

2V2ií) obtenemos de (3) y (4) que

Esto implica (2n)1/3 < 20, Y por tanto n < 4000.

o

Ejemplos tales como G~) = 23 . 52 . 7 . 17 . 19 . 23

G:) = 23 . 33 . 52 . 17 . 19 . 23 (~~)

24 . 3 2 . 5 . 17· 19 . 23 . 29 ilustran que primos "muy pequeños" p < ffn pueden aparecer elevados a las potencias más grandes en (2:), que factores primos "pequeños" que verifican ffn < p ::; ~n aparecen a lo sumo una vez, mientras que factores en el hueco ~n < p ::; n no aparecen.

=

El postulado de Bertrand

10

Es posible sacar más de este de estimaciones: a obtenerse con los mismos métodos que 1

P 2': 23ü n

para

de (2)

n 2': 4000,

y por tanto existen al menos 1 n 30 10g2 n

+1

primos entre n y 2n. Esta estimación no es excesivamente mala: el "verdadero" número de primos en ese rango es aproximadamente del orden de ni log n. Esto se sigue del "teorema! de los números primos," que dice que el límite

#{p ~ n : p es primo} . l1m ni log n

n--+oo

existe, y es igual a 1. Este famoso resultado fue demostrado por primera vez por Hadamard y de la Vallée-Poussin en 1896; Selberg y Erd6s dieron una demostración elemental (sin utilizar herramientas de análisis complejo, aunque larga y complicada) en 1948. En lo que se refiere al teorema de los números primos parece que aún no se ha dicho la última palabra: por ejemplo, una demostración de la hipótesis de Riemann (véase la página 41), uno de los problemas no resueltos más importante en matemáticas, nos proporcionaría una mejora importante para el teorema de los números primos. Pero también para el postulado de Bertrand podrían esperarse mejoras sustanciales. De hecho, el siguiente problema, de Opperman (1882), está aún sin resolver:

¿Existe siempre algún número primo entre n 2 y (n

+ 1)2?

Pata más información, véase [3, p. 19] Y [4, pp. 248, 257].

Estimación mediante integrales Existe un método muy sencillo pero efectivo para estimar sumas utilizando integrales (tal y como ya se vio en la página 4). Para estimar los números armónicos n 1

Hn

=

I:: k k=l

dibujamos la figura del margen, y deducimos de ella que logn,

n

El postulado de Bertrand

1

t

comparando el área bajo la gráfica de f(t) = (1 ::; t ::; n) con el área de los rectángulos sombreados en oscuro. Además obtenemos que .

n-l 1 1 = ~ - > n ~ k

H - n

in

k=l

1

1

-- dt t

=

log.n

'

esta vez con el área de los rectángulos grandes (incluyendo las partes más claras). En conjunto, esto conduce a que 1

logn+ - < Hn < logn + l. n En particular lim· Hn

---+ 00,

n---+oo

lim JHn = n-+oo ogn

l. Pero se conocen estimaciones mucho mejores, tales como

Hn donde ry

~

y el orden de crecimiento de Hn viene dado por

1 1 1 (1) log n + ry + 2n - 12n2 + 120n4 + O n 6

=

Aquí O (~6) denota una función f (n) tal que f (n) ::; e ~6 se verifica para alguna constante c.

'

0.5772 es la "constante de Euler" (véase [2]).

Estimación factorial - la fórmula de Stirling El mismo método aplicado a n

log(n!)

=

log2+log3+ ... +logn

2:log k k=2

proporciona log((n - 1)!) <

¡n

logtdt < log(n!),

donde la integral puede calcularse fácilmente:

¡n

logtdt = [tlogt _ t[ = nlogn - n + l.

. Así que obtenemos una cota inferior para n! de n! >

enJogn-n+l

y al mismo tiempo una cota superior n! = n (n -1)! <

nenJogn-n+l =

en(~) n.

En este punto se necesita una análisis más cuidadoso para describir el comportamiento asintótico de ni, tal y como viene dado en lafórmula de Stirling n!

rv

v27Tn

(~r

Aquí f(n)

y de nuevo existen versiones aún más precisas, tales como

(12)n (1 + _1 + _1_ _ 12n 288n e 2

g(n) signifca que

lim f(n) = 1. g(n)

n-Hexo

n! = v27Tn

rv

139 + O 5140n 3

(~)) 4 n

.

Estimación mediante coeficientes binomiales A partir de la definición del coeficiente binomial G) como el número de subconjuntos de cardinal k de un conjunto de tamaño n, sabemos que la sucesión (Z), G), ... , (~) de coeficientes binomiales

El postulado de Bertrand

12 n

1

1

1

1

1 6

7

1

1 4

1

3

2 6

1

3

1 4

1

1

5 10 10 5 1 15 20 15 6 1 21 35 35 21 7 1

iD

tiene como suma

:s (~) = k=O

@

. ,. es slmetnca:

=

(n) k

2n

(n) n-k .

De la ecuación funcional (~) = n-~+l C;,::l) se deduce fácilmente que, para todo n, los coeficientes binomiales (~) forman una sucesión que es simétrica y unimodal: se incrementa hasta la mitad, de manera que los coeficientes binomiales centrales son los más grandes de la sucesión:

Triángulo de Pascal

Aquí, Lx J y IX l denotan, respectivamente, el número x redondeado inferior y superiormente al entero más cercano. A partir de las fórmulas asintóticas para los factoriales que se mencionaron antes, pueden obtenerse fácilmente estimaciones muy precisas para el tamaño de los coeficientes binomiales. Sin embargo, en este libro necesitaremos únicamente ~otas muy débiles, como la siguiente: 2n para todo k, mientras que para n 2:: 2 tenemos

G) :::

(Ln~2J) dándose la igualdad sólo para n

=

2::

2~)

2. En particular, para n 2:: 1, n

2n) 2:: 4 . ( n 2n Esto se verifica porque (L n

/2 J)' un coeficiente binomial central, es el mayor

en la sucesión G) + (~) (~) G) ... )(n::l)' cuya suma es 2n, y cuya media es por tanto Por otra parte, la siguiente cota superior para los coeficientes binomiales es razonablemente buena para coeficientes "pequeños" en la cola de la sucesión, cuando n es grande en comparación con k.

2: .

n(n-1) ... (n-k+1) k!

nk

nk

< k! < 2k -

1'

[1] P. ERD6s: Beweis eines Satzes von Tschebyschef, Acta Sci. Math. (Szeged) 5 (1930-32), 194-198.

[2] R. L. GRAHAM, D. E. KNUTH & O. PATASHNIK: Concrete Mathematics. A Foundationfor Computer Science, Addison-Wesley, Reading MA 1989. [3] G. H. HARDY & E. M. WRIGHT: An lntroduction to the Theory ofNumbers, fifth edition, Oxford University Press 1979. [4] P. RIBENBOIM: The New Book of Prime Number Records, Springer-Verlag, New

York 1989.

Existe un epílogo del postulado de Bertrand que conduce a un bonito resultado sobre coeficientes binomiales. En 1892 Sylvester reforzó el postulado de Bertrand de la siguiente manera: Si n 2' 2k, entonces al menos uno de los números n, n - 1, ... , n-k + 1 tiene un divisor primo p mayor que k. Nótese que para n = 2k obtenemos precisamente el postulado de Bertrand. En 1934, Erd6s dio una breve y elemental demostración del resultado de Sylvester digna de estar en El Libro, análoga a su demostración del postulado de Bertrand. Hay una manera equivalente de formular el teorema de Sylvester: El coeficiente binomial

n) (k

=

n(n-1) .. ·(n-k+1)

k!

(n 2' 2k)

tiene siempre un factor primo p > k.

Sin perder de vista esta observación, volvamos a otra de las joyas de Erd6s: ¿cuando es (~) igual a una potencia mJl.? Es fácil ver que existen infinitas soluciones para k = R = 2, es decir, para la ecuación (~) = m 2 . De hecho, si G) es un cuadrado, entonces también lo es ((2n;1)2). Para ver esto, sea n(n 1) =2m2. Se sigue que .

(2n - 1)2((2n - 1)2 - 1) = (2n - 1?4n(n - 1) = 2(2m(2n - 1))2, y de aquí

C ~ 1)2) 2n

=

(2m(2n _ 1))2.

Así pues, comenzando con (;) = 62 obtenemos infinitas soluciones - el siguiente es (2~9) = 2042. Sin embargo, este procedimiento no proporciona todas las soluciones. Por ejemplo, (52°) = 35 2 y 6282 ) = 11892 son el comienzo de series diferentes. Para k = 3 se sabe que (~ ) = m 2 tiene la solución única n = 50, m = 140, pero ahora ya hemos llegado al límite. Para k 2' 4 y cualquier R 2' 2 no existen soluciones, y esto es lo que probó Erdos utilizando un ingenioso argumento.

C

Teorema. La ecuación (~) R2'2 y 4::;k::;n-4.

mE

no tiene soluciones enteras con

(53°) = 1402 es la única solución para k = 3, g = 2

14

Los coeficientes binomiales casi nunca son potencias

Nótese en primer lugar que podemos suponer sin pérdida de generalidad que n 2: 2k, porque = (n~k)' Supongamos que el teorema es falso y que (~) = m C• La demostración, hasta llegar a una contradicción, se desarrolla en cuatro pasos.

G)

(1) Por el teorema de Sylvester, existe un factor primo p de (~) mayor que k, ya que pC divide a n(n-1) ... (n-k+ 1). Claramente, sólo uno de los factores n - i puede ser múltiplo de p (ya que p > k), y concluimos que pC In i, y por lo tanto

(2) Consideremos cualquier factor n - j del numerador y escribámoslo de la forma n-j = ajmj, donde aj no es divisible entre una potencia no trivial de fJ.. Nótese por (1) que aj sólo tiene divisores primos que son menores o iguales que k. Queremos demostrar ahora que ai i- aj para i i- j. Suponemos, por contra, que ai = aj para algún i < j. Entonces mi 2: mj + 1 y k

>

(n -

>

ajfJ.m~-l

>

fJ.(:g:

i)

(n

m]) 2: aj((mj + l)c - mj) 2: fJ.(n - k + 1)1/2

j) = aj(mf -

>

fJ.(ajmj?/2

+ 1)1/2 >

n 1/ 2 ,

lo cual contradice n > k 2 . (3) A continuación probamos que los ai son los enteros 1,2, ... ,k ordenados de alguna manera. (De acuerdo con Erdos, este es el quid de la demostración.) Como ya sabemos que todos los ai son distintos, basta probar que aOa1 ... ak-l

Substituyendo n - j

= ajmj

divide a k!.

en la ecuación (~)

aOa1'" ak-l(mOm1'" mk_d

c

= mC,

=

se obtiene

k! mC.

Simplificando los factores comunes de mo ... mk-l Y m se obtiene aOal ... ak-l u C =

1.

k! v C

1.

con mcd( u, v) = Falta por demostrar que v = Si no es así, entonces v contiene un dividor primo p. Puesto que mcd( u, v) = 1, p ha de ser un divisor primo de aOal ... ak-l Y por tanto es menor o igual que k. Por el teorema de Legendre (ver página 8) sabemos que k! contiene a p elevado a la potencia ¿i>ll 4p J. Ahora estimamos el exponente de p en n( n - 1) ... (n - k + 1). Sea i un entero positivo, y sean b1 < b2 < ... < bs los múltiplos de pi que hay entre los factores n, n - 1, ... , n-k + Entonces bs = b1 + (3 - 1 )pi, Y de aquí

1.

(3 - l)pi

k -1,

lo cual implica

s <

lk;lJ+1

<

l;J+1.

Los coeficientes binomiales casi nunca son potencias

15

Así que para cada i el número de de que entre n, ... , n- k+ 1, Y por tanto entre los aj, está acotado por l-:!r J + l. Esto implica que el exponente de p en aOal ... ak-l es a lo sumo

según el razonamiento que utilizamos para probar el teorema de Legendre en el capítulo 2. la única diferencia es que esta vez la suma se detiene en i = .e-l, ya que los aj no contienen potencias de.e. Considerando ambos cálculos de manera conjunta, obtenemos que el exponente de p en v R es a lo sumo

y ya hemos obtenido la contradicción buscada, ya que v R es una potencia de.e. Esto ya es suficiente para concluir el caso .e = 2. De hecho, ya que k 2: 4, uno de los ai tiene que ser igual a 4, pero los ai no contienen ningún cuadrado. Por tanto, suponemos a partir de ahora que .e 2: 3. (4) Como k 2: 4, debe ser esto es,

ail

= 1,

ai2

= 2,

ai3

= 4 para algunos i 1, i 2 , i3,

Afirmamos que (n-i 2)2 =} (n-i 1 )(n-i 3 ). En caso contrario, sea b = n-i 2 y n - i 1 = b - x, n - i3 = b + y, donde 0< Ixl, Iyl < k. De aquí

b2 =(b-x)(b+y)

ó

(y-x)b=xy,

donde x = y es obviamente imposible. Ahora, según la parte (1), tenemos:

Ixyl

bly -

=

xl

2: b > n-k > (k - 1)2 2:

Ixyl,

lo cual es absurdo. Así, m~ =} mlm3, donde suponemos m~ > mlm3 (el otro caso es análogo), y hemos llegado a nuestra última cadena de desigualdades. Obtenemos

2(k-l)n

> n 2 -(n-k+l)2 > (n-i 2)2_(n-i 1 )(n-i 3 ) 4[m~R - (mlm3)R] > 4[(mlm3 + l)R - (mlm3)R] > 4.e mI<:-1 m R-l . 3

Como.e 2: 3 y n

> k R 2: k 3 > 6k, tenemos que

2(k - 1)nmlm3

> 4.emim~

=

.e(n - i1)(n - i 3 )

> .e(n-k+l)2 > 3(n-~)2 > 2n2.

Vemos que nuestro análisis hasta este punto concuerda con (53°) = 140 2, ya que 50 = 2.5 2 49 = 1· 72 48=3.4 2 Y 5 . 7 . 4 = 140.

Los coeficientes binomiales casi nunca son potencias

16

Ahora, puesto que mi :S nI/e :S n I / 3 obtenemos finalmente

Ó k3

> n. Con esta contradicción se completa la demostración.

D

[1] P. ERD6s: A theorem of Sylvester and Schur; J. London Math. Soco 9 (1934), 282-288. [2] P. ERDÓS: On a diophantine equation, J. London Math. Soco 26 (1951), 176-178. [3] J. J. SYLVESTER: On arithmetical series, Messenger of Math. 21 (1892), 1-19, 87-120; Collected Mathematical Papers Vol. 4,1912,687-731.

¿ Qué enteros se

escribir como suma de dos cuadrados?

Esta pregunta es tan antigua como la teoría de números, y su solución es un clásico del área. La parte "difícil" de la respuesta es comprobar que todo número primo de la forma 4m + 1 es suma de dos cuadrados. G. H. Hardy escribió que este teorema de los dos cuadrados de Fermat "es considerado, con toda justicia, como uno de los más bellos de la aritmética." Sin embargo, una de nuestras demostraciones de El Libro es bastante reciente. Comencemos con algunos preliminares. En primer lugar, hemos de distinguir el primo P = 2 de los primos de la forma P = 4m + 1 Y de los primos de la forma P = 4m + 3. Todo número primo es de uno de estos tres tipos. En este punto, se puede observar (siguiendo la idea de Euclides) que hay infinitos primos de la forma 4m + 3. En efecto, si hubiera sólo un número finito, podríamos tomar el mayor de ellos y llamarlo Pk. Haciendo

Nk

:=

22 . 3 . 5· .. Pk

-

1 2 3 4 5 6 7 8 9 10 11

1 +0 2 2 1 +1 ?? 2 2 2 +0 2 2 2 +1 ?? 2

2

1

(donde PI = 2, P2 = 3, P3 = 5, " . denota la secuencia de todos los primos), observamos que N k es congruente con 3 (mod4) y, por tanto, debe tener un factor primo de la forma 4m + 3. Como dicho factor primo es mayor que Pb hemos obtenido una contradicción. Al final de este capítulo demostraremos, que también hay infinitos primos de la forma P = 4m + 1. Nuestro primer lema es un caso particular de la famosa "ley de reciprocidad": caracteriza los primos para los cuales -1 es un cuadrado en el cuerpo Zp (del que se presenta un resumen en el recuadro de la página siguiente). Lema 1. La ecuación 8 2 == -1 (mod p) tiel!e exactamente dos soluciones 8 E {1, 2, ... , p-1 } para los números primos P = 4m + 1, una solución para P = 2 Y ninguna solución para los primos de la forma P = 4m + 3. • Demostración. Para P = 2 tomamos 8 = 1. Si P es impar, consideramos el conjunto {1, 2, ... ,p -1} Y construimos la relación de equivalencia generada al identificar cada elemento con sus inversos aditivo y multiplicativo en Zp. Por tanto, la clase de equivalencia "genérica" tiene cuatro elementos

{x, -x, x, -x}, ya que este conjunto contiene los inversos de todos sus elementos. No obstante, hay clases de equivalencia con menos elementos si algunos de los miembros son iguales:

Pierre de Fermat

Representación de enteros como suma de dos cuadrados

18

• x == -x es imposible si pes

• x == x es equivalente a X2 == 1. Esta ecuación tiene dos soluciones, x = 1 Y x = P - 1, lo que da lugar a la clase de equivalencia {1, p - 1}, con dos elementos. 11

Para p = 11 las clases de equivalencia son {1, lO}, {2, 9, 6, 5}, {3, 8, 4, 7}; para p = 13 son {1,12},{2,11,7,6},{3,10,9,4}, {5, 8}: el par {5, 8} proporciona las dos soluciones de 3 2 == -1 mod 13.

x == -x es equivalente a x2 == -1. Esta ecuación puede no tener solución o tener dos soluciones distintas, xo, p - xo. En este último caso, la clase de equivalencia es {xo,p - xo}.

El conjunto {1, 2, ... ,p - 1} tiene p - 1 elementos y lo hemos dividido en 4-uplas (las clases de equivalencia de cardinal 4), más uno o dos pares (las clases de cardinal 2). Para p - 1 = 4m + 2 existe sólo el par {1, p - 1} Y el resto son 4-uplas y, por tanto, 8 2 == -1 (mod p) no tiene solución. Para p - 1 = 4m debe haber un segundo par que contiene las dos soluciones de la ecuación 8 2 == -1 que estamos buscando. .O

Si p es primo, el conjunto Zp = {O, 1, ... ,p 1} con la suma y multiplicación definidas "módulo p" es un cuerpo finito. Necesitaremos las siguientes propiedades:

+ O 1 2 3 4

O O 1 2 3 4

O 1 2 3 4

O O O O O O

1 1 2 3 4 O 1 O 1 2 3 4

2 2 3 4 O 1 2 O 2 4 1 3

3 3 4 O 1 2 3 O 3 1 4 2

4 4 O 1 2 3 4 O 4 3 2 1

Suma y multiplicación en :3 5

• Para x E Zp, x =1- 0, el inverso aditivo (que denotaremos -x) es p - x E {1, 2, ... ,p 1}. Sip > 2, entonces x y -x son elementos distintos de Zp. <11

<11

Cada x E Zp \ {O} tiene un único inverso multiplicativo x E Zp \ {O} . tal que xx == 1 (modp). De la definición de número primo se deduce que la aplicación Zp ---* Zp, Z f--+ xz es inyectiva si x =1- O. Por tanto, en el conjunto finito Zp \ {O} debe ser también sobreyectiva, y para cada x debe existir un único x =1- Otal que xx == 1 (modp). Los cuadrados 02 ,1 2 ,2 2 , ... ,h2 son elementos de distintos para h = l~J. Esto es así porque x2 == y2 (o (x + y) (x - y) == O) implica que x == y o que x -y. Los 1 + l~J elementos 02 ,1 2 , ... , h 2 se denominan los cuadrados de Zp.

Mencionemos aquí que para todos los números primos existen soluciones de X2 + y2 == -1 (modp). De hecho, hay l~J + 1 cuadrados distintos X2 en Zp, en tanto que hay l~J + 1 elementos distintos de la forma -(1 + y2). Como Zp tiene p elementos, estos dos conjuntos son demasiado grandes para ser disjuntos, y deben existir x e y tales que x2 == -(1 + y2) (modp).

Lema 2. Ningún número n

=

4m + 3 es suma de dos cuadrados.

111 Demostración. El cuadrado de un número par es (2k)2 = 4k 2 == O (mod 4) y el de un número impar (2k + 1)2 = 4(k 2 + k) + 1 == 1 (mod4). Por tanto, O la suma de dos cuadrados es congruente con O, 1 ó 2 (mod4).

Representación de enteros como suma de dos cuadrados

19

Ahora que sabemos que los de la fonna p = 4m -1- 3 son " nos ocuparemos de las "buenas" propiedades de los primos de la fonna p = 4m -1- 1. Presentamos el resultado clave previo al teorema principal. Proposición. Todo número primo de la forma p = 4m -1- 1 es suma de dos cuadrados, es decir, se puede escribir como p = x2 -1- y2 para ciertos números naturales x, y E N. Presentaremos dos demostraciones de este resultado, ambas elegantes y sorprendentes. En la primera se combinan hábilmente el "principio del palomar" (que ya hemos empleado "de pasada" antes del Lema 2; en el capítulo 22 se pueden encontrar más ejemplos), y los argumentos "modulo p". La idea se debe al matemático noruego, especialista en teoría de números, Axel Thue . • Demostración. Consideremos los pares (x', y') de enteros que verifica que O :::;; x', y' :::;; yIP, es decir, x', y' E {O, 1, ... , l ylPJ}. El número total de pares de este tipo es (l ylPJ -1- 1)2. Utilizando la estimación lx J -1- 1 > x para x = yIP, vemos que hay más de p tales pares. Por tanto, para cualquier s E Z, es imposible que todos los valores x' - sy' generados por los pares (x', y') sean distintos módulo p, de donde se deduce que para cualquier s hay dos pares distintos

(X',y'), (X",y")

E

{O,1, ... ,lJPj}2

Para p = 13, lv'PJ = 3 consideramos x', y' E {O, 1, 2, 3}. Para s = 5, la suma x' - sy' (mod 13) toma los siguientes valores: y' 2 3 O 1

x'

O

tales que

x' - sy' =:: x" - sy" (modp). Restando se tiene que x' - x" =:: S(y' - y") (modp). Si definimos

Ix' - x"I,

y:=

(x,y) E {O,1,· .. ,lJPj}2

con

x :=

Iy' - y"l,

se deduce que

x=::±sy(modp).

También sabemos que x e y no pueden ser ambos cero, ya que los pares (x', y') Y (x", y") son distintos. Sea s una solución de S2 =:: -1 (mod p), cuya existencia está asegurada por el Lema 1. Como x2 =:: s2y2 =:: _y2 (mod p) hemos construido

(x,y)EZ 2

talque

O<x 2 -1- y2<2p

y

x 2 -1-y2=::O(modp).

Como p es el único número entre Oy 2p que es divisible por p, se deduce que O x2 -1- y2 = p, y hemos tenninado. La segunda demostración de la proposición - también una demostración de El Libro - fue encontrada por Roger Heath-Brown en 1971 y publicada tan solo en 1984. (Don Zagier dio una versión "resumida en una frase".) Es tan elemental que no necesitaremos utilizar el Lema 1. El argumento de Heath-Brown utiliza tres involuciones lineales: una que es bastante obvia, otra oculta y una última, trivial, que pone la guinda al pastel. La segunda involución, sorprendente, corresponde a una estructura oculta en el conjunto de soluciones enteras de la ecuación 4xy -1- Z2 = p.

1 2 3

2

8 9 10

3

11

O 1

3

4 5 6

11 12 O 1

20

Representación de enteros como suma de dos cuadrados

• Demostración. Estudiaremos el conjunto

S

:=

{(X,y,Z) E Z3: 4xY+Z2 =p,

x> O,

y> O}.

Este conjunto es finito. De hecho, como x ~ 1 e y ~ 1 se deduce que y ~ ~ y x ~ ~. Por tanto, hay un número finito de posibles valores de x e y y, para cada uno de ellos, hay como mucho dos valores de z.

1. La primera involución lineal viene dada por

f :S

----+

S,

(x, y, z)

1--+

(y, x, -z),

es decir, "se permutan x e y, y se cambia el signo a z." Es evidente que esta transformación envía S sobre sí mismo y que es una involución: aplicada dos veces, resulta la identidad. Obsérvese que f no tiene puntos fijos, ya que z = O implicaría que p = 4xy. Además, f envía los puntos de

T:= {(x,y,z)ES:Z>O} a los puntos de S\T, que satisfacen z x - y y de z, manda los puntos de

T

f

U

:=

<

O. Como

f

cambia los signos de

{(X,y,Z)ES:(X-y)+z>O}

a los puntos de S\U. Obsérvese que no pueden existir puntos de S tales que (x-y)+z = Oyaque,enesecaso,setendríap = 4xY+Z2 = 4xy+(x-y)2 =

u

(x

+ y)2.

¿Qué se obtiene del estudio de f? La principal observación es que, como f envía los conjuntos T y U a sus complementarios, también intercambia los puntos de T\U con los de U\T. Por tanto, hay el mismo número de puntos en U que no están en T que puntos en T que no están en U - por tanto, T y U tienen el mismo cardinal. 2. La segunda transformación que estudiamos es una involución en U:

g: U

~.

----+

U,

(x, y, z)

1--+

(x - Y + z, y, 2y - z).

Veamos, en primer lugar, que 9 está bien definida: si (x, y, z) E U, entonces x - y + z > O, y> O y 4(x - y + z)y + (2y - z)2 = 4xy + i 2, por lo que g(x, y, z) E S. Como (x - y + z) - y + (2y - z) = x > O se deduce que g(x, y, z) E U. Además, 9 es una involución: 9 (x, y, z) = (x - y + z, y, 2y - z) se transforma en ((x - y + z) - y + (2y - z), y, 2y - (2y - z)) = (x, y, z). Finalmente, 9 tiene exactamente un punto fijo:

(x,y,z) =

g(x,y,z) =

(x-y+z,y,2y-z)

se verifica si y sólo si y = z y, en tal caso, p = 4xy + y2 = (4x + y)y, cuya única solución es y = 1 = z Y x = p~l . Pero si 9 es una involución en U que tiene exactamente un punto fijo, entonces el cardinal de U es impar.

Representación de enteros como suma de dos cuadrados

21

3~

La tercera involución que estudiamos es trivial y consiste en intercambiar x ey:

h: T

----t

T,

(x, y, z)

1----+

(y, x, z).

Es evidente que esta aplicación está bien definida y que es una involución. Ahora combinamos los hechos deducidos de las otras dos involuciones: el cardinal de T es igual al cardinal de U, que es impar. Pero si h es una involución en un conjunto finito de cardinal impar, entonces tiene algún punto fijo: existe un punto (x, y, z) E T tal que x = y, es decir, una solución de

o Obsérvese que esta demostración dice más - el número de representaciones de p de la formap = X2 + (2y)2 es impar para todos los números primos de la forma p = 4m + 1. (De hecho, la representación es única, véase [3].) Obsérvese también que ninguna de las demostraciones es constructiva: ¡intente encontrar x e y para un número primo de diez dígitos! En [1] y [7] se estudian formas eficientes de encontrar tales representaciones como suma de dos cuadrados. El siguiente teorema responde de forma definitiva a la pregunta con la que comenzó este capítulo. Teorema. Un número natural n se puede representar como suma de dos cuadrados si y sólo si todos los factores primos de la forma p = 4m + 3 aparecen con exponente par en la factorización de n . • Demostración. Diremos que un número n es representable si es la suma de dos cuadrados, es decir, si n = x2 + y2 para ciertos x, y E No. El teorema es una consecuencia de los cinco hechos siguientes. (1) 1

= 12 + 02 Y 2 = 12 + 12 son representables. Todo número primo de la

forma p = 4m + 1 es representable.

(2) El producto de dos números representables nI = xi + YI y n2 = x~ + y~ es representable: nln2 = (XIX2 + YlY2)2 + (XIY2 - x2Yd 2. (3) Si n es representable, n = x2 +y2, entonces nz 2 también es representable, ya que nz 2 = (XZ)2 + (yz)2. Los hechos (1), (2) Y (3) proporcionan la parte "si" del teorema. (4) Si p = 4m + 3 es un primo divisor de un número representable n = X2 + y2, entonces p es divisor de x y de y, por lo que p2 es divisor de n. De hecho, si x =t O(mod p), existiría x tal que xx == 1 (mod p), y multiplicando la ecuación X2 + y2 == O por x2 obtendríamos la relación 1 + y2J;2 = 1 + (xy)2 == O(modp), lo que es imposible según el Lema 1 ya que p = 4m + 3. (5) Si n es representable y p = 4m + 3 es un divisor de n, entonces p2 es divisor de n y n/p2 es representable. Esto se deduce de (4) y completa la demostración. O

En un conjunto finito de cardinal impar toda involución tiene al menos un punto fijo.

22

Representación de enteros como suma de dos cuadrados

Como

veamos que existen infinitos números de la forma Para ello, supongamos que hay un número finito y denotemos por Pk al mayor de ellos. Consideremos

P = 4m

+ 1.

que es congruente con 1 (mod4). Todos sus factores primos son mayores que Pk y, según el hecho (4) de la demostración precedente, no tiene factores primos de la forma 4m + 3. Por tanto, M k tiene un factor primo de la forma 4m + 1 que es mayor que Pk. Concluimos con dos observaciones: 11'

11'

Si a y b son dos números naturales que son primos entre sí, entonces hay infinitos números primos de la forma am+b Cm E N) - este es un famoso (y difícil) teorema de Dirichlet. De forma más precisa, se puede demostrar que la cantidad de números primos P :S x de la forma P = am + b viene dada de forma muy aproximada si x es grande por la función 'Pea) lo~ x, donde cp(a) denota el número de primos relativos con a que son menores que a. (Esto es una mejora sustancial del teorema de los números primos, que tratamos en la página 10.) Esto quiere decir que los números primos para a fijo y b variable aparecen esencialmente en igual cantidad. Sin embargo, por ejemplo para a = 4, se puede observar una sutil, pero perceptible y persistente tendencia a "más" primos de la forma 4m + 3: si observamos un valor de x grande al azar, es probable que haya más primos P :S x de la forma P = 4m + 3 que de la forma P = 4m + l. Este efecto se conoce como "desviación de Chebyshev"; véase Riesel [4] y Rubinstein y Sarnak [5].

[1] F. W. CLARKE, W. N. EVERITT, L. L. LITTLEJOHN & S. J. R. VORSTER: H. J. S. Smith and the Fennat Two Squares Theorem, Amer. Math. Month1y 106 (1999), 652-665. [2] D. R. HEATH-BROWN: Fermat's two squares theorem, Invariant (1984),2-5. [3] I. NrvEN & H. S. ZUCKERMAN: An Introduction to the Theory ofNumbers, Fifth edition, Wiley, New York 1972. [4] H. RIESEL: Prime Numbers and Computer Methods for Factorization, Second edition, Progress in Mathematics 126, Birkhauser, Boston MA 1994. [5] M. RUBINSTEIN & P. SARNAK: Chebyshev's bias, Experimental Mathematics 3 (1994), 173-197. [6] A. THUE: Et par antydninger til en taltheoretisk metode, Kra, Vidensk. Selsk. Forh. 7 (1902), 57-75. [7] S. WAGON: Editor's comer: The Euclidean algorithm strikes again, Amer. Math. Monthly 97 (1990), 125-129. [8] D. ZAGIER: A one-sentence proofthat every prime p squares, Amer. Math. Monthly 97 (1990), 144.

== 1 (mod4) is a sum oftwo

Los anillos son estructuras importantes en el álgebra moderna. Si un anillo R tiene elemento neutro para la multiplicación y cualquier elemento distinto de cero tiene inverso para la multiplicación, entonces R es un anillo de división. Así pues, todo lo que le falta a R para ser un cuerpo es la conmutatividad de la multiplicacion. El ejemplo mejor conocido de un anillo de división no conmutativo es el de los cuaterniones, descubierto por Hamilton. Pero, tal y como dice el título del capítulo, cualquier anillo de este tipo ha de ser necesariamente infinito. Si R es finito, entonces los axiomas fuerzan a que la multiplicación sea conmutativa. Este resultado, ya un clásico, ha cautivado la imaginación de muchos matemáticos porque, como escribe Herstein, "es una inesperada interrelación entre dos cosas aparentemente no relacionadas como son el número de elementos en un sistema algebraico determinado y la multiplicación en ese sistema."

Teorema. Cualquier anillo de división R es conmutativo. EmstWitt

Este bonito teorema, habitualmente atribuido a MacLagan Wedderburn, ha sido probado de diferentes maneras, utilizando una gran variedad de ideas. El mismo Wedderburn dio tres demostraciones en 1905, y Leonard E. Dickson dio otra en el mismo año. Emil Artin, Hans Zassenhaus, Nicolas Bourbaki, y muchos otros encontraron posteriormente nuevas demostraciones. Una de ellas destaca por su simplicidad y elegancia. Fue hecha pública por Ernst Witt en 1931 y combina dos ideas elementales que conducen a un glorioso final.

• Demostración.. Nuestro primer ingrediente está tomado de una combinación de álgebra lineal y teoría de grupos básica. Para un elemento arbitrario s E R, sea C s el conjunto {x E R : xs = sx} de elementos que conmutan con s; C s se llama el centralizador de s. Claramente, C s contiene al O y all, y es un subanillo de división de R. El centro Z es el conjunto de elementos que conmutan con todos los elementos de R, esto es, Z = nsER Cs. En particular, todos los elementos de Z commutan, O yI están en Z, y por tanto Z es un cuerpo finito. Sea IZI = q. (Se puede demostrar que q debe ser una potencia de un número primo.) Podemos considerar R y C s como espacios vectoriales sobre el cuerpo Z y deducir que IRI = qn, donde n es la dimensión del espacio vectorial R sobre Z, y de manera similar ICsl = qns para enteros apropiados ns :::: 1. Ahora, suponemos que R no es un cuerpo. Esto significa que para algún s E R el centralizador C s no es todo R, o lo que es lo mismo, ns < n.

24

Cualquier anillo de división finito es un cuerpo

En el conjunto R* := R\ {O} consideramos la relación r ' = x- 1rx para algún x E R*.

:~

~

Es fácil comprobar que

es una relación de equivalencia. Sea

la clase de equivalencia que contiene a 8. Nótese que se cumple lAs = 1 precisamente cuando 8 está en el centro Z. Así, por nuestra suposición, existen clases As con 1 2: 2. Consideramos ahora para 8 E R* la aplicación 1 f8 : x f---+ X- 8X de R* en As. Para x, y E R* tenemos 1

X- 18X

=

~

y-1 8y

~

(YX- 1)8 = s(yx- 1) yx- 1 EO; ~ yEO;x,

{zx: Z E O;} tiene cardonde hemos definido O; := Os \{O}, y O;x dinal 10; l. De aquí, cualquier elemento x- 1sx es la imagen de precisamente 10; 1 = qns - 1 elementos en R* bajo la aplicación f8, y deducimos que 1R* 1= 1As 110; l· En particular, nótese que IR*I

10;1

n

1

qns -

1

q

=

lAs

1

es un entero para todo s.

Sabemos que las clases de equivalencia son una partición de R*. Ahora agrupamos los elementos del centro Z* y denotamos por Al, ... , At las clases de equivalencia que contienen más de un elemento. Por nuestra suposición, sabemos que t 2: 1. Como IR* 1= IZ* 1+ ¿;~=1 IAk 1, hemos probado la llamada fórmula de clases

¿ t

n

q -1

=

q-l+

k=l n

n 1 q nk -1' q

(1)

--1 1

E N para todo k. donde tenemos 1 < qªn. k Con (1) hemos dejado el álgebra abstracta y vuelto a los números naturales. Ahora veremos que qn k -1 qn -1 implica que nk n. De hecho, si escribimos n = ank + r con O :s; r < nk, entonces qn k - 11 qank+r - 1implica 1

1

y por tanto qn k - 11 q(a-1)n k +T - 1, ya que qn k y qn k - 1 son primos .entre sí. Continuando de esta manera se tiene qn k - 11 qT - 1con O :s; r < nk, que sólo es posible para r = O, esto es, nk n. En resumen, nótese que 1

nk n 1

para todo k.

(2)

Ahora viene el segundo ingrediente: los números complejos C. Consideramos el polinomio xn - 1. Sus raíces en C son las raíces n-ésimas de la unidad. Como An = 1, todas estas raíces A tienen IAI = 1, Y por lo tanto son puntos de la circunferencia unidad en el plano complejo. De hecho, son precisamente 2 los números Ak = e ';.,"i = cos(2k1r/n) + isen(2k7r/n), O < k < n 1

Cualquier anillo de división finito es un cuerpo

25

el recuadro en esta de las raíces A satisfacen Ad = 1 para d < n; por ejemplo, la raíz A = -1 satisface A2 = 1. Para una raíz A, sea d el exponente positivo más pequeño con Ad = 1, esto es, d es el orden de A en el grupo .de las raíces de la unidad. Entonces d In, por el teorema de Lagrange ("el orden de cualquier elémento de un grupo divide al orden del grupo" - véase el recuadro en el capítulo 1). Existen raíces de orden n, tales como Al = e 2~i .

Cualquier número "nrnr\lp, z = x + iy puede escribirse en forma como z rép = r(cosso + i sen SO),

.J

X2 + y2 es la distancia de z al origen y SO es el donde r = Iz I = ángulo medido en sentido positivo desde el eje de abscisas. Las raíces n-ésimas de la unidad son de la forma

Ak

2

= e k;;i

= cos(2k1f/n)

+ isen(2k1r/n),

o:::;

x

=

reos SO

k:::; n -1,

ya que para todo k

Ah =

e2k'lCi = cos(2k1r)

+ isen(2k1f) =

1.

-1

Obtenemos estas raíces geométricamente al inscribir un n-ágono regular en la circunferencia unidad. Nótese que Ak (k para todo k, donde ( = e 2~i. Por tanto, las raíces n-ésimas de la unidad forman un grupo cíclico {(, (2, ... ,(n-l, (n = 1} de orden n. Raíces de la unidad para n

Ahora agrupamos todas las raíces de orden d y ponemos

TI

(X-A).

A de orden d

Nótese que la definición de ePd (x) es independiente de n. Puesto que cualquier raíz tiene algún orden d, concluimos que (3)

dln Aquí viene la observación crucial: los coeficientes de los polinomios ePn (x) son enteros (esto es, ePn(X) E Z[x] para todo n) y además el término independiente es o bien 1 ó -1. Verifiquemos con cuidado esta afirmación. Para n = 1 tenemos 1 como única raíz, y por tanto ePI (x) = x -1. Ahora procedemos por inducción, suponiendo que ePd(X) E Z[x] para todo d < n, y que el término independiente de ePd(X) es 1 ó -1. Por (3),

(4) e n-e j dondep(x)= ¿PjX , ePn(x) = ¿akxk, conpo=1opo=-1. j=O

k=O

=6

26

Cualquier anillo de división finito es un cuerpo Puesto que -1 = poao, vemos que ao E {1, -1}. Supongamos que ya sabemos que ao, al, ... , ak-1 E Z. Calculando el coeficiente de Xk a ambos lados de (4) obtenemos k

k

2:.Pj a k-j j=o

2:.Pjak-j j=l

+ POak

E Z.

Por hipótesis, todos los ao, ... ,ak-1 (y todos los Pj) están en Z. Por tanto POak es entero, y en consecuencia ak también, ya que Po es 1 ó -l. Ahora ya estamos listos para el golpe de gracia. Sea nk n uno de los números que aparecen en (1). Entonces 1

rr

di n di n, dfnk, d#n Concluimos que en Z tenemos las relaciones de divisibilidad qn -1 cfJn (q) I qnk _ 1 .

y

(5)

Ya que (5) se verifica para todo k, deducimos de la fórmula de clases (1) que

pero esto no puede ser. ¿Por qué? Sabemos que cfJn(x) = IJ(x - A) donde A recorre todas las raíces de xn - 1 que tienen orden3. Sea A = a + ib una de esas raíces. Como n > 1 (ya que R ::J Z) tenemos A ::J 1, lo cual implica que la parte real a es menor que 1. Ahora 1>:1 2 = a 2 + b2 = 1, Y de aquí

Iq - a - ibl 2 q2 _ 2aq

y también implica

(q - a)2

+ a 2 + b2

>

Iq - ¡.ti > Iq - 11

=

=

+ b2

q2 - 2aq

(porque a

+1

< 1)

Iq - >:1 > q - 1 se verifica para todas las raÍCes de orden n. Esto A

lo cual significa que cfJn(q) no puede ser un divisor de q - 1, que es una contradicción y pone fin a la demostración. O

[1] L. E. DrCKSON: Onfinite algebras, Nachrichten der Alead. Wissenschaften Gottingen Math.-Phys. Klasse (1905), 1-36; Collected Mathematica1 Papers Vol. III, Che1sea Publ. Comp, The Bronx, NY 1975, 539-574. [2] J. H. M. WEDDERBURN: A theorem onfinite algebras, Trans. Amer. Math. Soco 6 (1905), 349-352. [3] E. WITT: Über die Kommutativitiit endlicher Schiefkorper, Abh. Math. Sem. Univ. Hamburg 8 (1931), 413.

"Jr

es irracional"

Este resultado se remonta a Aristóteles, quien supuestamente afirmó que el diámetro y la longitud de una circunferencia no son conmensurables. La primera demostración de este hecho fundamental fue dada por Johann Heinrich Lambert en 1766. La demostración de El Libro que presentamos se debe a Ivan Niven y data de 1947: es un argumento muy elegante de una sola página que únicamente hace uso de cálculo elemental. Su idea es potente y puede ser utilizada para obtener más resultados, como muestran los resultados de Iwamoto y Koksma, respectivamente: Jr2 El

es irracional y

eT es irracio.nal si r i=- O es racio.nal.

El método. de Niven tiene alguno.s precedentes: se puede seguir su rastro hasta el artículo. clásico. de Charles Herrnite de 1873, do.nde se demo.stró po.r primera vez que e es trascendente, es decir, que e no. es raíz de ningún po.lino.mio. co.n co.eficientes racio.nales. Antes de estudiar Jr no.s o.cuparemos de e y sus po.tencias, y demo.straremo.s que so.n irracio.nales. Esto. es mucho. más sencillo., y además nos permitirá respetar el orden histórico de o.btención de lo.s resultados. Para co.menzar, es bastante sencillo. ver, al igual que hizo Fo.urier en 1815, que e = "2::\>0 es irracional. De hecho, si se tuviera e = T; para ciertos enteros a y b > 0, ento.nces se o.btendría

tr

n!be = n!a para todo n 2: O. Pero esto. no puede ser cierto, ya que la parte derecha de la igualdad es un entero, en tanto que la parte izquierda, con

se descompo.ne en una parte entera

I(

bn. 1 + I1 1.

+ I2.1 + ... + In.1)

y una segunda parte 1

b ( n+l

+

1

(n+l)(n+2)

1

+ (n+l)(n+2)(n+3) + .,.

)

Charles Hermite

e

.-

1

+ t + ~ + i + :h + ...

2.718281828 ...

Algunos números irracionales

28

que es aproximadamente ~ y, por tanto, para n grande no puede ser entero: es mayor que 1 y menor que ~, según se puede comprobar comparando con la serie geométrica:

n!

Serie gec)m,etrlca Para la serie geométrica infinita

Q=i+

+q\+'"

1

qQ = 1 + y, por tanto, Q

1,92.

1 1 1

- - < --+

con q > 1 se tiene que

i + q\ + ... = 1 + Q

1 q-l

JOURNAL DE MATHÉMATIQUES

SUR L'lRRATIONNALlTÉ DU NOMBRE

n+1

n+1

<

1

(n+1)(n+2) 1

+"(n+1)(n+2)(n+3) + ... 1

1

n+1+(n+1)2+(n+1)3+'"

=;;;,'

En este punto el lector se habrá dado cuenta de que este simple truco de "multiplicar por n!" no es suficiente para demostrar que e 2 es irracional. Este último resultado es más fuerte: V2 es un ejemplo de un número irracional cuyo cuadrado es racional. John Cosgrave observó que con dos bellas observaciones (nosotros las llamaremos "trucos") se puede llegar dos pasos más allá: cada uno de los trucos es suficiente para demostrar que e 2 es irracional, y la combinación de los dos permite demostrar que é también es irracional. El primer truco se puede encontrar en un artículo de una página de J. Liouville de 1840 - Y el segundo en una adenda de dos páginas que Liouville publicó a continuación. ¿Por qué es irracional e 2 ? ¿Qué se puede deducir de e2 = deberíamos escribir esta igualdad como

PAn J. LIOUVILLE.

On prouve dans les éléments que le nombre e J base des logarithmes népériens, n'a pas une valenr rationnelle, Gn de'Tait, ce me semble, ajouter que la melle m~thode pro uve aussi que e ue peut pas etre racine d'une équation du second degré a coefficients rationne1s, en sarte

%? Según Liouville,

be = ae- 1 ,

que l'on ne peutpas avoir ae+ ~ = e, a étantun entier positifetb, e, des entiers positifs

DU

négatifs. En effet, si l'on remplace dans eette

équation e et :; DU e- 1 par le~rs développements deduits de celui dee", puia qu' on multiplie les deux membres par aisément

J.

2..3. , . n,

00

sustituir las series

trouvera

e

"~, (,+"~,+ ... )± ".!-,(' ,-"~, +.)=!" ¡.t étant

un entier. 00 peut toujours faire en 50rte que le facteur

y

+~

-"+1

soit positif¡ i1 suffil'ade supposer npairsi b est 0 ¡ en pl'enant de plus n tres grand) J'équation que nous venoos d'écril'e conduira des lol's a une absurdité; cal' son pl'emier membre étant essentiellement positif et tres petit, sera compris entre o et r, .et ne pourra pas étre égal a un entiel' 0. Done, etc.

Artículo de Liouville

ya continuación multiplicar por ni, para algún número par n suficientemente grande. Entonces se tiene que n!be es casi un entero:

1 1

n!b ( 1 + -

1) + -12 + -61 + ... + -, n.

es un entero, y el resto

n!l

es aproximadamente ~, ya que es mayor que pero menor que ~, como hemos visto anteriormente. Al mismo tiempo, n!ae- 1 es también casi entero: de nuevo, obtenemos una parte entera grande, y un resto

1 1 1 ) (-1 )n+l,n.a ((n+l)!-(n+2)!+(n+3)!:::¡:""

29

Algunos números irracionales (_l)n+l~. De manera más que es par 71 el resto es mayor que - ~, pero menor que

a_ (1-~) 1 _(71+1)3 1 _ ) ___71+1 71

_a(_l_ _ 71+1 (71+1.)2 e

para un número

oo'

< O.

-

Esto es imposible, ya que para un número par 71 suficientemente grande se tendría que n!ae- 1 es un poco menor que un entero, mientras que n!be es un poco mayor que un entero y, en consecuencia, no se puede cumplir que O n!ae- 1 = n!be. Para demostrar que é es irracional, nos armamos de valor para suponer que = ~ es racional, y escribimos esta igualdad así:

é

be 2

=

ae- 2 .

Podríamos intentar multiplicar por n! para algún 71 grande y agrupar los sumandos no enteros, pero esta idea no produce ningún resultado útil: la suma 2n 1 2n 1 de los restantes términos sería b : para el lado izquierdo y (_1)n+la : para el lado derecho, y ambos serían grandes si 71 se hace grande. Por tanto, es preciso estudiar la situación cuidadosamente y realizar dos pequeños retoques en la estrategia: en primer lugar, no tomaremos un 71 grande arbitrario, sino una potencia de dos grande, 71 = 2m ; en segundo lugar, no multiplicaremos por ni, sino por 2:~1' Necesitamos ahora un pequeño lema, un caso especial del teorema de Legendre (véase la página 8): para cualquier entero 71 2: 1, n! contiene el factor primo 2 como mucho 71 - 1 veces - la igualdad se da si (y sólo si) 71 es potencia de dos, 71 = 2m . Este lema no es nada difícil de demostrar: L~ J de los factores de ni son pares, L:¡ J de ellos son divisibles por 4, y así sucesivamente. Por tanto, si 2k es la mayor potencia de dos que satisface 2k :::: 71, entonces n! contiene el factor primo 2 exactamente

l~J+l¡J+ ... +l;J

<

~+¡+ ... +;

=

n(1-21k):::: 71-1

veces, donde las dos desigualdades se convierten en igualdades sólo cuando 71 = 2k . Volvamos a be 2 = ae- 2 . Estamos estudiando

n! 2 b-n- 1e

2

-

n! -2 a--e 2n - 1

y sustituimos las series

2 ... 1+-+-+-+ +,+ r. 248 126

r

y

Para r :::: 71 obtenemos sumandos enteros en ambos lados, a saber

(1)

30

Algunos números irracionales

donde para r > O el denominador r! contiene el factor 2 como mucho r - 1 veces, en tanto que n! lo contiene exactamente n - 1 veces. (Por tanto, para r > Olos sumandos son pares.) Como n es par (hemos tomado n 2 m ), las series que obtenemos para r 2: n + 1 son 2 2b ( n+1

4

+ (n+1)(n+2) +

8 (n+1)(n+2)(n+3)

+ ...

)

y 2 2a ( - n+1

4

+ (n+l)(n+2)

8 ) - (n+1)(n+2)(n+3) ± ....

Si n es grande, estas series suman, aproximadamente, ~ y - ~ , respectivamente, como se puede comprobar comparando con la serie geométrica. Para n = 2m grande, esto quiere decir que el término de la izquierda de (1) es un poco mayor que un entero, en tanto que el término de la derecha es un poco menor - y esta es la contradicción buscada. D Hemos demostrado que é es irracional. Para demostrar que é, é etc. también son irracionales necesitamos herramientas más potentes (en concreto, un poco más de cálculo infinitesimal) y una nueva idea - originalmente debida a Charles Hermite, cuya esencia está contenida en este sencillo lema. Lema. Sea n 2: 1 fijo y consideremos

2n

(i) Lafunción f(x) es un polinomio de laforma f(x) =

donde los coeficientes (ii) Para

Ci

son enteros.

O< x < 1 se tiene que 0< f(x) <

~ :~=>ixi, n ..

2=n

~. n.

(iii) Las derivadas f(k)(O) y f(k)(l) son enteros para todo k 2: O.

• Demostración. Las partes (i) y (ii) son evidentes. Para demostrar (iii), obsérvese que, según (i), la k-ésima derivada f(k) se anula en x = Oexcepto si n ::; k ::; 2n y, para estos valores de k, f(k) (O) = ~Ck es un entero. Def(x) = f(l-x) se deduce que f(k)(x) = (-l)kf(k)(1-x) para todo x y, por tanto, f(k) (1) = (-l)k f(k) (O), que es un entero. D Teorema 1. eT es irracional para todo r E Q\ {O}.

La estimación n! > e ( :;;- ) n nos da, de forma explícita, un n que es "suficientemente grande."

• Demostración. Es suficiente demostrar que eS no puede ser racional para ningún número natural s (si et fuera racional, entonces (et) t = eS también lo sería). Supongamos que eS = %para ciertos enteros a, b > O, Y sea n lo suficientemente grande como para que n! > as 2n +1 . Sea

donde f (x) es la función del lema anterior.

Algunos números irracionales

F(x) se

31

escribir también como una suma infinita

F(x)

s2n f(x) - s2n-l j'(x)

=.

+ s2n-2 f"(x):::¡=

...

,

ya que las derivadas f(k) (x) se anulan para k > 2n. De aquí se deduce que el polinomio F (x) satisface la ecuación

F'(x)

=

-3

F(x)

+ s2n+l f(x).

Utilizando esta igualdad se obtiene que d

- [e SX F(x)] = se sx F(x) dx y por tanto, N

:=

b !al s2n+le sx f(x)dx

=

+ eSx F'(x) b [e SX F(x)]~

=

aF(l) - bF(O).

Esta expresión es un entero, ya que la parte (iii) del lema asegura que F(O) y F(l) son enteros. Sin embargo, la parte (ii) del lema proporciona cotas superiores e inferiores para N, O< N

b

=

1 1

o

1

s2 n+l esx f(x)dx < bs 2n +l e s _

n!

=

as 2n + l

---

n!

< 1,

lo que demuestra que N no puede ser un entero, y he aquí la contradicción. D Como hemos utilizado este truco con éxito, lo ponemos en práctica una vez más. Teorema 2.

7f2

es irracional .

• Demostración. Supongamos que Consideremos el polinomio

F(x) := bn (7f 2n f(x) -

7f2

%para ciertos enteros a, b > O.

=

7f2n-2 f(2)

(x)

+ 7f2n-4 f(4) (x)

:::¡= . " ),

que verifica la ecuación FI! (x) = _7f2 F(x) + bn 7f2n+2 f(x). De la parte (iii) del lema se obtiene que F(O) y F(l) son enteros. Derivando obtenemos que

d dx [F'(x)

sen 7fX -

(FI! (x)

7fF(x) COS7fx]

+ 7f2 F (x) ) sen 7fX

bn7f2n+2 f(x) sen 7fX 7f 2a n f(x) sen 7fX, y, por tanto,

N := 7f !al an f(x)

sen 7fX

dx

[~F'(x) sen7fx F(O)

que es un entero.

F(x)

COS7fx]:

+ F(l),

Además, N es positivo ya que está definido como la

no es racional, pero tiene "buenas aproximaciones" por números racionales - algunas de ellas son conocidas desde la antigüedad: 3.142857142857 .. . ~ 1['

i{~

3.141592920353 .. .

104348 33215

3.141592653921.. .

1['

3.141592653589 ...

32

Algunos números irracionales integral de una función positiva (excepto en los extremos). Sin embargo, si n < 1, de la parte (ii) del escogemos n suficientemente grande para que 7ra n.l lema se deduce que

1 1

o<

N

=

7r

n

a f(x)sen7rxdx

<

<

1,

lo cual es una contradicción.

D

Finalmente presentamos nuestro último resultado sobre números irracionales. Teorema 3. Para todo entero impar n 2: 3, el número

A(n) :=

~ arccos ()n)

es irracional. Necesitaremos este resultado para el tercer problema de Hilbert (véase el capítulo 8) en los casos n = 3 Y n = 9. Para n = 2 Y n = 4 se tiene que A(2) = ~ y A(4) = lo que demuestra que la restricción a valores impares es irrade n es esencial. Es sencillo ver que la afirmación "~ arccos cional" es equivalente, en la figura del margen, a que la poligonal construida y tal que todos sus lados tienen la misma longitud, nunca se a partir de cierra. Proponemos como ejercicio para el lector demostrar que A( n) es racional solamente para n E {1, 2, 4}. Como indicación, distínganse los casos en que n = 2T del resto.

!,

1

(Jn)

Jn

11 Demostración. Utilizamos la identidad trigonométrica cos CIé + cos (3 = 2 cos que, para CIé

a!i3 cos a;i3

= (k + l)ep Y (3 = (k - l)ep, nos proporciona la expresión cos (k

+ l)ep

=

2 cos ep cos kep - cos (k - l)ep.

(Jn),

Para el ángulo epn = arce os definido por cos epn = obtenemos una representación de la forma

Jn y O ::; epn ::;

(2) 7r,

donde Ak es un entero no divisible por n, para todo k 2: O. De hecho, dicha representación para k = 0,1 se tiene con Ao = Al = 1 y, por inducción sobre k y utilizando (2), obtenemos que para k 2: 1

De esta expresión se deduce que A k+1 = 2Ak - nAk-1. Si n 2: 3 es impar y Ak no es divisible por n, entonces Ak+1 tampoco puede ser divisible por n.

33

Algunos números irracionales U¡'_H--'u¡o;aULVC>

ahora que

A(n)

k

=

g

es racional (donde k,.€ > O son enteros). Haciendo .€'Pn

±1

=

cos br

=

br se obtiene que

A

R = --r

,¡n

R

Por tanto,,¡n = ±AR es un entero, con.€ ~ 2, de donde se deduce que n I ,¡nR. Como ,¡nR I A Rse deduce que n es un divisor de A R,Yhemos llegado a una contradicción. O

[1) C. HERMITE: Sur lafonction exponentielle, Comptes rendus de l'Académie des Sciences (Paris) 77 (1873), 18-24; CEuvres de Charles Hermite, Vol. rn, GauthierVillars, Paris 1912, pp. 150-181. [2) Y. IWAMOTO: A proof that -¡¡-2 is irrational, J. Osaka Institute of Science and Technology 1 (1949),147-148. [3) J. F. KOKSMA: On Niven's proof that kunde (2) 23 (1949), 39.

-¡¡-

is irrational, Nieuw Archief voor Wis-

[4) J. LIOUVILLE: Sur l'irrationalité du nombre e = 2,718 ... , Joumal de Mathématiques Pures et Appl. (1) 5 (1840), 192; Addition, 193-194. [5) I. NIVEN: A simple proof that (1947),509.

-¡¡-

is irrational, Bulletin Amer. Math. Soco 53

/

Sabemos que la serie infinita ¿n>l ~ no converge. Es más, en el capítulo 1 hemos visto que incluso la serie I:PElP' ~ diverge. Sin embargo, la suma de los recíprocos de los números cuadrados converge (muy despacio, como veremos) a un valor interesante.

La serie de Euler.

Esto es un resultado clásico, conocido e importante, que demostró Leonhard Euler en 1734. Una de sus interpretaciones clave es que proporciona el primer valor no trivial ((2) de la función zeta de Riemann (ver el apéndice en la página 41). Como vimos en el capítulo 6, este valor es irracional. Este resultado comparte su lugar tan destacado en la historia de la matemáticas con algunas demostraciones muy elegantes que se dieron de él. En algunos casos la alegría del hallazgo fue compartida por muchos matemáticos. Presentaremos a continuación tres de estas demostraciones. • Demostración. La primera demostración aparece como ejercicio en e11ibro de teoría de números de William 1. LeVeque del año 1956. Pero él mismo afirma: "No tengo la menor idea del origen de este problema, pero estoy bastante convencido de que no lo encontré yo." La prueba consiste en evaluar de dos maneras diferentes la integral doble 1

1 :=

1

JJ_1-dXd Y. 1- xy o o

Para la primera, desarrollamos l!XY como serie geométrica, descomponemos los sumandos como productos, e integramos: 1

1

1

1

1

J J2~)xytdXdY = L J J xnyndxdy o o

n~O

n~Oo

o

1.000000 1.250000 1.361111 1.423611 1.463611 1.491388 1.644934.

Tres veces

36

]f2

/6

Esta evaluación también demuestra que esta integral doble (de una función positiva con un polo en x = y = 1) es finita. Asimismo, nótese que el cómputo se puede efectuar al revés, de manera que la evaluación de ((2) lleva a la integral doble J. Le segunda manera de evaluar J parte de un cambio de coordenadas: En las coordenadas nuevas u := yt x y v := y;x el dominio de integración es un cuadrado de arista ~ y2, que se obtiene a partir del dominio antiguo primero rotando 45° y después reduciendo según el factor de escala de y2. Sustituyendo x = u - v e y = u + v nos da 1

1 1- u 2

1- xy x 1

v 1

"2

+ v2 '

Para transformar la integral tenemos que reemplazar dx dy por 2 du dv, para compensar el hecho de que nuestra transformación de coordenadas reduce el área según el factor constante 2 (el jacobiano de la transformación; véase el recuadro en la página siguiente). Tanto el nuevo dominio de integración como la función a integrar son simétricos respecto del eje u, por tanto sólo nos hace falta calcular la integral sobre la mitad superior del nuevo dominio, y tener en cuenta un factor adicional de 2. Descomponemos esta integral en dos partes de manera más natural:

u

dv )d 1- u2 + v2 u.

J

1 Usando

dx 2 2 a +x

J

x a

1

aretan -

= -

a

+ e,

obtenemos

1/2

J

J~

4

1- u 2

o

aretan

(~) du 1- u 2

4J1 ~arctan(~)du. 1- u u

+

2

1-

2

1/2

Podríamos evaluar estas integrales sustituyendo u = sen e y u = cos e, respectivamente. Pero procederemos de manera más directa, usando que la derivada de g(u) := aretan C/1~u2) es g'(u) = v'1~u2' y que la derivada de h( u)

:=

relación

arctan

(v'~-=-:2)

J: f'(x)f(x)dx 4Jor

=

aretan

(Vi+~)

[~f(x)2l~

2

1

J

=

/

g'(u)g(u) du

=

-

~ v'1~u2'

De la

V(b)2 - V(a)2 resulta

+

41,1

-2h'(u)h(u) du

1/2

2[9(u)2]:/2 2g(~)2

=

es h' (u)

4[h(u)2]:/2

_ 2g(0)2 -

4h(1)2

2(~)2_0_0+4(~)2 =

+ 2

7[6



4h(~)2

O

Tres veces 1T 2 /6

37

En esta demostración hemos calculado el valor de la serie de Euler a de una integral, usando un sencillo cambio de coordenadas. Una demostración ingeniosa de este tipo, pero con un cambio de coordenadas decididamente no trivial, fue descubierto más tarde por Beukers, Calabi y Kolk. Su punto de partida es separar la suma ¿n>l en sus términos pares e impares. Los

La Para evaluar una integral doble

;2

l2

términos pares 212 + 12 + +--: .. =¿k2:1 (2k)2 claramente suman ~((2), ' 1 1 1 _"\, 1 . . Y por tanto 1os termmos Impares ]2 + 32 + 52 + ... - L..-,k2:0 (2k+l)2 suman las tres cuartas partes de la suma total ((2). Queda por demostrar pues que

1

=

J

f(x,y)dxdy.

s podemos efectuar una sustitución de variables

x=x(u,v)

1

+ 1)2

(2k

k2:0

si la correspondencia de (u, v) E T a (x, y) E S es biyectiva y derivable con derivada continua. En este caso, 1 es

8

11 Demostración. Como antes, podemos expresarlo como una integral doble: 1

=

J

1

JJ

1_

o o

~2y2 dx dy

=

~

L

(2k: 1)2'

donde

=

-xy

sen u cosv

and

--

d(x,y) d(u,v)

d(x, y) d(u, v)

=

(

cos 2

u

es eIJ'acobiano: det (

~~

~;

dx dv dy dv

)

.

2 2'

-xy

Y --

y

1

sen v --- . cosu

S x

:s:

cosu cosv sen u sen v

d(X,y) u, v) du dv,

{§/; 1

Es fácil comprobar que estas fórmulas definen una transformación biyectiva entre el interior del cuadrado unidad S = {(x, y) : O x, y :S 1} Y el interior del tnángulo T = {(u,v) : u,v:::: O, u + v:S: 1T/2}. Ahora tenemos que calcular el jacobiano de esta transformación, y como por arte de magia resulta ser det

I

\de

_Y2

v := arccos

2 2

Para efectar el cálculo, ignoramos la frontera del dominio y consideramos x, y en los intervalos O < x < 1 Y O < Y < 1. Entonces u, v estarán en el triángulo u > O, v > O, u + v < 1T /2. Se puede invertir esta transformación de coordenadas de manera explícita, llegando a la substitución

x

f(x( u, v), y(u, v»

k2:0

-X2

1

J

T

Para calcular esta integral J, Beukers, Calabi y Kolk propusieron pasar a las coordenadas nuevas

u := arccos

y=y(u,v),

1

v 7r

sen u sen v cos 2 V cosv cosu

"2

)

Pero esto significa que la integral que buscamos se transforma en 7r

J que es justo el área ~ (~)2

= ~2

/2 7r /2-u

T

¡ J I dudv, o o del triángulo T.

u 7r

"2

D

Tres veces 1T 2 /6

38

Maravilloso - y más porque el mismo método se extiende al cálculo de (( 2k ) en términos de una integral 2k-dimensional, para todo k > 1. Nos referimos al artículo original de Beuker, Calabi y Kolk [2], y al capítulo 20, donde llegaremos a lo mismo por un camino diferente, usando el truco de Herglotz y la idea original de Euler. Después de ver estas dos demostraciones via transformadas de coordenadas, no podemos resistir la tentación de presentar otra, completamente diferente y elemental, del hecho que Ln>l ';'2 = ~2. Aparece en una secuencia de ejercicios del libro de problemas de los hermanos gemelos Akiva y Isaak Yaglom, cuyo edición original rusa data de 1954. Algunas versiones de la demostración original fueron redescubiertas y presentadas por F. Holme (1970), I. Papadimitriou (1973) y Ransford (1982), quien la atribuyó a 10hn Scholes . • Demostración.. El primer paso consiste en establecer una relación entre valores de la función "cotangente al cuadrado". Para todo m ~ 1, se tiene Para m 2 cot :¡¡: 2

cot ~ cot 2 2':7

= 1,2,3, esto resulta en =i

+ cot

2

+ cot 2

2;

=2

271"

+ cot 2

7

3"

7

=5

(1)

Para establecer este resultado, empezamos con la relación cos nx + i sen nx =

( cos x

+ i sen x) n

y nos fijamos en su parte imaginaria sennx =

(~)senxcosn-lx- (~)sen3xcosn-3x±...

(2)

Ahora ponemos n = 2m + 1, mientras que para x consideramos los m valores diferentes x = 2~~1' para r = 1,2, ... ,m. Para cada uno de estos valores tenemos nx = r1T, y por tanto sen nx = O, mientras que O < x < ~ implica que para sen x tenemos m valores positivos diferentes. En particular, podemos dividir (2) entre sen n x, y obtenemos

esto es,

para cada uno de los m valores distintos de x. Del polinomio de grado m

p(t) conocemos m raíces distintas

ar

2

cot (2~~1)

for

r

Por tanto, el polinomio coincide con

=

1,2, ... , m.

Tres veces

1T

2

/6

39

comp1anmdlo los coeficientes de t rn de los raíces es

1

en p( t) deducimos que la suma Comparación de coeficientes: Si p(t) = c(t - al) ... (t - a m ), entonces el coeficiente de t m - l es

2rn(2rn-1) 6

-c(al

+ ... + a=).

lo cu",l demuestra También necesitamos una segunda identidad del mismo tipo, ese

2 (

1[") 2rn+1

+ ese

2 (

21[" ) 2m+1

+ ... + ese

2 (

rn1[" ) _ 2m+1 -

2m(2m+2) 6 '

(3)

para la función cosecante ese x = se~ x. Pero eos 2 x+sen2x 2 1 2 = = eot x + 1, 2 ese x = - 2 sen x sen x y podemos deducir (3) de (1) sumando m a ambos miembros de la ecuación. Ahora ya tenemos todas las herramientas a mano, y podemos encajar las piezas de la demostración. Usaremos que para O < Y < "i se cumple

O < sen y < y

< tgy,

O
y por tanto

O < eoty < 1.y

< esey,

lo cual implica que eot 2 y

2 < ese y.

1 y2

<

Ahora aplicamos esta desigualdad doble a cada uno de los m distintos valores de x, y sumamos los resultados. Empleando (1) para el término a la izquierda y (3) para el término de la derecha, obtenemos 2m(2m-1) 6

2m(2m+2) 6

esto es, 1["2 2m 2rn-1 62rn+12rn+1

<

1

1

12

+ 22 + ... +

1 m 2

Tanto el término de la derecha como el de la izquierda convergen a m --+ 00: final de la demostración. ¿Cómo de rápido converge ¿ ~2 a hemos de estimar la diferencia rn

6

1

Ln

n=l

2

1T

2

~

2

para O

/6? Para responder a esta pregunta 00

L

n=m+1

1

n 2·

Tres veces

40

Esto resulta muy fácil mediante la técnica de con una ya hemos visto en el apéndice al capítulo 2 (página 10). Nos da

f(t) =

00

:b

"""' ~

n=m+1

1 n2

<

100 -dt 1 m

t2

=

-

71

2

/6

, que

1

m

como cota superior y 1

1 ?dt =

1

00

(m+1)2

rel="nofollow"> t

m+1 t~

1

m+ 1

como cota inferior para los "sumandos restantes" - o incluso

00 ¿

-12 >

n=m+l

n

100

1

1

m+"

-dt t2

1

-m .1

+2

si efectuamos la estimación con algo más de cuidado, utilizando el hecho de es convexa. que la función f (t) = Esto quiere decir que nuestra serie no converge muy rápidamente. Si sumamos los primeros mil sumandos, esperamos un error en el tercer dígito después de la coma, y para la suma del primer millón de sumandos (m = 1000000) un error en el sexto dígito, y efectivamente eso es lo que obtenemos. Pero ahora viene una gran sorpresa: hasta los primeros 45 dígitos,

:b

1.644934066848226436472415166646025189218949901, 1.644933066848726436305748499979391855885616544. Efectivamente, el sexto dígito decimal es falso (es una unidad mayor), pero ¡los seis dígitos siguientes son correctos! Y después hay un dígito equivocado (es cinco unidades más grande), y luego hay cinco correctos. Este descubrimiento sorprendente es bastante reciente: lo hizo Roy D. North de Colorado Springs en 1988. (En 1982, Martin R. Powell, un maestro de Amersham, Bucks (Inglaterra), no llegó a notar todo este efecto por razón de los insuficientes recursos de cálculo que tenía entonces.) Es demasiado extraño para ser una coincidencia. .. Fijémonos en el error de la aproximación: hasta los primeros 45 dígitos es =

0.000000999999500000166666666666633333333333357,

y claramente hay algún patrón. Se puede escribir este número como

+10- 6

-

~1O-12

i lO- 18 - 310 10- 30 + 12 10- 42 + ... ~,i, O, -lo, o, de 1O- 6i son el principio de la

+

1 donde los coeficientes (1, 4 2) sucesión de los números de Bernoulli que volveremos a ver en el capítulo 20. El lector interesado puede consultar el artículo original de Borwein, Borwein y Dilcher [3] para más "coincidencias" extrañas - y para demostraciones.

Tres veces

]f2

/6

41

Lafunción zeta de Riemann (( 8) se define para números reales 8 > 1 mediante

((8)

:=

1

6~-. ns

n2:1

Nuestras estimaciones para Hn (ver página 10) implican que la serie ((1) diverge, pero ((8) sí converge para cualquier número real 8 > 1. La función zeta tiene una continuación canónica al todo el plano complejo (con un polo simple en 8 = 1), que se puede construir mediante expansiones en series de potencias. La función compleja que resulta es de máxima importancia para la teoría de los números primos. Mencionaremos tres conexiones: (1) Euler halló la identidad notable

Codifica el hecho fundamental que cualquier número natural tiene una descomposición única (!) en factores primos; usando este hecho, la identidad de Euler es una consecuencia sencilla de la serie geométrica 1 1- p-s

=

1

1

1

1+-+-+-+", pS P2 s P3 s

(2) La ubicación de los ceros complejos de la función zeta de Riemann es el tema de la "hipótesis de Riemann", una de las conjeturas más famosas e importantes sin resolver de toda la Matemática. Afirma que todos los ceros no triviales 8 E re de la función zeta satisfacen Re( 8) = ~. (La función zeta se anula en todos los enteros negativos, que se llaman los "ceros triviales".) Muy recientemente, Jeff Lagarias demostró que, de manera bastante sorprendente, la hipótesis de Riemann es equivalente al siguiente enunciado elemental: Para todo n 2: 1,

L

d

< Hn + exp(Hn ) 10g(Hn ),

dln

con igualdad sólo para n = 1, donde Hn es como antes el n-ésimo número harmónico. (3) Se sabe desde hace mucho que (( 8) es un múltiplo racional de ]fs, y por tanto irracional, si 8 es un entero par 8 2: 2; ver capítulo 20. En cambio, la irracionalidad de ((3) fue probada por Roger Apéry sólo en 1979. A pesar de notables esfuerzos nuestros conocimientos sobre (( 8) para los demás enteros impares 8 = 2t + 1 2: 5 son bastante incompletos. Muy recientemente, Keith Ball y Tanguy Rivoal demostraron que hay un número infinito de valores irracionales de ((2t+ 1). Es más, aunque no se puede afirmar la irracionalidad de (( 8) para ningún valor impar 8 2: 5 concreto, Wadim Zudilin ha conseguido demostrar que por lo menos uno de los cuatro valores ((5), ((7), ((9) y ((11) es irracional. Referimos el lector al bonito artículo de revisión de Fischler [4].

42

Tres veces 7f2 /6

[1] K. BALL & T. RIVOAL: ¡rrationalité d'une infinité de valeurs de lafonetion zeta aux entiers impairs, Inventiones math. 146 (2001),193-207. [2] F. BEUKERS, J. A. C. KOLK & E. CALABI: Sums ofgeneralized harmonie series and volumes, Nieuw Archief voor Wiskunde (4) 11 (1993), 217-224. [3] J. M. BORWEIN, P. B. BORWEIN & K. DILCHER: Pi, Eulernumbers, andasymptotie expansions, Amer. Math. Month1y 96 (1989),681-687. [4] S. FISCHLER: ¡rrationalité de valeurs de zeta (d'apres Apéry, Rivoal, ... ), Bourbaki Serninar, No. 910, November 2002; to appear in Astérisque; Preprint arXiv: math. NT /0303066, March 2003, 45 pages. [5] J. C. LAGARIAS: An elementary problem equivalent to the Riemann hypothesis, Amer. Math. Monthly 109 (2002), 534-543. [6] W. J. LEVEQUE: Topies in Number Theory, Vol. I, Addison-Wesley, Reading MA 1956. [7] A. M. YAGLOM & l. M. YAGLOM: Challenging mathematieal problems with elementary solutions, Vol. n, Holden-Day, Inc., San Francisco, CA 1967. [8] W. ZUDILIN: Arithmetic of linear forms involving odd zeta values, gust 2001,42 pages; arXi v: math. NT /0206176.

Preprint~

Au-

a El tercer problema de Hilbert: descomposición de poliedros 45

9 Rectas en el plano y descomposición de grafos 53

10 El problema de la pendiente 59 11 Tres aplicaciones de la fórmula de.Euler 65

12 El teorema de rigidez de Cauchy 71

13 Símplices en contacto 75

14 Cualquier conjunto con muchos puntos tiene un ángulo obtuso 79

15 La conjetura de Borsuk 85

"Los sólidos platónicos, ¡un juego de niños!"

En su famosa conferencia en el Congreso Internacional de Matemáticos en París en 1900, David Hilbert propuso, como tercero de sus 23 problemas, encontrar

"dos tetraedros de igual base e igual altura que ser descompuestos en tetraedros congruentes, ni tampoco combinados con otros tetraedros congruentes para formar dos poliedros que a su vez puedan descomponerse en tetraedros congruentes." El origen de este problema se remonta a dos cartas de Carl Friedrich Gauss fechadas en 1844 (publicadas en 1900 en las obras completas de Gauss). Si dos tetraedos del mismo volumen pudieran ser descompuestos en dos piezas congruentes, estaríamos ante una demostración "elemental" del teorema XII 5 de Euclides, que afirma que dos pirámides de igual base e igual altura tienen el mismo volumen. Por lo tanto, proporcionaría una definición elemental del volumen de un poliedro (que no se basaría en el análisis, y por tanto tampoco en argumentos de continuidad). Una afirmación similar es cierta en geometría plana: El teorema de Bolyai-Gerwien [1, Sect 2.7] afirma que dos polígonos planos cualesquiera son a la vez equidescomponibles (pueden ser descompuestos en triángulos congruentes) y equicompletables (pueden convertirse en congruentes añadiéndoles triángulos congruentes) si y sólo si tienen la misma área.

David Hilbert

La cruz es equicompletable con un cuadrado de la misma área.

De hecho, son incluso equidescomponibles.

46

El tercer problema de Hilbert: descomposición de poliedros Como se ver a de su formulación del Hilbert que no se verificase un teorema análogo en dimensión 3, y estaba en lo cierto. El problema fue resuelto por su estudiante Max Dehn en dos trabajos. En el primero, que se publicó en 1902, mostraba tetraedros equidescomponibles de igual base y altura; sin embargo, los trabajos de Dehn no son de fácil comprensión, y es difícil saber si no cayó en la misma trampa que otros: Bricard (¡en 1896t), Meschowski (1960) y probablemente otros propusieron demostraciones muy elegantes, pero desafortunadamente incorrectas. Afortunadamente, la demostración de Dehn fue revisada y elaborada de nuevo, y después del esfuerzo conjunto de V. F. Kagan (1903/1930), Hugo Hadwiger (1949/54) y Vladimir G. Boltianskii, podemos exponer en este capítulo una demostración de El Libro. (El apéndice proporciona algunos conceptos básicos sobre poliedros.) (1) Unas nociones de álgebra lineal Para cualquier conjunto finito de números reales M = {mI, . .. ,mk} <;;; lR, definimos V(M) como el conjunto de todas las combinaciones lineales de números en M con coeficientes racionales, esto es, k

V(M) := {

L qimi : qi E Q} <;;; lR. i=1

La primera observación (trivial, pero importante) es que V(M) es un espacio vectorial finito sobre el cuerpo Q de los números racionales. De hecho, V(M) es cerrado bajo sumas y multiplicaciones por racionales, y los axiomas de cuerpo para lR hacen de V(l\!I) un espacio vectorial. La dimensión de V(M) es el cardinal de cualquier conjunto minimal de generadores. Puesto que por definición M genera a V (M), ha de contener un conjunto minimal de generadores. De aquí, dimQ V(M) ~ k =

IMI.

En adelante, utilizaremos funciones lineales sobre Q j : V(M)

--+

Q,

es decir, aplicaciones lineales entre Q-espacios vectoriales. La propiedad clave es que para cualquier relación de dependencia lineal 2:7=1 qimi = O con qi E Q, se ha de verificar que 2:7=1 qd(mi) = j(O) = O. Este sencillo lema será esencial para la resolución del problema de Hilbert: Lema. Para dos subconjuntos M <;;; M' finitos de lR cualesquiera, el Qespacio vectorial V(M) es un subespacio de V(M'). Por tanto, cualquier función Q-lineal j : V (M) --+ Q puede ser extendida a una función Q-lineal j' : V(M') --+ Q tal que j'(m) = j(m) para todo m E M . • Demostración. Cualquier función Q-lineal V(M) --+ Q queda determinada al fijar las imágenes de una Q-base de V(M). El lema es una consecuencia de que cualquier base de V (M) puede ser extendida a una base de D V(M ' ).

El tercer problema de Hilbert: descomposición de poliedros

Invariantes

Dehn

Para un poliedro tridimensional P, sea M p el conjunto de todos los ángulos entre caras adyacentes (ángulos diedros), junto con el número 1T. Por ejemplo, para un cubo C tenemos Me = {~,1T},mientras que para un prisma ortogonal Q sobre un triángulo equilátero obtenemos M Q = {~, ~, 1T}. Dado cualquier conjunto finito M <;;; IR que contenga a M p , y cualquier función Q-lineal j : V(M) ---+ Q que satisfaga j(1T) = O, definimos el invariante de Dehn de P (con respecto a f) como el número real Df(P) :=

I:: /!(e) . j(a(e)), eEP

donde la suma se extiende sobre todas las aristas e del poliedro, /!( e) es la longitud de e, y a( e) el ángulo diedro entre dos caras incidentes a e. Calcularemos más adelante algunos invariantes de Dehn. Por ahora, fijémonos simplemente en que j (~) = ~ j (1T) = O tiene que verificarse para cualquier función Q-lineal j, y por tanto Df(C)

=

O,

es decir, el invariante de Dehn de un cubo es cero respecto de cualquier j. (3) Teorema de Dehn-Hadwiger Como antes, llamaremos a dos poliedros P, Q equidescomponibles si pueden descomponerse en un conjunto finito de poliedros PI, ... , P n Y Q1, ... , Qn tales que Pi y Qi son congruentes para todo i (1 :S i :S n). Dos poliedros son equicompletables si existen poliedros PI, ... ,Pm Y Q1, ... , Qm tales que los interiores de los Pi son disjuntos dos a dos y disjuntos de P, y de manera similar para los Qi y Q; además, Pi ha de ser congruente con Qi para todo i, y P := PUP1UP2 U . " UPm y Q := QUQ1 UQ2 U '" UQm han de ser equidescomponibles. Un teorema demostrado por Gerling en 1844 implica que no influye si se admiten o no reflexiones a la hora de considerar congruencias. Es claro que poliedros equidescomponibles son equicompletables, pero el recíproco no es evidente. El siguiente teorema de Hadwiger (en la versión de Boltianskii) proporciona una herramienta para encontrar - tal y como propuso Hilbert - tetraedros de igual volumen que no son equicompletables, y por tanto tampoco equidescomponibles. Teorema. Sean P y Q poliedros con ángulos diedros al, ... , a py 131, ... ,Pq respectivamente, y sea M un conjunto finito de los números reales tal que

Si j : V (M) ---+ Q es cualquier función Q-lineal con j (1T) = OY tal que

Df(P)

-¡. Df(Q),

entonces P y Q no son equicompletables.

47

48

El tercer problema de Hilbert: descomposición de poliedros

• Demostración. La demostración tiene dos Si un poliedro P puede descomponerse en un número finito de poliedros PI, . .. ,Pn , Y si todos los ángulos diedros de estos PI, . .. ,Pn están contenidos en el conjunto NI, entonces para cada función CQl-lineal j : V(M) ---+ CQl, los invariantes de Dehn se suman y resulta

f---/-----{/

Para verlo, asociamos a cada parte de cualquier arista de un poliedro una masa: Si el <::.; e es una parte de una arista e de P, entonces su masa es mj(e / ) :=e(e / ) j(a(e / )),

su longitud multiplicada por el valor que toma j en su ángulo diedro. Si P se descompone en PI, ... , Pn, consideraremos todas las aristas de todas las piezas. Comprobamos que la suma de los ángulos diedros de las piezas a lo largo de el es el ángulo diedro de P en el, y por lo tanto lo mismo se cumple para las masas. Para cualquier otra arista el! de algún Pi, contenida en el interior de P o de una de sus caras, la suma de los ángulos diedros es 1f Ó 21f. Así, la suma de los valores de j en todos los ángulos de todas las piezas es o bien j(1f) = O, o bien j(21f) = O. En consecuencia, para la suma de las masas obtenemos el mismo valor que se había asignado a estas aristas en P, es decir, O. (2) Suponiendo que P y Q son equicompletables, podemos extender M a un conjunto mayor MI que también incluya todos los ángulos diedros que aparecen en cualquiera de las piezas involucradas. MI es finito, ya que sólo consideramos descomposiciones finitas. Por lo tanto, el lema que se expuso anteriormente nos permite extender j a l' : V(M I ) ---+ CQl, y de la parte (1) se desprende una ecuación del tipo

donde D J' (Pi) = D J' (Qi) ya que Pi y Qi son congruentes. Concluimos pues O que Dj(P) = Df(Q), lo cual es una contradicción. Ejemplo 1. Para un tetraedro regular T o cuyas aristas miden f unidades de longitud, calculamos el ángulo diedro apoyándonos en el dibujo. El punto medio M de la base del triángulo divide a la altura AE de la base en dos segmentos en razón 1:2. Puesto que IAEI = IDEI, se tiene cos a = y por tanto _ 1 a - arccos 3'

D

!,

e

Haciendo M

:=

{a, 1f} observamos que la razón 1

1

1f

3

- arceosB

es irracional, según el teorema 3 del capítulo 6 (tomando n = 9). Por tanto, el CQl-espaeio vectorial V(M) tiene dimensión 2; una base es M, y existe una función CQl-lineal j : V(M) ---+ CQl tal que

j(a)

:=

1, j(1f)

:=

O.

El tercer problema de Hilbert: descomposición de poliedros

49

Para esta f tenemos

Df(To)

=

61:f(a)

i=

61:

=

O,

y por tanto un tetraedro regular no es ni equidescomponible ni equicompletable con un cubo, ya que el invariante de Dehn de un cubo se anula para cualquier f. ~_.~ ... " •.~

2. Sea TI un tetraedro determinado por tres aristas ortogonales AB, Ae, AD de longitud u. Este tetraedro tiene como ángulos diedros tres ángulos rectos, y otros tres más de igual amplitud tp, que calculamos a partir del dibujo:

~V2u ~\1'3 V2u

IAEI IDEI

cbs tp

D

1

\1'3'

Se sigue que tp= arccos

e

1

\1'3'

Js, 1f}, el CQl-espacio vectorial V (M) tiene dimensión 2: primero, V(M) = V( {arccos Js, 1f}), ya que y i son linealmente dependientes. Además, no hay ninguna relación con coeficientes racionales entre arccos Js y esto es equivalente a que ~ arccos Js es irracional, tal y Para M :=

B

{i, arccos

1f

1f;

como se probó en el capítulo 6 (con n = 3 en el teorema 3). De este modo, podemos construir una aplicación CQl-lineal f haciendo

f(1f) de la cual obtenemos

Df(TI )

=

:=

f (i)

=

f( arccos

O y

Js) := 1,

O, y de aquí que

3uf(i) +3(V2u)f(arccosJs)

=

3V2u i=

O.

D

Esto prueba que TI no es equidescomponible ni equicompletable con un cubo e del mismo volumen, ya que se verifica D f (e) = Opara cualquier f. Ejemplo 3. Finalmente, sea T 2 un tetraedro con tres aristas consecutivas AB,

u

Be y e D que son ortogonales entre sí y de igual longitud u.

i,

~ y :f), sino No calcularemos los ángulos de un tetraedro de este tipo (son que argumentaremos - utilizando los puntos medios de las aristas y caras, y el centro - que un cubo cuya arista tiene longitud u puede ser descompuesto en 6 de estos tetraedros (3 copias congruentes y sus respectivas imágenes especulares) . Todos estos tetraedros tienen el mismo invariante de Dehn, y por lo tanto, para cualquier función f apropiada, obtenemos

D f (T2 )

1

=

6Df(e)

=

O,

i así que todos los invariantes de Dehn se anulan en este tipo de tetraedros! Esto resuelve el tercer problema de Hilbert, ya que hemos construido otro tetraedro TI; ambos tienen bases congruentes e igual altura, y D f (Td i= O. Por el teorema de Dehn-Hadwiger, TI y T 2 no son equidescomponibles, y ni siquiera equicompletables.

e A

El tercer problema de Hilbert: descomposición de poliedros

50

y Un politopo convexo en ]Rd es el cierre convexo de cualquier conjunto finito S = {SI, ... , Sn}, es decir, un conjunto de la forma n

P

=

conv(S)

n

:= {I>'iSi:Ai20, I:Ai=l}. i=1

i=1

Los politopos resultan ser objetos familiares. Ejemplos paradigmáticos son los polígonos convexos (politopos convexos en 2 dimensiones) y los poliedros convexos (politopos convexos en dimensión 3). Hay algunos tipos de poliedros que pueden generalizarse a dimensiones mayores de manera natural. Por ejemplo, si S es un conjunto formado por d + 1 puntos afínmente independientes, entonces conv(S) es un símplice de dimensión d (o d-símplice). Para el caso d = 2 se trata de un triángulo, y para d = 3 obtenemos un tetraedro. De forma similar, los cuadrados y los cubos son casos particulares de los cubos de dimensión d, como también lo es en general el d-cubo unidad C d = [O, l]d ~ ]Rd. Los politopos generales son uniones finitas de politopos convexos. En este libro, los poliedros no convexos aparecerán relacionados con el teorema de rigidez de Cauchy en el capítulo 12, y los polígonos no convexos en relación con la fórmula de Pick, en el capítulo 11, y de nuevo cuando discutamos el teorema de la galería del arte en el capítulo 31. Los poli topos convexos pueden ser definidos, de manera equivalente, como conjuntos acotados de soluciones de un sistema finito de inecuaciones lineales. Por tanto, cada politopo convexo P ~ ]Rd admite una representación de la forma

P

{x E

]Rd :

Ax :s; b}

para alguna matriz A E ]Rmxd y un vector b E ]Rm. En otras palabras, P es el x :s; bi , conjunto de soluciones de un sistema de m inecuaciones lineales donde es la i-ésima fila de A. Recíprocamente, todo conjunto acotado de soluciones de un sistema de este tipo es un politopo convexo y en consecuencia puede ser representado como el cierre convexo de un conjunto finito de puntos. Para polígonos y poliedros utilizamos conceptos familiares como vértices, aristas, y caras de dimensión 2. Podemos definir las caras de un politopo convexo en dimensión mayor de la manera siguiente: Una cara de P es un subconjunto F ~ P de la forma P n {x E ]Rd : a T x = b}, donde a T x :s; b es una desigualdad lineal válida para todos los puntos x E P. Todas las caras de un politopo son, a su vez, politopos. El conjunto V de vértices (cara de dimensión O) de un politopo convexo es también el conjunto más pequeño tal que conv(V) = P. Suponiendo que P ~ ]Rd es un poUtopo convexo de dimensión d, las facetas (caras de dimensión (d-l) determinan un conjunto mínimo de hiperplanos, y por tanto, de semiespacios que contienen a P, y cuya intersección es P. En particular, esto implica algo que necesitaremos más adelante: Sea F una faceta de P; HF el hiperplano que determina, y Hj; Y H;; los dos semiespacios cerrados y acotados por H F . Entonces uno de estos dos semiespacios contiene a P (y el otro no).

af

Algunos politopos comunes: tetraedro, cubo y permutaedro

=

af

El tercer problema de Hilbert: descomposición de poliedros

51

.~---------------------------------------------

V de vértiEl del convexo P viene dado por el ces del politopo y por un conjunto E de aristas, que son las caras de dimensión 1 de P. Si P tiene dimensión 3, este grafo es planar, y se verifica la conocida "fórmula de Euler" (véase el capítulo 1 Dos politopos P, pI c::: lR d son congruentes si existe alguna aplicación afín que conserva las distancias y que transforma P en PI. Tal aplicación puede invertir la orientación del espacio, como hace por ejemplo la reflexión en un hiperplano, que transforma P en su imagen especular. Se dice que los politopos son combinatoriamente equivalentes si existe una biyección de las caras de P en las caras de pI que conserva la dimensión y la relación de inclusión entre las caras. Esta noción de equivalencia es mucho más débil que la de congruencia; por ejemplo, la figura del margen muestra un cubo unidad y otro deformado. Los dos politopos son combinatoriamente equivalentes (por tanto, podríamos llamar "cubo" a cualquiera de ellas), pero evidentemente no son congruentes. Un politopo (o en general un subconjunto cualquiera de lR d ) tiene simetría central si existe algún punto Xo E lR d tal que Xo

En esta situación,

Xo

+x

E

P

~

Xo -

x

E

P.

se llama el centro de P.

[1] V. G. BOLTIANSKII: Hilbert's Third Problem, V. H. Winston & Sons (Halsted Press, John Wiley & Sons), Washington DC 1978. [2] M. DEHN: Ueber raumgleiche Polyeder, Nachrichten von der Konigl. Gesellschaft der Wissenschaften, Mathematisch-physikalische Klasse (1900), 345-354. [3] M. DEHN: 465-478.

Ueber den Rauminhalt, Mathematische Annalen 55 (1902),

[4] C. F. GAUSS: "Congruenz und Symmetrie": Briefwechsel mit Gerling, pp. 240-249 en: Werke, Band VIII, Konigl. Gesellschaft der Wissenschaften zu Gottingen; B. G. Teubner, Leipzig 1900. [5] D. HILBERT: Mathematical Problems, Lecture delivered at the Intemational Congress of Mathematicians at Paris in 1900, Bulletin Amer. Math. Soco 8 (1902), 437-479. [6] G. M. ZIEGLER: Lectures on Polytopes, Graduate Texts in Mathematics 152, Springer-Verlag, New York 1995/1998.

Dos politopos no congruentes, pero combinatoriamente equivalentes

El problema tal vez más conocido sobre configuraciones de rectas fue propor Sylvester en 1893 en una columna sobre matemáticos de la revista Educational Times.

No está claro si el propio Sylvester tenía una demostración - en cualquier caso, la solución que se publicó en la Educational Times no tiene mucho sentido. Unos 40 años más tarde, Tibor Gallai [Grünwald] dio una solución correcta. Por ello se atribuye el siguiente teorema comúnmente a ambos. Después de la demostración de Gallai aparecieron otras, pero la siguiente, de L. M. Kelly, puede considerarse "simplemente la mejor." Teorema 1. En cualquier configuración de n puntos no alineados en el plano, existe una recta que contiene exactamente dos de los puntos. Demostración. Sea P el conjunto de puntos dado y considérese el conjunto L de todas las rectas que pasan por al menos dos puntos de P. Entre todos los pares (P, R) tales que P no está sobre R, elegimos un par (Po, Ro) tal que Po tenga distancia mínima a Ro. Llamaremos Q al punto más cercano a Po sobre la recta Ro (esto es, en la perpendicular a Ro por Po). ¡tr,m{irCl!')n. ¡Esta recta Ro verifica el teorema! De otro modo, Ro contiene al menos tres puntos de p, y por tanto dos de ellos, pongamos P 1 y P2 , están al mismo lado de Q. Suponemos que P 1 está entre Q y P 2 , donde P 1 puede coincidir con Q (véase el margen). Se sigue que la distancia de P 1 a la recta R1 que determinan Po Y P2 es menor que la O distancia de Po a Ro, Y esto contradice nuestra elección de Ro Y Po. En la demostración hemos utilizado axiomas métricos (la distancia más corta) y axiomas de orden (P1 está entre Q y P 2 ) en el plano real. ¿Necesitamos realmente estas propiedades, más allá de los axiomas habituales de incidencia de puntos y rectas? Alguna condición adicional sí hace falta, como demuestra el famoso plano de Fano dibujado en el margen. Aquí P = {l, 2, .. " 7} Y L está formado por las 7 rectas por tres puntos que se indican en la figura, incluyendo la "recta" {4, 5, 6}. Cualesquiera dos puntos determinan una única recta, de modo que se satisfacen los axiomas de incidencia, pero no existe ninguna recta que pase por dos puntos. Por tanto, el teorema de SylvesterGallai muestra que la configuración de Fano no puede ser dibujada en el plano real de manera que los 7 tripletes colineales estén sobre rectas reales: ha de haber siempre una recta "quebrada".

J. J. Sylvester

Po Ro

Q

3

1

6

2

Rectas en el plano y descomposición de grafos

54

Sin Coxeter demostró que los axiomas de orden son suficientes para una demostración del teorema de Sylvester-Gallai. Por tanto, puede darse una demostración que no utilice propiedades métricas - véase también la demostración que darnos en el capítulo 11, utilizando la fórmula de EuJer. El teorema de Sylvester-Gallai implica directamente otro famoso resultado sobre puntos y rectas en el plano, debido a Paul Erdos y Nicolaas G. de Bruijn. Pero este otro resultado se verifica de manera general para configuraciones arbitrarias de puntos y rectas, tal y como observaron Erdos y de Bruijn. En breve veremos este resultado más general.

Teorema 2. Sea P un conjunto de n 2" 3 puntos no alineados en el plano. Entonces el conjunto 1: de rectas que pasan por al menos dos puntos contiene al menos n rectas . • Demostración. Para n = 3 no hay nada que demostrar. Ahora procedemos por inducción sobre n. Sea IPI = n + 1. Por el teorema anterior, existe una recta Ro E 1: que contiene exactamente dos puntos P y Q de P. Consideramos el conjunto P' = P\ {Q} y el conjunto 1:' de rectas determinado por P'. Si los puntos de P' no están alineados, entonces por inducción 11:' 12" n y de aquí que 11:1 2" n + 1, por la recta adicional Ro en 1:. Por otra parte, si los puntos de P' están todos alineados, entonces tenemos el "abanico" de la figura, el cual nos da exactamente n + 1 rectas. D Ahora, como prometimos, probaremos el resultado general, que se puede aplicar a "geometrías de incidencia" mucho más generales.

Teorema 3. Sea X un conjunto de n 2" 3 elementos, y sean Al, ... , Am subconjuntos propios de X, tales que cualquier par de elementos de X está contenido precisamente en uno de los conjuntos Ai. Entonces m 2" n . • Demostración. La siguiente demostración, atribuida tanto a Motzkin como a Conway, es muy corta y verdaderamente digna de mención. Para todo x E X sea 'r x el número de conjuntos Ai que contienen a x. (Nótese que por hipótesis, 2 :S 'rx < m.) Ahora, si x ti:. A i , entonces 'rx 2" IAi 1 porque los IAil conjuntos que contienen a x y a un elemento de Ai han de ser distintos. Supongamos que m < n; 1) > n(m - 'r x ) para x ~ Ai' entonces mlAil < n'rx y por tanto m(n Pero ahora nos encontramos con que

D

lo cual es absurdo.

Hay otra demostración muy breve de este teorema que utiliza álgebra lineal. Sea B la matriz de incidencia de (X; Al,' .. , A m ). Esto quiere decir que etiquetamos las filas en B mediante los elementos de X, y las columnas según Al, ... , Am; además, tenemos que si si

x EA x ti:. A.

Consideramos el producto BB T . Para x el x' tenemos (BBT)xxf = 1, ya que x y x' están contenidos precisamente en un conjunto A i , de modo que

Rectas en el plano y descomposición de grafos

o

55

1 1

o

1

;1

donde T x se define como antes. Como la plimera matliz es definida positiva (tiene únicamente autovalores positivos) y la segunda es semidefinida positiva (tiene como autovalores n y O), deducimos que BBT es definida positiva; en particular, es invertible, y el rango de BB T es n. Se sigue que el rango de la matriz B, de dimensiones (n x m), es al menos n, y concluimos que, de hecho, n :::; m, ya que el rango no puede ser mayor que el número de columnas. Vayamos un poco más allá y volvamos a la teoría de grafos. (Hacemos una revisión de los conceptos básicos de teoría de grafos al final de este capítulo.) Un momento de reflexión basta para comprobar que la siguiente afirmación es en realidad la misma que la que enuncia el teorema 3: Si descomponemos un grafo completo Kn en m subgrafos completos diferentes de Kn. de tal modo que cada arista esté en un único subgrafo completo, entonces m;::: n. De hecho, si hacemos corresponder X con el conjunto de vértices de Kn y los conjuntos Ai con los conjuntos de vértices de los sub grafos completos, entonces las afirmaciones son idénticas. Nuestra próxima tarea es descomponer Kn en grafos completos bipartitos de tal modo que de nuevo cada arista esté exactamente en uno de esos grafos. Para ello, numeramos los vértices {1, 2, ... , n}, y unimos 1 con el resto de los vértices. Así obtenemos el grafo bipartito completo KI,n-1 (una estrella). Luego unimos 2 con 3, ... ,n para obtener una estrella K I ,n-2; al seguir de esta manera, Kn queda descompuesto en una selie de estrellas KI,n-l, K I ,n-2, ... , KI,I, es decir, en n - 1 grafos bipartitos completos. ¿Será posible hacerlo mejor, utilizando menos grafos? El siguiente resultado, de Ron Graham y Henry O. Pollak, asegura que no: Teorema 4. Si se descompone Kn en grafos bipartitos completos H I, ... , H m , entonces m ;::: n - 1. Lo interesante es que, en contraste con el teorema de Erd6s-de Bruijn, nadie ha sabido dar una demostración combinatolia para este resultado. Todas las que conocemos utilizan álgebra lineal de una u otra manera. De todas las ideas más o menos equivalentes, veremos la demostración de Tverberg, que puede que sea la más transparente. Demostración. Sean {1, ... , n} el conjunto de vértices de K n y sean L j , Rj los conjuntos de vértices que definen el grafo bipartito completo Hj, para j = 1, ... , m. A cada vértice i asociamos una variable Xi. Como Kn está descompuesto en H I , ... ,Hm, tenemos (1)

Ahora supongamos que el teorema es falso y que, por tanto, m < n - 1.

Descomposición de K5 en 4 subgrafos bipartitos completos.

56

Rectas en el plano y descomposición de grafos Entonces el sistema de equaciones lineales Xl

+ ... + x n

O,

O

(k=l, ... ,m)

tiene menos ecuaciones que variables, y por tanto existe una solución no trivial cl, ... ,cn · Por (1) inferimos que

¿CíCj

O.

i<j

Pero esto implica n

¿C7 í=l

í<j

una contradicción, y la demostración está completa.

G:

Un grafo G con 7 vértices y 11 aristas. Tiene un bucle, una arista doble y una arista triple.

> O,

i=l

o

Los grafos están entre las estructuras más básicas de las matemáticas. En consecuencia, pueden tener apariencia, representaciones y formas muy diversas. De manera abstracta, un grafo es un par G = (V, E), donde Ves el conjunto de vértices, E es el conjunto de aristas, y cada arista e E E "conecta" dos vértices v, w E V. Consideramos únicamente grafos finitos, es decir, que V y E son finitos. Normalmente trabajamos con grafos simples, en los que no se admiten bucles, es decir, aristas en las cuales los extremos coinciden, ni tampoco aristas múltiples, que tienen el mismo conjunto de extremos. Los vértices de un grafo se llaman adyacentes o vecinos si están en los extremos de una arista. Un vértice y una arista se llaman incidentes si la arista tiene a ese vértice como extremo. A continuación mostramos una pequeña galería de grafos simples importantes:

Los grafos completos Kn de n vértices y G) aristas

@I

Kl,l

@I

K~

K~

~

Los grafos bipartitos completos Km,n con m + n vértices y mn aristas

K 2 ,2

K 2 ,3

K 3 ,3

~

Rectas en el plano y descomposición de grafos

57

Los caminos P n con n vértices

Los ciclos

Dos grafos G = (V, E) Y G ' = (V', E') se consideran isomorfos si existen biyecciones V -+V ' y E -+ E' que conservan la incidencia entre aristas y sus extremos. (Si existe o no un método eficiente para decidir si dos grafos dados son equivalentes es un problema aún sin resolver.) Esta noción de isomorfismo nos permite hablar de el grafo completo K5 de S vértices, etc. Un grafo G ' = (V', E') es un subgrafo de G = (V, E) si V' C;;; E' C;;; E, Y cualquier arista e E E' tiene los mismos extremos en G' y en G. G' es un subgrafo inducido si, además, todas las aristas de G que conectan vértices de G' son también aristas de G' . Muchas nociones sobre grafos son muy intuitivas. Por ejemplo, un grafo es conexo si a cualesquiera dos vértices distintos les une un camino en G, o lo que es equivalente, si G no puede descomponerse en dos sub grafos no vaCÍos cuyos conjuntos de vértices sean disjuntos. Finalizamos esta revisión de conceptos básicos de grafos con un poco de terminología: Un conjunto independiente en G es un subgrafo inducido sin aristas, esto es, un subconjunto del conjunto de vértices tal que no hay dos que estén conectados por una arista de G. Un grafo es un bosque si no contiene ciclos. Un árbol es un bosque conexo. Finalmente, G = (V, E) es un grafo bipartito si es isomorfo a un sub grafo de un grafo completo bipartito, esto es, si sus vértices pueden escribirse como una uníon V = VI U V2 de dos conjuntos independientes.

[1] N. G. DE BRUIJN & P. ERDÓS: On a combinatorial problem, Proc. Kon. Ned.

Akad. Wetensch. 51 (1948), 1277-1279. [2] H. S. M. COXETER: A problem of collinear points, Amer. Math. Month1y 55 (1948),26-28 (contains Kelly's proof). [3] P. ERDÓS: Problem 4065 - Three point collinearity, Amer. Math. Month1y 51 (1944),169-171 (contains Gallai's proof). [4] R. L. GRAHAM & H. O. POLLAK: On the addressing problemfor loop switching, Bell System Tech. J. 50 (1971), 2495-2519. [5] J. J. SYLVESTER: (1893), 156.

Mathematical Question 11851, The Educationa1 Times 46

[6] H. TVERBERG: On the decomposition of Kn into complete bipartite graphs, J. Graph Theory 6 (1982), 493-494.

en con n vértices

es un sub grafo de

Intente usted mismo -antes de continuar leyendo- construir configuraciones de puntos en el plano que determinen "relativamente pocas" pendientes. Para ello suponemos, por supuesto, que los n 2: 3 puntos que se utilicen no están alineados. Recuérdese del capítulo 9 sobre "rectas en el plano" el teorema de Erd6s y de Bruijn: los n puntos determinarán al menos n rectas diferentes; pero, por supuesto, muchas de estas rectas pueden ser paralelas y tendrán la misma pendiente.

n=3

n=4

n=5

n=6

n=7

3 pendientes

4 pendientes

4 pendientes

6 pendientes

6 pendientes

ó

n=3

n=4

3 pendientes 4 pendientes

n=5

n=6

n=7

4 pendientes

6 pendientes

6 pendientes

Después de unos cuantos intentos con algunas configuraciones, usted podría conjeturar - tal y como hizo Scott en 1970 - el siguiente teorema.

Teorema. Si n 2: 3 puntos en el plano no están alineados, entonces determinan al menos n - 1 pendientes diferentes, verificándose la igualdad sólo si n es impar y n 2: 5.

Los ejemplos de arriba -los dibujos representan las primeras configuraciones en dos sucesiones infinitas de ejemplos- nos muestran que el enunciado del teorema, tal y como aparece aquí, es el mejor posible: para cualquier impar n 2: 5 existe una configuración con n puntos que determina exactamente n - 1 pendientes diferentes, y para cualquier otro n 2: 3 tenemos una configuración con exactamente n pendientes.

El análisis de algunos casos particulares para n pequeño probablemente le conducirá a una de las sucesiones que se muestran aquí.

60

El problema de la pendiente

., ., ., ., ., ., ., ., ., ., ., ., .,

., ., ., ., ., ., ., ., ., ., ., .,

., ., ., ., ., ., ., ., ., Tres bonitos ejemplos esporádicos tomados del catálogo de Jamison-Hill

Sin embargo, las que hemos más arriba no son, ni mucho menos, las únicas. Por ejemplo, Jamison y Hill describieron cuatro familias infinitas de configuraciones con un número n impar de puntos que determinan sólo n - 1 pendientes ("configuraciones críticas de pendientes") . Aún más, dieron una lista de 102 ejemplos "esporádicos" -la mayoría de ellos encontrados mediante búsquedas exhaustivas con ordenadores- que no parecen ajustarse a ninguna familia infinita . El saber convencional diría que los problemas extremales suelen ser muy difíciles de resolver si configuraciones extremas son tan diversas e irregulares. De hecho, es mucho lo que puede decirse de la estructura de configuraciones críticas de pendientes (véase [2]), pero llegar a una clasificación parece ser algo inalcanzable. Sin embargo, el teorema que hemos expuesto arriba admite una demostración sencilla, con dos ingredientes principales: la reducción a un modelo combinatorio eficaz (debida a Eli Goodman y Ricky Pollack), y un bonito argumento en este modelo con el cual Peter Ungar completó la demostración en 1982 . • Demostración. (1) En primer lugar, nótese que es suficiente probar que cualquier conjunto de puntos en el plano de cardinal par determina al menos n pendientes. Esto es así, ya que el caso n = 3 es trivial, y para cualquier conjunto de n = 2m + 1 2: 5 puntos (no alineados) podemos encontrar un subconjunto de n 1 = 2m puntos, no todos alineados, que ya determinan n - 1 pendientes. Por tanto, en lo que sigue consideraremos configuraciones de n = 2m puntos en el plano que determinan t 2: 2 pendientes diferentes.

2

Esta configuración de n = 6 puntos detennina t = 6 pendientes diferentes.

• 1

3





4 5

6



.,

2

1 2 3 456 Aquí, 7fo = 123456 representa una dirección vertical.

(2) El modelo combinatorio se obtiene construyendo una sucesión periódica de permutaciones. Para ello, comenzamos con alguna dirección en el plano que no sea una de las pendientes de la configuración, y numeramos los puntos 1, ... , n según el orden en el que aparecen si los proyectamos en esta dirección. Así, la permutación 7fa = 123 ... n representa el orden de los puntos respecto de nuestra dirección de partida . A continuación, movemos la dirección en sentido contrario a las agujas del reloj y observamos cómo cambian la proyección y su permutación. El orden de los puntos proyectados cambia exactamente cuando la dirección coincide con una de las pendientes de la configuración. Pero los cambios están lejos de ser aleatorios o arbitrarios: tomando una rotación de 180 0 de la dirección, obtenemos una sucesión de permutaciones 1fa

--+ 1fl --+ 1f2 --+ ... --+ 1ft-l --+ 1ft

que tiene las siguientes propiedades especiales: La sucesión comienza con 1fa = 123 ... n y termina con 1ft = n . .. 321. iII

iII

iII

La longitud t de la sucesión es el número de pendientes de la configuración de puntos. En el trancurso de la sucesión, cada par i < j se intercambia exactamente una vez. Esto significa que en el camino que lleva de 1fa = 123 ... n a 1ft = n . .. 321, sólo se intercambian las subcadenas crecientes. Cada movimiento consiste en la inversión de una o más subcadenas crecientes (que corresponden a una o más rectas que tienen como pendiente la dirección por la cual pasamos en ese punto).

El problema de la pendiente

7f6

=

61

654321

tt ttt

7f5

= 652341

/ IIIII ~ ~

4

1

~

6

~

7f4

= 625314

7f3

= 265314 De este dibujo obtenemos la sucesión de permutaciones de nuestro ejemplo

~ ~

~

7f1

7fo

7f2 =

213564

= 213546

= 123456

Continuando con el movimiento circular alrededor de la configuración de puntos, podemos interpretar la sucesión como parte de una sucesión infinita y periódica de permutaciones: ... --+ 7f-1 --+ 7fo --+ ... --+ 7ft --+ 7ft+1 --+ ... --+ 7f2t --+ ...

Aquí 7fi+t es la inversa de 7fi para todo i, y de aquí 7fi+2t = 7fi para todo i E Z. Demostraremos que toda sucesión con las propiedades anteriores (y t 2: 2) ha de tener longitud t 2: n. (3) La clave de la demostración es dividir cada permutación en una "mitad izquierda" y una "mitad derecha" de la misma longitud m = ~, y contar las letras que cruzan la barrera imaginaria entre la parte izquierda y la derecha. Llamaremos a 7fi --+ 7fi+1 un movimiento de cruce si una de las subcadenas que invierten el sentido contiene letras de ambos lados de la barrera. En movimiento de cruce tiene orden d si mueve 2d letras al otro lado de la barrera, es decir, si la cadena que cruza tiene exactamente d letras en un lado y las otras d en el otro. Así, en nuestro ejemplo

1

6

~

213564 Un movimiento de cruce

es un cruce de orden d = 2 (mueve 1,3,5,6 al otro lado de la barrera, lo que señalamos con ":"); el movimiento 652:341 es un cruce de orden d

--+

654:321

= 1, mientras que 625:314

no es un movimiento de cruce.

--+

652:341

265314 ~

62

El problema de la pendiente

En el transcurso de la sucesión 1To ---+ 1Tl ---+ ... ---+ 1Tt, cada una de las letras 1,2, ... ,n ha de cruzar la barrera al menos una vez. Esto implica que, si los órdenes de los movimientos de cruce son dI, d2 , ... , de, entonces se verifica e

L

2dí

=

#{letras que cruzan la barrera} ;::: n.

í=1

Esto implica también que tenemos al menos dos movimientos de cruce, ya que un movimiento que cumpla 2dí = n se da únicamente si todos los puntos están alineados, es decir, cuando t = 1. Geométricamente, un movimiento de cruce corresponde a la dirección de una recta de la configuración que deja menos de m puntos a cada lado. 652341

4 /

625314 ~

1

es un movimiento de toque. Visto de manera geométrica, un movimiento de toque corresponde a la pendiente de una recta de la configuración que deja exactamente m puntos a un lado, y por tanto, como mucho m - 2 puntos al otro.

6 Un movimiento de toque

Llamaremos ordinarios a los movimentos que no son ni toques ni cruces. Un ejemplo es 1TI = 213:546 --+ 213:564 = 1T2.

4

1

(4) Un movimiento de toque es un movimiento que invierte el sentido de alguna cadena adyacente a la barrera central, pero no la cruza. Por ejemplo,

6 ~

~

213564

Así, cualquier movimiento es un cruce, un toque, o un movimiento ordinario, y utilizaremos las letras O, T, para referimos a ellos. O(d) denotará un cruce de orden d. Así, en nuestro pequeño ejemplo obtenemos

°

213546 T

Un movimieto ordinario

O

0(2)

O

T

0(1)

1To --+ 1TI --+ 1T2 --+ 1T3 --+ 1T4 --+ 1T5 --+ 1T6,

o incluso en una forma más corta, podemos referimos a esta sucesión como T, 0,0(2),0, T, 0(1). (5) Para completar la demostración necesitamos los siguientes dos hechos: Entre cualesquiera dos cruces existe al menos un toque. Entre cualquier cruce de orden d y el siguiente toque, existen al menos d - 1 movimientos ordinarios.

En efecto, después de un cruce de orden d, la barrera está contenida en una subcadena simétrica decreciente de longitud 2d, con d letras en cada lado de la barrera. Para el siguiente cruce la barrera central debe desplazarse dentro de una subcadena creciente de longitud al menos 2. Pero sólo los movimientos de toque tienen influencia en que la barrera esté o no en una cadena creciente. Para el segundo hecho, nótese que con cada movimiento ordinario (que invierte algunas subcadenas crecientes), la cadena decreciente de longitud 2d puede acortarse únicamente por una letra en cada lado. Además, mientras la cadena decreciente tenga al menos 4 letras, un toque es imposible. De aquí se sigue el segundo hecho.

El problema de la pendiente

63

Si construimos la sucesión de de manera que comenzamos con la misma proyección inicial, pero usamos una rotación en el sentido horario, entonces obtenemos la sucesión de permutaciones inversa. Así, la sucesión que habíamos apuntado debe satisfacer también el opuesto de nuestro segundo hecho, es decir E?1tre un toque y el siguiente cruce, de orden d, existen al menos d-1 movimientos ordinarios.

El patrón T -O-C de la sucesión infinita de permutaciones, tal y como se deriva de (2), se obtiene repitiendo una y otra vez el patrón T-O-C de longitud t de la sucesión 1fo -----+ ... -----+ 1ft. Así, con los hechos de (5) vemos que en la sucesión infinita de movimientos, cada cruce de orden d forma parte de un patrón T -O-C del tipo

T,O,O, ... , O,C(d),O,O, ... ,0, ~~

2:

2:

d-l

d-l

de longitud 1 + (d - 1) + 1 + (d - 1) = 2d. En la sucesión infinita, consideramos un segmento finito de longitud t que comienza con un toque. Este segmento está formado por subcadenas del tipo (*) y posiblemente de otras del tipo T. Esto implica que su longitud t satisface e

t ~ ¿2di > n, i=l

lo cual completa la demostración.

o

[1] J. E. GOODMAN & R. POLLACK: A combinatorial perspective on sorne problems in geometry, Congressus Numerantium 32 (1981), 383-394. [2] R. E. JAMISON & D. HILL: A catalogue of slope-critical configurations, Congressus Numerantium 40 (1983),101-125.

[3] P. R. SCOTT: On the sets of directions determined by n points, Amer. Math. Monthly 77 (1970), 502-505. [4] P. UNGAR: 2N noncollinear points determine at least 2N directions, J. Combinatorial Theory, Ser. A 33 (1982), 343-347.

Un grafo es planar si puede dibujarse en el plano ffi.2 sin aristas que se crucen (o de manera equivalente, en la esfera 2-dimensional 8 2 ). Decimos que un grafo es plano si ese dibujo viene ya dado y fijado. Cualquier dibujo de este tipo descompone el plano o la esfera en un número finito de regiones conexas, incluyendo la región exterior (no acotada), a las que nos referimos como caras. La fórmula de Euler descubre una bella relación entre el número de vértices, aristas y caras, que es válida para cualquier grafo plano. Euler mencionó este resultado por primera vez en una carta a su amigo Goldbach en 1750, pero en aquel entonces no tenía una demostración completa. Entre las muchas demostraciones de la fórmula de Euler, presentamos una bonita y "auto-dual" que no necesita inducción y se remonta a 1847, cuando aparece en el libro "Geometrie der Lage" de Karl Georg Christian von Staudt.

Fórmula de Euler. Si G es un grafo e aristas y f caras, entonces n- e+ f = 2 .

conexo con n

I/P¡e/u'p\,

• Demostración. Sea T ~ E el conjunto de aristas de un árbol generador de G, esto es, un sub grafo minimal que conecta todos los vértices de G. Este grafo no contiene ciclos por la suposición de minimalidad. Ahora necesitamos el grafo dual G* de G: para construirlo, ponemos un vértice en el interior de cada cara de G, y para cada arista de G que separa dos caras conectamos los vértices correspondientes de G* mediante una arista. Si dos caras de G comparten varias aristas en su frontera, conectaremos los vértices correspondientes del grafo dual mediante más de una arista. (Así pues, G* puede tener aristas múltiples incluso si el grafo original G es simple.) Consideramos la colección T* ~ E* de aristas en el grafo dual que se corresponden a las aristas en E\T. Las aristas en T* conectan todas las caras, ya que T no tiene ciclos; pero T* tampoco contiene ciclos, pues de otra manera separaría algunos de los vértices de G dentro del ciclo de los de fuera (y esto no puede ser, ya que T es un sub grafo generador, y las aristas de T* no se intersecan). Así pues, T* es un árbol generador para G*. Para cada árbol, el número de vértices es uno más que el número de aristas. Para verlo, elegimos un vértice como raíz y dirigimos todas las aristas "hacia la raíz". Esto conduce a una biyección entre los vértices que no son raíz y las aristas, haciendo corresponder cada arista con el vértice desde el cual sale. Aplicado al árbol T esto conduce a que n = eT + 1, mientras que para el árbol T* obtenemos f = eT* + 1. Sumando ambas ecuaciones obtenemos la O relación n + f = (eT + 1) + (eT* + 1) = e + 2.

Leonhard Euler

Un grafo plano G: n

=

6, e

=

10,

f =

Árboles generadores duales en G y enG*

6

66

Tres aplicaciones de lafórmula de Euler La fórmula de Euler produce una conclusión numérica inesperada a partir de una situación métrico-topológica: El número de vértices, aristas y caras de un grafo finito G satisface n-e + f = 2 siempre que el grafo esté o pueda estar dibujado-en el plano o sobre una esfera. De la fórmula de Euler se derivan muchas consecuencias conocidas, algunas de ellas clásicas. Entre ellas figuran la clasificación de los poliedros regulares convexos (los sólidos platónicos), el hecho de que los grafos K5 y K 3 ,3 no son planares (véase más adelante), y el teorema de los cinco colores, que afirma que cada mapa planar puede ser coloreado usando como máximo cinco colores, de manera que dos regiones adyacentes no tengan el mismo color. Sin embargo, para este último resultado tenemos una demostración mucho mejor, que no necesita la fórmula de Euler - véase el capítulo 30. En este capítulo incluimos otras tres bellas demostraciones que dependen de manera esencial de la fórmula de Euler. Las dos primeras - una demostración del teorema de Sylvester-Gallai, y un teorema sobre configuraciones de puntos coloreados con dos colores - utilizan la fórmula de Euler en una inteligente combinación con otras relaciones aritméticas entre los parámetros básicos de un grafo. Veamos primero cuáles son estos parámetros.

Los cinco sólidos platónicos

2

El grado de un vértice es el número de aristas que terminan en él, contando cada bucle dos veces. Sea ni el número de vértices de grado i en G. Contando los vértices de acuerdo con sus grados, obtenemos (1)

Por otro lado, toda arista tiene dos extremos, de manera que contribuye con 2 a la suma de todos los grados. Por tanto, 2 2 Aquí escribimos el grado alIado de cada vértice. Contando los vértices de un grado dado, se tiene n2 = 3, n3 = O, n4 = 1, n5 = 2.

(2)

Esta identidad puede interpretarse como si se contara de dos maneras los extremos de las aristas, esto es, las incidencias entre aristas y vértices. El grado medio d de los vértices es, en consecuencia, d =

2

Ahora contamos las caras de un grafo plano de acuerdo con su número de lados: Una k-cara es una cara delimitada por k aristas (¡hay que contar dos veces cada arista que delimita la misma cara por los dos lados!) Sea fk el número de k-caras. Contando todas las caras obtenemos

f =

Hemos escrito el número de lados den.tro de cada región. Contando las caras con un determinado número de lados obtenemos JI = 1, h = 3, J4 = 1, fg = 1, Y Ji = O en los demás casos.

2e n

-.

JI + h + fs + f4 + ...

(3)

Contando las aristas de acuerdo con las caras de las cuales son lados, obtenemos (4)

Como antes, podemos interpretar esto como si contáramos las incidencias entre aristas y caras de dos maneras distintas. Nótese que el número medio de lados de las caras viene dado por 2e

J"

Tres aplicaciones de lafórmula de Euler

67

A

de esto, con la fórmula de se deduce que el y el grafo completo bipartito K 3 ,3 no son planares. Para un dibujo plano de K5 se tendría n = 5, e = (~) = 10, por tanto f = e + 2 - n = 7 Y 1 = 2; = 27° <3. Pero si el número medio de lados es menor que 3, entonces el dibujo hipotético tendría una cara con dos lados como máximo, lo cual es imposible. De manera similar, para K 3 ,3 obtenemos n = 6, e = 9, Y f = e + 2 - n = 5, Y por tanto 1 = 2; = 158 < 4. Esto es imposible, ya que K3,3 es simple y bipartito, y por lo tanto la longitud de cualquiera de sus ciclos es por lo menos 4. No es coincidencia, por tanto, que las ecuaciones (3) y (4) para los fi se parezcan tanto a las ecuaciones (1) y (2) para los ni. Se pueden transformar unas en las otras pasando del grafo G al grafo dual G* .

Un dibujo de K5 con un cruce

De las fórmulas para contar incidencias obtenemos las siguientes importantes consecuencias de la fórmula de Euler. pr,op'OSJCl()ll. Sea G cualquier grafo plano simple con n > 2 vértices. Entonces (A) G tiene un vértice de grado a lo sumo 5. (B) G tiene a lo sumo 3n - 6 aristas.

(C) Si coloreamos las aristas de G con dos colores, hay un vértice de G de

manera que al leer las aristas incidentes a él en orden cíclico, vemos a lo sumo dos cambios de color. • Demostración. Para todos los enunciados podemos suponer G conexo.

(A) Cada cara tiene por lo menos 3 aristas (ya que G es simple), con lo cual (3) y (4) nos dan

f 2e

h + f4 + f5 + .. . 3h + 4f4 + 5f5 + .. .

y por tanto 2e 3f ~ O. Si cada vértice tiene grado por lo menos 6, entonces (1) y (2) implican que n 2e

n6 6n6

+ n7 + ns + .. . + 7n7 + 8n8 + .. .

y por tanto 2e - 6n ~ O. Juntando ambas desigualdades obtenemos 6(e-n-f) = (2e-6n)+2(2e-3f) > O y por tanto e

~

n

+ f, contradiciendo la fórmula de Euler.

(B) Igual que en el primer paso del apartado (A), obtenemos 2e - 3f aplicando la fórmula de Euler, que 3n - 6

=

3e - 3f

> e.

~

O y,

Un dibujo de K 3 ,3 con un cruce

68

Tres aplicaciones de la fórmula de Euler

donde un cambio de color. (C) Sea c el número de que el enunciado es falso. Entonces hay c 2': 4n esquinas con cambios de color, ya que en cada vértice hay un número par de cambios. Ahora, cada cara con 2k ó 2k + 1 lados tiene como mucho 2k tales esquinas, de lo cual concluimos que

4n < c Las flechas señalan esquinas con un cambio de color.

< 2h + 414 + 415 < 2h + 414 + 615

+ 616 + 617 + 818 + ... + 816 + 1017 + .. . 2(3h + 414 + 515 + 616 + 717 + ... ) -4(h + 14 + 15 + 16 + 17 + ... )

4e - 41,

donde hemos vuelto a usar (3) y (4). Por tanto, tenemos e 2': n en contradicción con la fónnula de Euler.

1.

+ 1, otra vez O

vez

Parece ser que Nonnan Steenrod fue el primero en darse cuenta de que el apartado (A) de la proposición nos da una demostración extraordinariamente sencilla del teorema de Sylvester-Gallai (véase el capítulo 9). El teorema de Sylvesíer-Gallai. Dado cualquier conjunto de n 2': 3 puntos en el plano, no todos alineados, siempre hay una recta que contiene exactamente dos de los puntos . • Demostración. (Sylvester-Gallai vía Euler) Si situamos el plano JR2 dentro de JR3 y cercano a la esfera unidad S2 como indica la figura, cada punto de JR2 se corresponde con una pareja de puntos antipodales en S2, y las rectas en JR2 se corresponden con circunferencias máximas en S2. Por tanto, el teorema de Sylvester-Gallai dice lo siguiente: Dado cualquier conjunto de n 2': 3 parejas de puntos antipodales en la esfera, no todos en una circunferencia máxima, siempre hay una circunferencia máxima que contiene exactamente dos de las parejas.

.. v

.. "

Ahora pasamos a la versión dual, reemplazando cada pareja de puntos con la correspondiente circunferencia máxima en la esfera. Dicho de otra manera, en vez de puntos ±v E S2 consideramos las circunferencias ortogonales dadas por Cv := {x E S2 : (x, v) = O}. (Este Cv es el ecuador si consideramos v como polo norte de la esfera.) El problema de Sylvester-Gallai nos pide demostrar: Dada cualquier colección de n 2': 3 circunferencias máximas en S2, no todos pasando por el mismo punto, siempre hay un punto contenido en exactamente dos de los círculos.

Pero el arreglo de circunferencias máximas se puede interpretar como un grafo plano simple en S2, cuyos vértices son los puntos de intersección de dos de las circunferencias, y cuyas aristas los arcos de circunferencias entre los vértices. El grado de todos los vértices es par, y además por lo menos 4 - por construcción. Por tanto, el apartado (A) de la proposición nos da la existencia de un vértice de grado 4. ¡Ya está! CJ

Tres aplicaciones de la fórmula de Euler

69

La siguiente demostración de una versión "coloreada" del teorema de SylvesterGallai se debe a Don Chakerian. Teorema. Dado cualquier configuración de puntos "negros" y "blancos" en el plano, hay siempre por lo menos una recta "monocromática ", es decir, una recta que contiene al menos dos puntos de un color y ninguno del otro . • Demostración. Igual que en el problema de Sylvester-Gallai, llevamos el problema a la esfera unidad y aplicamos dualidad. Tenemos que demostrar, pues: Dado cualquier colección de circunferencias máximas "blancos" y "negros" en la esfera unidad, no todos pasando por el mismo punto, siempre existe un punto de intersección que o bien sólo está en circunferencias blancas, o bien sólo en circunferencias negras.

La solución queda clara a partir de la parte (C) de la proposición, ya que en cada vértice que es intersección de circunferencias con diferentes colores, hay por lo menos 4 esquinas con cambio de color. O

El teorema de Pick del año 1899 es un resultado bello y sorprendente por sí mismo, pero también es una consecuencia clásica de la fórmula de Euler. Diremos que un polígono convexo P ~ ffi.2 es elemental si sus vértices son enteras (es decir, están contenidos en la retícula Z'?), pero no contiene más puntos de la retícula. Lema. Cada triángulo elemental 6. A(6.) = ~.

=

conv{PO,PI,P2} ~ ffi.2 tiene área

PI

~

• • •

Demostración. Tanto el paralelogramo P que tiene como vértices Po, PI' P2, PI + P2 - Po, como la retícula 'Z'} , son simétricos respecto de la aplicación

cr:

X

1--+

PI

+ P2

Teorema. El área de cualquier polígono Q ~ ffi.2, no necesariamente convexo, pero con vértices enteros, viene dada por A(Q) =

1

nint

l1li

- x,

que es la reflexión con respecto al centro del segmento de PI a P2' Por tanto, el paralelogramo P = 6. U cr(6.) también es elemental, y sus traslaciones con vectores de coordenadas enteras teselan el plano. Por tanto, {PI -Po, P2 -Po} es una base de la retícula Z2, la matriz correspondiente tiene determinante ±1, P es un paralelogramo de área 1 y 6. tiene área ~. (Explicamos estos términos en el recuadro de arriba.) O

+ 2nfr -

1,

.10nde nint Y nfr son, respectivamente, el número de puntos con coordenadas enteras en el interior yen lafrontera de Q.

• • P2•

Po

+ P2 l1li

PI

• •

- Po

..



l1li

l1li



• • • • • • • • • • • • • • • • =•11 Y• = 8, •portanto • A•= 14•

l1li

nin,

nlr

70

Tres aplicaciones de la fórmula de Euler

Una base de 7!} es un par de vectores linealmente H""v~'vU~',U'v" el, e2 tal que Z2 = {Alel + A2e2 : Al, A2 E Z}.

m

y e2 = (~), entonces el área del Sean el = que Idet (~~)I. Si determinan el Y e2 es A(el, e2) = Idet(el, e2)1 = (:) y es otra base, entonces existe una matriz invertible con elementos enteros Q tal que (; ~) = (~~) Ya que ~), y los determinantes son enteros, se sigue que I det QI = 1, y Idet( el, e2) l· Concluimos que todos los por tanto Idet(f l' f 2) I paralelogramos que se corresponden a una base tienen la misma área 1, ya que A ( @, (~)) = 1.

(D

(¿

111 Demostración. Cualquier polígono Q con las características del teorema puede triangularse usando todos los nint puntos de la retícula en su interior, y todos los nft· puntos de la retícula en su frontera. (Esto no es obvio del todo, sobre todo si no pedimos que Q sea convexo, pero lo demuestra el argumento del capítulo 31 sobre el problema de la galería de arte.) Ahora interpretamos la triangulación como un grafo plano que subdivide el plano en una cara no acotada, más f - 1 triángulos de área ~, de manera que

A(Q) =

~(f -

1).

Todo triángulo tiene tres lados, y cada uno de los eint lados interiores separa dos triángulos, mientras que los ejr lados en la frontera sólo aparecen en un único triángulo cada uno. Por tanto, 3(f - 1) = 2eint + ejr, y por tanto f = 2 (e - f) - efr + 3. Además, el numero de aristas y vértices en la frontera es el mismo, efr = njr. Estos dos hechos, junto con la fórmula de Euler, dan

f

2(e-f)-efr+ 3 2(n - 2) - nfr

+3

=

2nint

+ nfr -

1,

y por tanto

A(Q)

~(f - 1)

D

[1] G. D. CHAKERIAN: Sylvester's problem on collinear points and a relative, Amer.

Math. Monthly77 (1970),164-167. [2] G. PIeK: Geometrisches zur Zahlenlehre, Sitzungsberichte Lotos (Prag), Naturmedo Verein für Bóhmen 19 (1899), 311-319. [3] K. G. C. VON STAUDT: Geometrie der Lage, Verlag der Fr. Korn'schen Buchhandlung, Nürnberg 1847. [4] N. E. STEENROD: Solution 4065/Editorial Note, Amer. Math. Monthly 51 (1944), 170-171.

1

Un famoso resultado que depende de la fórmula de Euler (en concreto, en la parte (C) de la proposición del capítulo anterior) es el teorema de rigidez de Cauchy para poliedros tridimensionales. Para las nociones de congruencia y equivalencia combinatoria que utilizamos a continuaci.ón, el lector se puede dirigir al apéndice sobre politopos y poliedros del capítulo en el que tratamos el tercer problema de Hilbert, en la página 50.

Teorema. Si dos poliedros convexos tridimensionales P y p' son combinatoriamente equivalentes y las caras correspondientes son congruentes, entonces los ángulos entre los correspondientes pares de cason congruentes). ras son iguales (y, por tanto, P y

La figura del margen muestra dos poliedros tridimensionales combinatoriamente equivalentes, y tales que las caras correspondientes son congruentes. Sin embargo, no son congruentes, y sólo uno de ellos es convexo. Por tanto, ¡la hipótesis de convexidad es esencial en el teorema de Cauchy! • Demostración. Lo que presentamos a continuación es, esencialmente, la demostración original de Cauchy. Supongamos que tenemos dos poliedros convexos p y p' con caras congruentes. Coloreamos las aristas de P de la siguiente forma: una arista es negra (o "positiva") si el ángulo interior entre las caras adyacentes es mayor en p' que en P; es blanca (o "negativa") si el ángulo es menor en p' que en P. El conjunto de aristas blancas y negras de P forma un grafo plano 2-coloreado en la superficie de P que, mediante una proyección central con origen en un punto interior de P, podemos considerar en la superficie de la esfera unidad. Si P Y p' tienen ángulos distintos entre caras correspondientes, el grafo es no vacío. Utilizando la parte (C) de la proposición del capítulo anterior, deducimos que existe un vértice p que es adyacente al menos a una arista blanca o negra, y tal que hay como mucho dos cambios entre aristas blancas y negras (considerando el orden cíclico). Consideremos ahora la intersección del poliedro P con una esfera pequeña SE (de radio E) centrada en el vértice p, y la intersección de p' con una esfera S~ del mismo radio E centrada en el vértice correspondiente p'. En SE y S~ se obtienen polígonos esféricos Q y Q', convexos, tales que los arcos correspondientes tienen la misma longitud, ya que las caras correspondientes de P y p' son congruentes y hemos utilizado el mismo radio E. Ahora marcamos con un + los ángulos de Q para los que el ángulo corres-

Augustin Cauchy

El teorema de rigidez de Cauchy

72

Q:

Q':

+

pondiente en es mayor, y con un - los ángulos para los que el ángulo correspondiente en Q' es menor. Por tanto, cuando nos movemos de Q a Q', los ángulos marcados con + se "abren" y los ángulos marcados con - se "cierran", en tanto que las longitudes de las aristas y el resto de los ángulos permanecen constantes. De acuerdo con la elección de p, sabemos que existe algún signo + o -, y que en el orden cíclico hay, como mucho, dos cambios +/ -. Si sólo hay signos de un tipo, el lema que presentamos a continuación produce una contradicción, pues asegura que alguna arista debe cambiar de longitud. Si hay signos de los dos tipos, entonces (como hay sólo dos cambios de signo) existe una "recta de separación" que une los puntos medios de dos aristas y separa los signos + de los signos -. De nuevo obtenemos una contradicción utilizando el lema que presentarnos a continuación, ya que la recta de separación no puede ser a la vez más larga y más corta en Q' que en Q. O Lema de la poligon.al de Cauchy. Si Q y Q' son n-ágonos convexos (planos o esféricos) etiquetados como en la figura, qn-l Q~... 003

q2

oon-l

_____

002

ql

qn

de tal manera que las longitudes de las aristas correspondientes verifican qiqi+l = q~q~+l para 1 ~ i ~ n -1, y los ángulos correspondientes verifican OOi ~ oo~ para 2 ~ i < n - 1, entonces la longitud de la arista "restante" verifica qlqn ~ q~ q~, y la igualdad se da si y sólo si OOi =

oo~

para todo i.

Aquí es interesante mencionar que la demostración original de Cauchy no era correcta: un movimiento continuo que hace crecer los ángulos y mantiene constantes las longitudes de los lados puede destruir la convexidad - ¡véase la figura! Además, tanto el lema como la demostración presentada aquí, aparecidos en una carta de I. J. Schoenberg a S. K. Zaremba, son válidos tanto para polígonos planos como esféricos. 111 Demostración.. Razonarnos por inducción sobre n. El caso n = 3 resulta sencillo: si en un triángulo aumenta el ángulo I entre dos lados de longitudes fijas a y b, entonces la longitud c del tercer lado también aumenta, según demuestra el teorema del coseno

en el caso plano, y el resultado análogo cos e =

cos a cos b + sen a sen b cos I

El teorema de rigidez de Cauchy

73

a, b, e se miden en la en trigonometría esférica. Las de la esfera de radio 1 y, por tanto, toman valores, en el intervalo [O, 7r]. Consideremos ahora n 2: 4. Si para algún i E {2, ... , n - 1} se verifica que Oói = Oó~, el vértice correspondiente se puede eliminar insertando las diago" 'f ican qi-l qi+l= qi-l ' qi+l' , na1es de qi-l a qi+l y de qi-l a qi+l' que ven Y podemos utilizar la hipótesis de inducción. Por tanto, podemos suponer que Oói < Oó~ para 2 :::; i :::; n - 1. Construimos un nuevo polígono Q* a partir de Q cambiando Oón-l por el mayor ángulo posible Oó~_l :::; Oó~-l de fonna que Q* siga siendo convexo. Para ello, reemplazamos qn por q~, manteniendo el resto de vértices qi' longitudes de aristas y ángulos de Q. Si se puede escoger Oó~_l = Oó~_l de manera que Q* siga siendo convexo, se obtiene ql qn < ql q::' :::; q~ q~, utilizando el caso n = 3 para la primera desigualdad e inducción, como anterionnente, para la segunda. Si esto no es posible, después de un movimiento para el que se tiene (1)

quedamos "bloqueados" en una situación en que q2' ql Y q~ son colineales, de fonnaque (2) q2ql + ql q::' = q2q::,· Comparando Q* y Q' obtenemos q2 qn* < q2' qn'

por inducción sobre n (ignorando los vértices ql y

(3)

qD. Por tanto,

donde (*) es la desigualdad triangular y el resto de las desigualdades han sido deducidas anterionnente. O Hemos visto un ejemplo que demuestra que el teorema de Cauchy no es cierto para poliedros no convexos. La característica especial del ejemplo es, evidentemente, un salto discontinuo que lleva un poliedro al otro, manteniendo las caras congruentes mientras los ángulos diedros "saltan." Se puede preguntar algo más:

¿Puede para algún poliedro no convexo, una deformación continua que mantenga las caras planas y congruentes?

Se había conjeturado que ninguna superficie triangulada, convexa o no, admitía tal movimiento. Por eso fue una gran sorpresa que en 1977 - más de 160 años después del trabajo de Cauchy - Robert Connelly presentara contraejemplos: esferas cerradas y trianguladas inmersas en ]Et3 (sin autointersecciones) que son flexibles, con un movimiento continuo que mantiene constantes las longitudes de las aristas y, por tanto, las caras triangulares congruentes.

Q0 t ql

qn

Oó n - 1 Q*:~ -ql q~

74

El teorema de rigidez de Cauchy

,

Un precioso ejemplo de superficie flexible construido por Klaus Steffen: las líneas discontinuas representan las aristas no convexas en este desarrollo del poliedro. Doble las líneas continuas como "montañas" y las discontinuas como "valles". Las aristas del modelo tienen longitudes 5, 10, 11, 12 Y 17 unidades.

"""-,

/ Y-, /\-

,/'

'

\,

/

/

/

-, -----.

-'- --

\ \, \ \ La teoría de rigidez de superficies tiene todavía más sorpresas: recientemente Idjad Sabitov consiguió demostrar que cuando estas superficies flexibles se mueven, el volumen que encierran debe permanecer constante. Su demostración hace un uso muy elegante de herramientas algebraicas (fuera del alcance de este libro).

[1] A. CAUCHY: Sur les polygones et les polyedres, seconde mémoire, J. École Polytechnique XVle Cahier, Tome IX (1813), 87-98; CEuvres Completes, He Série, Vol. 1, Paris 1905,26-38. [2] R. CONNELLY: A counterexample to the rigidity conjecture for polyhedra, Inst. Haut. Etud. Sci., Publ. Math. 47 (1978), 333-338. [3] R. CONNELLY: The rigidity of polyhedral surfaces, Mathematics Magazine 52 (1979),275-283. [4] I. KH. SABITOV: The volume as a metric invariant ofpolyhedra, Discrete Comput. Geometry 20 (1998), 405-425. [5] 1. SCHOENBERG & S.K. ZAREMBA: On Cauchy's lemma conceming convex polygons, Canadian J. Math. 19 (1967), 1062-1071.

¿ Cuántos

nera que en contacto dos a es ciones dos a dos tengan dimensión (d - 1)?

en ]Rd de maque todas las intersec-

Esta es una cuestión antigua y muy natural. Sea f (d) la solución de este problema, y anotamos f(l) = 2. Para d = 2 la configuración de los cuatro triángulos en el margen muestra que f(2) ?::: 4. No existe una configuración similar con cinco triángulos, ya que la construcción dual de ésta - que en nuestro ejemplo de los cuatro triángulos conduce a un dibujo plano de K4 proporcionaría un dibujo plano de K 5 , algo imposible (véase la página 67). Por tanto, tenemos

f(2)

En tres dimensiones es fácil ver que f(3) ?::: 8. Para ello, utilizamos la configuración de ocho triángulos que aparece a la derecha. Los cuatro triángulos sombreados están unidos a un punto x por debajo del 'plano del dibujo", proporcionando cuatro tetraedros que tocan el plano desde abajo. De manera similar, los cuatro triángulos blancos están unidos a un punto y por encima del plano del dibujo. Por tanto, obtenemos una configuración de ocho tetraedros en contacto en ]R3, esto es, f(3) ?::: 8. En 1965, Baston escribió un libro en el que probaba que f(3) :::; 9, yen 1991 Zaks tuvo que escribir otro libro para establecer que

f(3)

f(2) 2: 4

= 4.

f(3) 2: 8

= 8.

Con f(l) = 2, f(2) = 4 Y f(3) = 8, no es necesaria mucha inspiración para llegar a la siguiente conjetura, que formuló Bagemihl en 1956: Conjetura. En una configuración de símplices de dimensión d en número máximo de pares en contacto es

]Rd,

el

La cota inferior, f (d) ?::: 2d , es fácil de verificar - si lo hacemos bien. Esto nos conduce a usar reiteradamente transformaciones afines y un razonamiento por inducción sobre la dimensión que establece el siguiente resultado, más fuerte, que se debe a Joseph Zaks [4]: Teorema 1. Para cada d ?::: 2, existe una familia de 2d símplices que están en contacto dos a dos en ]Rd, junto con una recta transversal que interseca el interior de cada uno de los símplices individuales.

"Símplices en contacto"

76

Símplices en contacto

• Demostración. Para d = 2 la familia de cuatro triángulos que habíamos considerado tiene, efectivamente, dicha recta transversal. Ahora consideremos cualquier configuración d-dimensional de símplices en contacto y que tiene una recta transversal f!. Cualquier otra paralela cercana f!1 es también una recta transversal. Si elegimos f!1 y f! paralelas y suficientemente cercanas, entonces cada uno de los símpliées ha de contener un intervalo ortogonal (más corto) que conecta ambas rectas. Sólo una parte acotada de las rectas f! y f!1 está contenida en los símplices de la configuración, y podemos añadir dos segmentos que las conecten fuera de la configuración, de tal manera que el rectángulo determinado por los segmentos extremos, es decir, su cierre convexo, contenga todos los demás segmentos que conectan las rectas. De este modo, hemos colocado una "escalera", de manera que cada símplice de la configuración tiene uno de los peldaños en su interior, mientras que sus cuatro extremos quedan fuera de la configuración. Ahora, el paso principal es llevar a cabo una tranformación (afín) de jRd en jRd, Y que lleve el rectángulo que forma la escalera al rectángulo (la mitad de un cuadrado, como se muestra en la figura) dado por

R1

=

{(X1,X2,0, ... ,of:-1:S;X1:S;0;-1:S;X2:S;1}.

Por tanto, la configuración de símplices en contacto ~1 en jRd que obtenemos tiene el eje Xl corno recta transversal, y está colocada de tal manera que cada uno de los símplices contiene un segmento (-l,l)T

en su interior (para algún a con -1 < a < O), mientras que el origen O queda fuera de todos los símplices. Ahora obtenemos una segunda copia ~2 de esta configuración reflejando la primera respecto del hiperplano dado por Xl = X2. Esta segunda configuración tiene al eje X2 como recta transversal, y cada símplice contiene un segmento S2({3) = {(X1,{3,0, ... ,0)T:-1:S;X1:S;1}

---

(-1, -l)T

:

,

en su interior, con -1 < {3 < O. Pero cada segmento SI ( a) interseca a cada segmento S2 ({3), y por tanto el interior de cada símplice de ~1 interseca a cada símplice de ~2 en su interior. En consecuencia, si añadimos una coordenada (d + l)-ésima, Xd+1, Y escogemos ~ como

(O, _l)T

{conv(Pi U {-ed+1}) : Pi

,

E ~1}

U {conv(Pj U {ed+d): Pj

obtenemos una configuración de (d + 1) símplices en contacto en más, la diagonal

A

=

{(x,-x,O, ... ,Of:XEjR} ~

E ~2},

jRd+ 1.

Aún

jRd

interseca todos los segmentos SI ( a) y S2 ({3). Podernos "inclinarlo" un poco, y obtener una recta

A',

LE; =

{(x, -x, 0, ... ,0, éX)T : X

°

E jR} ~ jRd+l,

que para todo é > suficientemente pequeño interseca a todos los símplices de ~. Esto completa el paso de inducción. D

Símplices en contacto

77

En contraste con esta cota infelior es más difícil encontrar cotas superiores ajustadas. Un argumento ingenuo por inducción (que considera por separado todos los hiperplanos que contienen a facetas en una configuración en contacto) conduce únicamente a

f(d)

:::;

~(d + 1)!,

Y esto queda bastante lejos de la cota inferior del teorema 1. Sin embargo, Micha Perles encontró una demostración "mágica" para una cota mucho mejor:

Teorema 2. Para todo d 2: 1, se tiene f(d)

< 2d+ 1 .

Demostración. Dada una configuración de r símplices de dimensión d PI, P 2 , ... ,Pr en contacto en ffi. d, enumeramos primero todos los diferentes hiperplanos H I , H 2 , •.. , H s determinados por facetas de Pi. Para cada uno de ellos escogemos de manera arbitraria un lado positivo H: ' y llamamos H ial otro lado. Por ejemplo, la configuración 2-dimensional de r = 4 triángulos que aparece a la derecha define s = 6 tales hiperplanos (que son rectas para d = 2). A partir de estos datos, construimos la B -matriz, una matriz (r x s) con entradas en { + 1, -1, O}, de la manera siguiente: si Pi tiene una faceta en Hj , Y Pi ~ Ht, si Pi tiene una faceta en H j , Y Pi ~ H j-, si Pi no tiene una faceta en Hj. Por ejemplo, la configuración 2-dimensional del margen da lugar a la matriz

B=

(

1 O -1 1 -1 1 O O -1 -1

-i

O O 1 O

1 O

O O

Son dignas de mención tres de las propiedades de la B-matriz: en primer lugar, puesto que cualquier símplice de dimensión d tiene d + 1 facetas, encontramos que cualquier fila de B tiene exactamente d + 1 entradas distintas de cero, y por tanto tiene exactamente s - (d + 1) entradas nulas. En segundo lugar, estamos tratando con una configuración de símplices que están en contacto dos a dos, y de ahí que para cada par de filas existe una columna en la cual una de las filas tiene un + 1, mientras que en la otra fila tiene un -1. Esto es, las filas son diferentes incluso si dejamos de considerar sus entradas nulas. En tercer lugar, las filas de B "representan" los símplices Pi mediante

n

n

Ahora, obtenemos a partir de B una nueva matriz e en la cual cada fila de B queda reemplazada por todos los vectores fila que pueden generarse a partir de ella cambiando todos los ceros por +1 ó -1. Ya que cada fila de B tiene s - d - 1 ceros, y B tiene r filas, la matriz e tiene 2 s - d - I r filas.

Símplices en contacto

78

Para nuestro ejemplo, esta matriz C es una matriz (32 x 6) que comienza

C=

1 1 1 1 1 1 1 1 -1 -1

1 1 1 1 -1 -1 -1 -1 -1 -1

1 1 1 1 1 1 1 1 1 1

1 1 -1 -1 1 1 -1 -1 1 1

1 1 1 1 1 1 1 1 1 1

1 -1 1 -1 1 -1 1 -1 1 -1

donde las primeras ocho filas de C se derivan de la primera fila de B, las segundas ocho columnas provienen de la segunda fila de B, etc. Ahora, la cuestión es que todas las filas de C son diferentes: Si dos filas se derivan de la misma fila de B, entonces son diferentes ya que sus ceros han sido reemplazados de manera diferente; si derivan de filas diferentes de B, entonces son diferentes, sin importar cómo hayan sido reemplazados los ceros. Pero las filas de C son vectores de longitud s con entradas ±1, y existen únicamente 2 8 vectores diferentes de este tipo. Por tanto, y ya que las filas de C son distintas, la matriz C puede tener a lo sumo 2 8 filas, es decir, 28 -

La primera fila de la matriz e representa el triángulo sombreado, mientras que la segunda fila corresponde a una intersección vacía de los semiespacios. El punto x lleva al vector (1

-1

1

1

-1

que no aparece en la matriz e

1)

d - 1r

~

28 .

Sin embargo, en C no aparecen todos los (±1)-vectores, lo cual conduce a una desigualdad estricta 28-d- 1 r < 28 , Y portanto r < 2 d + 1 . Para ver esto, nótese que cada fila de C representa una intersección de semi espacios - exactamente como para las filas de B en el caso anterior, mediante la fórmula (*). Esta intersección es un subconjunto del símplice Pi, que vino dado mediante la correspondiente fila de B. Tomemos un punto x E lR. d que no esté en ninguno de los hiperplanos H j , y tampoco en ninguno de los símplices Pi. A partir de este x obtenemos un vector con entradas ±1 que indica para cada j si x E Ht o x E H j-. Este (±1 )-vector no aparece en C, porque la intersección correspondiente de semiespacios contiene a x, de acuerdo con (*), y por tanto no está contenido en ningún símplice Pi. O

BAGEMIHL: A conjecture conceming neighboring tetrahedra, Amer. Math. Monthly 63 (1956) 328-329. [2] V. J. D. BASTON: Some Properties of Polyhedra in Euclidean Space, Pergamon Press, Oxford 1965. [3] M. A. PERLES: At most 2d +1 neighborly simplices in E d , Annals of Discrete Math. 20 (1984), 253-254. [4] J. ZAKS: Neighborly families of 2d d-simplices in E d , Geometriae Dedicata 11 [1] F.

(1981),279-296.

[5] J. ZAKS: No Nine Neighborly Tetrahedra Exist, Memoirs Amer. Math. Soco No. 447, Vol. 91, 1991.

1

Alrededor de 1950 Paul Erd6s conjeturó que cualquier conjunto de más de 2d puntos en R d determina al menos un ángulo obtuso, es decir, un ángulo mayor que ~. En otras palabras, si un conjunto de puntos en R d tiene sólo ángulos agudos y rectos, entonces tiene como mucho 2d puntos. Este problema fue propuesto en un concurso por la Dutch Mathematical Society - pero sólo se recibieron soluciones para d = 2 Y d = 3. Para d = 2 el problema es sencillo: los cinco puntos pueden determinar un pentágono convexo, que siempre tiene un ángulo obtuso (de hecho, al menos un ángulo de al menos 108°). En otro caso, existe un punto contenido en el triángulo que definen otros tres, y dicho punto "ve" a las tres aristas del triángulo según tres ángulos que suman 360° , por lo que alguno de ellos es al menos de 120°. (El segundo caso incluye las configuraciones con tres puntos colineales y, por tanto, con un ángulo de 180°.) De manera independiente, Victor Klee preguntó poco después - y Erd6s difundió la pregunta - cuántos puntos puede tener un conjunto de R d manteniendo la siguiente "propiedad antipodal": para cualquier par de puntos en el conjunto existe una banda (acotada por dos hiperplanos paralelos) que contiene al conjunto, y que tiene a los dos puntos en hiperplanos distintos. En 1962, Ludwig Danzer y Branko Grünbaum consiguieron resolver los dos problemas simultáneamente: encerraron los dos tamaños máximos en una cadena de desigualdades, que comienza y termina en 2d . Por tanto, la respuesta es 2d tanto para el problema de Erd6s como para el de Klee. En lo que sigue consideramos conjuntos (finitos) de puntos contenidos en Sr;;;; R d , sus envolventes convexas conv(S) y, en general, politopos convexos Q r;;;; R d. (Véase el apéndice sobre politopos en la página 50 para un resumen de los conceptos básicos). Suponemos que los conjuntos tienen dimensión d, es decir, no están contenidos en un hiperplano. Dos conjuntos convexos se tocan si tienen al menos un punto de la frontera en común, pero sus interiores son disjuntos. Para un conjunto Q r;;;; R d y un vector s E R d denotamos por Q + s la imagen de Q por la traslación que envía O a s. De manera similar, Q - s es el conjunto que se obtiene al aplicar a Q la traslación que lleva s al origen. No se asuste: este capítulo es una excursión a la geometría d-dimensional, sin embargo los argumentos que utilizaremos no necesitan ninguna "intuición d-dimensional" ya que todos ellos pueden ser seguidos, visualizados (y, por tanto, comprendidos) en dimensión tres, e incluso en el plano. Por tanto, los dibujos ilustrarán la demostración para d = 2 (donde un "hiperplano" es sencillamente una recta), y el lector podrá hacer sus propios dibujos para d = 3 (donde un "hiperplano" es un plano).

o- --

80

Cualquier conjunto con muchos puntos tiene un ángulo obtuso

Teorema 1. La siguiente cadena de desigualdades se verifica para cualquier dimensión d:

(2)

::; max

(3)

{

#8

8 <;;; ]Rd tales que {Si,Sj} <;;; S existe

para cualquier par de puntos} una banda S(i,j) que contiene y Sj en hiperplanos distintos de

a 8 y que tiene a Si lafrontera de S( i, j).

8 <;;; ]Rd tales que los trasladados P - Si, Si E 8, de} max{ #8 la envolvente convexa P := conv(8) tienen un punto en común, pero sólo se tocan.

18

<;;; ]Rd tales que los trasladados Q + Si de algÚn} { < max #8 politopo convexo d-dimensional Q <;;; ]Rd se tocan dos

(4)

a dos. (5) =

(6)

max

::;2

{

#8

8 <;;; ]Rd tales que los trasladados Q* + Si de algÚn} politopo convexo d-dimensional y centralmente simétrico Q* <;;; lEtd se tocan dos a dos.

d

• Demostración. Tenemos que comprobar un total de seis igualdades y desigualdades. Comencemos. (1) Sea 8 := {O, l}d el conjunto de vértices del cubo unitario en ]Rd, y consideremos Si, S j , S k E 8. Por simetría, podemos suponer que s j = O es el vector nulo. Por tanto, el ángulo está determinado por (Si, Sk)

cos
+ S j que contiene a si y sólo si P - Sj está contenido en el semiespacio definido por Hij que contiene a Si - S j: la propiedad "un objeto está contenido en un semiespacio" no cambia si el objeto y el semiespacio sufren la misma traslación (en este caso, de vector -Sj). De manera similar, P está contenido en el semiespacio definido por Hij + Si que contiene a S j si y sólo si P Si está contenido en el semiespacio definido por Hij que contiene a S j - Si. (3) P está contenido en el semiespacio definido por Hij Si

Cualquier conjunto con muchos puntos tiene un ángulo obtuso

81

Combinando ambos vemos que un P está contenido en la banda definida por Hij + Si Y Hij + Sj si y sólo si P - Si YP - Sj están en lados diferentes del hiperplano Hij. La figura del margen ilustra esta correspondencia. Además, de Si E P = conv(S) se deduce que el origen está contenido en todos los trasladados P - Si (Si E S). Por tanto, los conjuntos P - Si se intersecan en el origen, pero sólo se tocan: los interiores son disjuntos dos a dos, ya que están en lados distintos del correspondiente hiperplano Hij. Esto es inmediato: "los trasladados se tocan dos a dos" es una afirmación más débil que "se intersecan en un punto, pero sólo se tocan." De manera similar, podemos relajar la condición permitiendo que P sea un politopo convexo arbitrario de JP;.d y reemplazar S por -S. (5) Aquí "2" es trivial, pero no es el resultado que nos interesa. Debemos comenzar con una configuración S ~ JP;.d Y cualquier politopo d-dimensional Q ~ JP;.d tal que los trasladados Q + Si (Si E S) se tocan dos a dos. Veamos que en esta situación podemos utilizar

Q*

:=

g(x - y)

E JP;.d :

x, y

E

Q}

en lugar de Q. No es difícil: en primer lugar, Q* es d-dimensional, convexo y centralmente simétrico. Se puede comprobar que Q* es un politopo (sus vértices son de la forma ~ (qi - qj)' donde qi' qj son vértices de Q), pero esto no es importante para nosotros. A continuación demostraremos que Q + Si Y Q + Sj se tocan si y sólo si Q* + Si Y Q* + Sj se tocan. Para ello, observamos, siguiendo los pasos de Minkowski, que (Q*+Si)

n (Q* + Sj) #-

0

-{==?

:3 qi' I qi' " qj' I qj"

-{==?

"Cl ::J

-{==?

Q.. 2"1 (1 qi

qi")

+ Si I qi" ,qj) I qj" E Q.. 2"1 (1 qi) qi + qj") + Si :3qi) qj E Q : qi + Si = qj + Sj E

-

1 (1 -_ 2" qj -

-_

qj")

+ Sj qj + qi") + Sj 2"1 (1

donde en la tercera (y crucial) equivalencia "-{==?" hemos utilizado que todo q E Q se puede escribir como q = ~ (q + q) para obtener "~", y que Q es ". 1 ( qjI + qi") E Q para obtener " =?j ' 2" convexo y, por t ant o, 2"I ( qiI + q") Por tanto, el paso de Q a Q* (conocido como simetrización de Minkowski) conserva la propiedad de que dos trasladados Q + Si Y Q + S j se intersecan. Es decir, hemos demostrado que para cualquier convexo Q, dos trasladados Q + Si Y Q + Sj se intersecan si y sólo si los trasladados Q* + Si Y Q* + Sj se intersecan. La siguiente caracterización demuestra que la simetrización de Minkowski también conserva la propiedad de que dos trasladados se tocan:

Q + Si Y Q + Sj se tocan si y sólo si se intersecan; además, Q + Si YQ

+ Sj + E(Sj -

Si)

no se intersecan para ningún E> O.

82

Cualquier conjunto con muchos puntos tiene un ángulo obtuso

Supongamos que Q* intersección

+ Sj se tocan.

+ Si Y

Para cualquier punto de la

se tiene que

x -

Si E

Q*

y

x -

Sj E

Q*,

por tanto, como Q* es centralm:ente simétrico,

y, como Q* es convexo,

Hemos demostrado que ~ (Si + Sj) está contenido en Q* + Sj para todo i. Por tanto, para P := conv(S) obtenemos

Pj

:=

~(P +

Sj) =

conv

g(Si

+ Sj)

: Si E

S} ~ Q*

+ Sj,

de donde se deduce que los conjuntos P j = ~ (P + S j) sólo se pueden tocar. Finalmente, los conjuntos Pj están contenidos en P, ya que los puntos Si, Sj y ~ (Si + S j) están en P por ser P convexo. Los conjuntos P j son copias trasladadas y escaladas de P, contenidas en P. El factor de escala es ~, de donde se deduce que 1 vol(Pj) = 2dvo1(P),

Factordeescala~, vol(Pj)

= ivo1(p)

ya que se trata de conjuntos de dimensión d. Esto quiere decir que en P caben, como mucho, 2 d conjuntos P j y, por tanto, ISI :::; 2d . Con esto terminamos la demostración, ya que hemos cerrado la cadena de desigualdades. O ... pero la historia no termina aquí. Danzer y Grünbaum hicieron la siguiente pregunta natural: ¿ Qué ocurre si se pide que todos los ángulos sean en lugar de no obtusos, es decir, si se prohíben también los ángulos rectos?

Danzer y Grünbaum construyeron configuraciones de 2d - 1 puntos en IFt d que sólo tenían ángulos agudos, y conjeturaron que éste era el mayor tamaño posible. Grünbaum demostró que esto es cierto para d :::; 3. Pero veintiún años después, en 1983, Paul Erdos y Zoltan Füredi demostraron que la conjetura es falsa - ¡por mucho, si la dimensión es alta! Su demostración es todo un ejemplo magnífico de la potencia de los argumentos probabilísticos; véase el capítulo 35 para una introducción al "método probabilístico." Nuestra versión de la demostración utiliza pequeñas mejoras en la elección de los parámetros debidas a nuestro lector David Bevan. Teorema 2. Para todo d ::::: 2 existe un conjunto S ~ {O, l}d de 2l d

v;: (~) dJ

puntos en IFt (vertices del cubo unitario d-dimensional) que determinan sólo ángulos agudos. En particular, en dimensión d = 34 existe un conjunto de 72 > 2·34 - 1 puntos que sólo tiene ángulos agudos.

Cualquier conjunto con muchos puntos tiene un ángulo obtuso

• Demostración. Sea m :=

l V; (~ )d J y obtengamos 3m vectores

x(l), x(2), . .. , x(3m)

E

{O, l}d

seleccionando sus coordenadas del conjunto {O, 1}, de manera aleatoria e independiente y con probabilidad ~ para cada alternativa. (Se puede tirar una moneda 3md veces para ello; sin embargo, si d es grande esto puede resultar un poco aburrido.). Hemos visto anteriormente que todos los ángulos determinados por vectores 0/1 no son obtusos. Por otra parte, tres vectores x(i), x(j), x(k) forman un ángulo recto con vértice en x(j) si y sólo si el producto escalar (x(i) - x(j), x(k) - x(j)) se anula, es decir, si se tiene que

x(i)g - x(j)g

=

O o

x(k)g - x(j)g

=

O para cada coordenada f!.

Llamamos a (i,j, k) una terna mala si esto ocurre. (Si x(i) = x(j) ó x(j) = x(k), el ángulo no está definido pero la tema (i,j, k) es claramente mala.) La probabilidad de que una tema fija sea mala es exactamente (~) d: la tema será buena si y sólo si para una de las d coordenadas f! se tiene bien o bien

x(i)g = x(k)g = O, x(i)g = x(k)g = 1,

x(j)g x(j)g

=

1,

=

O.

Esto nos deja un total de seis posibilidades malas de un total de ocho igualmente probables, y una tema será mala si y sólo si ocurre una de las opciones malas (con probabilidad ~) para cada una de las d coordenadas. El número de temas que tenemos que considerar es 3 e;;n), ya que hay e;;n) conjuntos de tres vectores y en cada uno de ellos tenemos tres posibles vértices. Por supuesto, las probabilidades de que distintas temas sean malas no son independientes, pero la linealidad de la esperanza (que es lo que se obtiene al hacer el promedio entre todas las posibles selecciones, véase el apéndice) dice que la esperanza del número de temas malas es exactamente 3 (3;;n) (~) d. Esto quiere decir - y es en este punto cuando el método probabilístico muestra su potencia - que hay alguna elección de los 3m vectores para la que hay como mucho 3 (3;;n) (~)d temas malas, donde

de acuerdo con nuestra elección de m. Pero si no hay más de m temas malas, podemos eliminar m de los 3m vectores x (i) de forma que los restantes 2m vectores no contengan ninguna tema mala, es decir, determinen sólo ángulos agudos. O La "construcción probabilística" de un conjunto grande de puntos con coordenadas 0/1 Y sin ángulos rectos se puede implementar fácilmente, utilizando un generador de números aleatorios para "tirar la moneda." David Bevan ha construido de esta forma un conjunto de 31 puntos en dimensión d = 15 que sólo determina ángulos agudos.

83

Cualquier conjunto con muchos puntos tiene un ángulo obtuso

84

Presentamos aquí tres herramientas básicas de la teoría de la probabilidad discreta que aparecerán en varias ocasiones: las variables aleatorias, la linealidad de la esperanza y la desigualdad de Markov. Sea (D, p) un espacio de probabilidad finito, es decir, D es un conjunto finito y p = Prob es una aplicación de D en el intervalo [0,1] tal que ¿wESl p(w) = 1. Una variable aleatoria X en D es una aplicación X : D -----+ R Un espacio de probabilidad sobre el conjunto X(D) se construye definiendo p(X = x) := ¿X(w)=xp(w). Un ejemplo sencillo es un dado equilibrado (es decir, p(w) = con X = "el número obtenido cuando se tira el dado." La esperanza EX de X es el promedio, es decir,

i)

EX = L p(w)X(w). wESl Si X e Y son dos variables aleatorias en D, la suma X variable aleatoria, y se tiene que

E(X + Y)

LP(w)(X(w)

+Y

es también una

+ Y(w))

w

LP(w)X(w)

+

w

p(w)Y(w) = EX + EY. w

Esta propiedad se puede extender fácilmente a cualquier combinación lineal finita de variables aleatorias - propiedad conocida como linealidad de la esperanza. Obsérvese que no es preciso que las variables aleatorias sean "independientes" en ningún sentido. La tercera herramienta es válida para variables aleatorias X que toman sólo valores no negativos, lo que escribimos como X ;::: O. Sea

L

Prob(X;::: a) =

p(w)

w:X(w)2:a la probabilidad de que X sea mayor o igual que cierto a > O. Entonces

EX

L p(w)X(w) w:X(w)2: a

+

L p(w)X(w) > a L p(w), w:X(w)2:a w:X(w)
y hemos demostrado la desigualdad de Markov Prob(X ;::: a) :::::

EX a

[1] L. DANZER & B. GRÜNBAUM: Über zwei Probleme bezüglich konvexer Korper von P. Erdos und von V. L. Klee, Math. Zeitschrift 79 (1962), 95-99. Z. FÜREDI: The greatest angle among n points in the d-dimensional Euclidean space, Annals of Discrete Math. 17 (1983), 275-283.

[2) P. ERDÓS &

[3) H. MINKOWSKI: Dichteste gitterformige Lagerung kongruenter Korper, Nachrichten Ges. Wiss. Géittingen, Math.-Phys. Klasse 1904, 311-355.

El artículo que Karol Borsuk publicó en 1933, con el título "Three theorems on the n-dimensional euclidean sphere", tiene bastante fama porque contiene un importante resultado (conjeturado por Stanislaw Ulam) que ahora se conoce como el teorema de Borsuk-Ulam:

Cualquier aplicación continua f : Sd --+ ]R.d lleva dos puntos antipodales de la esfera Sd al mismo punto en rn;d. El mismo artículo también es famoso por un problema propuesto al final, que se conoce como la conjetura de Borsuk:

Para S ~ ]R.d de diámetro acotado diam(S) rel="nofollow"> O, ¿puede encontrarse una partición en, a lo sumo, d + 1 partes de menor diámetro? Karol Borsuk

La cota d + 1 es la menor posible: si S es un símplice regular de dimensión d, o sencillamente el conjunto de sus d + 1 vértices, entonces ningún conjunto de una partición que reduzca el diámetro puede contener más de un vértice. Siendo f(d) el menor número tal que cualquier conjunto acotado S c:: ]R.d admite una particion en f (d) partes de menor diámetro, el símplice regular demuestra que f (d) 2 d + 1. La conjetura de Borsuk fue probada para el caso en que S es una esfera (por el mismo Borsuk), para cuerpos lisos (usando el teorema de Borsuk-Ulam), para d :S 3, ... pero el caso general permanecía abierto. La mejor cota superior para f (d) fue dada por Oded Schramm, quien demostró que

f(d) :S (1.23)d para d suficientemente grande. Esta cota parece débil en comparación con la conjetura "f(d) = d + 1", pero en 1993 de pronto se convirtió en razonable cuando Jeff Kahn y Gil Kalai refutaron la conjetura de Borsuk de manera muy sorprendente. Sesenta años tras la publicación del artículo de Borsuk, Kahn y Kalai probaron que f(d) 2 (1.2)Vd para d suficientemente grande. Una versión de El Libro de la demostración de Kahn y Kalai fue dada por A. Nilli. De manera breve, y sin hacer referencia a otros teoremas, proporciona un contraejemplo explícito de la conjetura de Borsuk en dimensión d = 946. Presentamos una modificación de esta demostración, dada conjuntamente por Andrei M. Raigorodskii y Bernulf WeiBbach, que reduce la dimensión hasta d = 561 (y se puede llegar incluso a d = 560). El "récord" actual es d = 298, conseguido por Aicke Hinrichs y Christian Richter en el 2002.

Cualquier símplice de dimensión d puede descomponerse en d + 1 partes, todas ellas de menor diámetro.

86

La conjetura de Borsuk

Teorema. Sea q = pm la - 2, Y d := G) = de un n := 3). Entonces existe un conjunto S <:;;; {+1, -l}d de 2 n - 2 (2q - 1)(4q puntos en lR d tal que cualquier partición de S en partes de menor diámetro que S tiene, al menos,

partes. Para q = 9 se sigue que la conjetura de Borsuk es falsa en dimensión d = 561. Aún más, f(d) > (1.2)01 para d suficientemente grande.

11 Demostración. El conjunto S se construye en cuatro pasos. Sean q la potencia de un primo, n

A. Nilli

Q

:=

{x E {+l,-l}n:

4q - 2 y

=

1, #{i: Xi

xl =

=

-l}espar},

un conjunto de 2n - 2 vectores enlR n . Veremos que (x, y) == 2 (mod4) se verifica para todos los vectores x, y E Q. Diremos que x, y son casi-ortogonales si I(x, 1= 2, Y probaremos que cualquier Q' <:;;; Q que no contiene vectores (n~l). casi-ortogonales es "pequeño": IQ'I S

¿;::;g

(2) A partir de Q, construimos el conjunto R

:=

{xxT:XEQ}

de 2n-2 matrices simétricas n x n de rango 1. Las interpretamos como n2 vectores de n 2 componentes, R <:;;; lR . Probaremos que entre estos vectores sólo hay ángulos agudos: tienen productos escalares positivos (cuyo valor al menos es 4). Además, si R' <:;;; R no contiene dos vectores cuyo producto escalar es 4, entonces IR'I es "pequeño": IR'I S (n~l).

¿;::;g

y En nuestra notación, los vectores x, y, ... son vectores columna y los vectores transpuestos x T , yT, ... son vectores fila. El producto de matrices xx T es una matriz de rango 1, con (XXT)ij = XiXj. Si x, y son vectores columna, entonces su producto escalar es

X

T

xx

( 1 -1 -1

T

1 -1)

1 1 -1 -1 -1 1 1-1 -1 1 1-1

= (

-i)

1 -1 -1 1 -1 -1 1 1-1 1

(x,y)

=

LXiYi =

También necesitaremos productos escalares para matrices X, Y E lR nxn que se pueden interpretar como vectores de longitud n 2 . Por tanto, su producto escalar es

(X, Y) .- L i,j

XijYij'

La conjetura de Borsuk

87

A partir de R, obtenemos el conjunto de puntos en lR. G) cuyas coordenadas son las "entradas subdiagonales" de las matrices correspondientes:

De nuevo, el conjunto S tiene 2n - 2 puntos. La distancia máxima entre estos puntos se obtiene precisamente para los vectores casi-ortogonales x, y E Q. Concluimos que un subconjunto S' c::; S de menor diámetro que S ha de ser "pequeño": IS'I :S ¿i~g (n~l). Del apartado (3) deducimos que cualquier partición de S que reduzca el diámetro necesita al menos

g(q) .partes. En consecuencia,

f(d) 2 max{g(q) , d + 1}

para d = (2q - 1)(4q - 3).

Por tanto, si 9 (q) > (2q - 1) (4q - 3) + 1, entonces existe un contraejemplo para la conjetura de Borsuk en dimensión d = (2q - 1) (4q - 3). En particular, g(9) > 56210 proporciona para d = 561. Además, veremos que e

g(q) >

64q2

lo cual lleva a la cota asintótica f( d)

(27)q 16 '

> (1.2) Vd para d suficientemente grande.

Detalles de (1): Empezamos con unas consideraciones sobre divisibilidad. Lema. Lafunción P(z) := (~:::;) es un polinomio de grado q - 2 cuyo valor numérico es entero para todo entero z. El entero P(z) es divisible entre p si y sólo si z no es congruente con Oo con 1 módulo q. • Demostración. Escribimos el coeficiente binomial P(z) de la forma

P(z) =

2)

z( q-2

=

(z - 2)(z - 3) ..... (z - q + 1) (q-2)(q-3)· ...... ·2·1

y comparamos el número de veces que aparece el factor p en el denominador y en el numerador. En el denominador aparece el mismo número de veces que en (q - 2)!, o en (q -1)!, ya que q -1 no es divisible entre p. Es más, según la afirmación del margen, en cualquier producto de q -1 enteros, escogidos cada uno de una clase diferente de residuos módulo q distinta de cero, el factor p aparece el mismo número de veces. Si z es congruente con O ó 1 (modq), entonces también lo es el numerador: Todos los factores en el producto pertenecen a clases de residuos diferentes, y las únicas clases que no aparecen son la clase del O (los múltiplos de q) y la clase, o bien del -1, o del +1, pero ni +1 ni -1 son divisibles entre p. Por tanto, el factor p aparece el mismo número de veces en el denominador y en el numerador, y de aquí que el cociente no sea divisible entre p.

Afirmación. Si a == b -=¡É O (modq), entonces el factor p aparece en a y b el mismo número de veces. 111 Demostración. Por congruencia, se verifica que a = b + spm, donde b no es divisible entre pm = q. Por lo tanto, podemos afirmar que cualquier potencia pk que divide a b verifica que k < m, y en consecuencia también divide a a. Lo mismo es cierto si intercambiamos los D papeles de a y b.

88

La conjetura de Borsuk

Por otra parte, si z t=- O, 1 (mod q), entonces en el numerador de (*) aparece un factor que es divisible entre q = pm. Al mismo tiempo, en este producto faltan factores de dos clases de residuos adyacentes no nulas: uno representa a números que no contienen ningún factor p, y el otro tiene menos factores p que q = pm. Por tanto, hay más factores p en el numerador que en el denominador, D y el cociente resulta ser divisible entre p. . Ahora consideremos cualquier subconjunto Q' ~ Q que no contenga vectores casi-ortogonales. Queremos llegar a que Q' ha de ser "pequeño".

i

Tlrlrnacw'n 1. Si x, y son vectores distintos de Q, entonces ((x, y) es un entero que satisface

+ 2)

-(q-2) :::; ~((x,y)+2) :::; q-1. Tanto x como y tienen un número par de componentes -1, de modo que el número de componentes en las cuales difieren también es par. Por tanto,

(x, y) =

(4q - 2) - 2#{i : Xi

-=1-

Yi}

== -2 (mod4)

para todo x, y E Q, es decir, ~((x, y) + 2) es un entero. Puesto que x, y E {+1, _1}4 q -2, sabemos que -(4q-2) :::; (x, y) :::; 4q-2, esto es, -(q-1):::; i((x,y) +2):::; q. Nunca se dala igualdad de la cota inferior, ya que Xl = Yl = 1 implica que x -=1- -y. La igualdad en la cota superior sólo se da si x = y. Afirmación 2. Para cualquier y E Q', el polinomio de grado q - 2 en n variables Xl, ... , X n dado por

Fy(x) :=

p(~((x,y)+2))

=

(~((X,Y)+2)-2) q-2

cumple que Fy(x) es divisible entre p para cada x E Q'\{y}, pero no para x = y. Los valores del polinomio F y (x) son siempre enteros, ya que viene expresado por un coeficiente binomial. Para x = y, obtenemos Fy(Y) = 1. Para x -=1- y, dellema se deduce que F y (x) no es divisible entre p si y sólo si ~ ( (x, y) + 2) es congruente con O ó 1 (modq). Por la afirmación 1, esto ocurre sólo si ~ ((x, y) + 2) es O ó 1, esto es, si (x, y) E {-2, +2}. Para ello, x e y han de ser casi-ortogonales, lo cual contradice la definición de Q'. Afirmación 3. Lo mismo es cierto para los polinomios F y (x) en las n - 1 variables X2, ... ,X n obtenidos como sigue: Se expande F y (x) en monomios, se elimina Xl. y se reducen todas las potencias superiores de las demás variables substituyendo Xl = 1 Y x; = 1 para i > 1. El grado de F y (x) es, como máximo, q - 2.

x

x;

Los vectores E Q ~ {+ 1, _l}n satisfacen Xl = 1 Y = 1. Por tanto, las substituciones no cambian los valores de F y (x) en el conjunto Q. Tampoco aumentan el grado, con lo cual el grado de F y (x) es a lo sumo q - 2. Afirmación 4. No existe ninguna relación lineal (con coeficientes racionales) entre los polinomios F y(x) para y E Q', es decir, son linealmente independientes sobre 1Ql. En particular, son distintos.

89

La conjetura de Borsuk

Supongamos que exista una relación de la forma ¿YEQ' ayF y (x) = O tal que no todos los coeficientes ay son cero. Tras multiplicar por un escalar apropiado, podemos suponer que los coeficientes son enteros, pero no todos ellos divisibles entre p. En este caso, para todo y E Q' la evaluación en x := y conduce a que ayF y(y) es divisible entre p, y de aquí que haya de serlo ay, ya que F y(y) no lo es. j"fl'w,'lu~i¡iln 5. IQ'I está acotado por el número de monomios libres de cuadrados en n - 1 variables y de grado a lo sumo q - 2, es decir, por (n~l).

¿¡::g

Por construcción, los polinomios F y son libres de cuadrados: ninguno de sus monomios contiene una variable de grado mayor que 1. Por tanto, cada F y (x) es una combinación lineal de monomios libres de cuadrados de grado a lo sumo q - 2 en las n - 1 variables X2, . .. , X n . Puesto que los polinomios F y (x) son linealmente independientes, su número (que es IQ'I) no puede ser mayor que el número de monomios en cuestión. Detalles de (2): La primera columna de xx T es x. Por tanto, para distintos x E Q obtenemos matrices distintas M(x) := xx T . Interpretamos estas matrices como vectores de longitud n 2 de componentes XiXj. El cálculo n

(M(x),M(y))

n

:L 'L,(XiXj) (YiYj) i=l j=l

(x, y)2 > 4 muestra que el producto escalar de M (x) Y M (y) se minimiza si y sólo si x, y E Q son casi-ortogonales. Detalles de (3): Sea U (x) E {+ 1, -1 } d el vector cuyas componentes son las entradas que aparecen por debajo de la diagonal en M (x). Puesto que la matriz M (x) = xx T es simétrica y los valores de la diagonal son +1, vemos que M(x) =1= M(y) implica U(x) =1= U(y). Aún más, 4 ~ (M(x), M(y))

= 2(U(x), U(y)) + n, M(x)

esto es,

(U(x), U(y))

~

n

-"2 + 2,

y la igualdad se da si y sólo si x e y son casi-ortogonales. Puesto que todos

Iff),

los vectores U(x) E S tienen la misma longitud V(U(x), U(x)) = la distancia máxima entre puntos U (x), U (y) E S se alcanza exactamente cuando x e y son casi-ortogonales. Detalles de (4): Para q = 9 tenemos g(9) :=::ó 758.31, que es mayor que 4 d + 1 = e2 ) + 1 = 562. Con el fin de obtener una cota general para d grande, usamos la monotonía y unimodalidad de los coeficientes binomiales, y las estimaciones n! > e( -;)n

~ ~1

90

La conjetura de Borsuk

y n! < en(:;;-)n (véase apéndice del capítulo 2) para deducir que e 4q (~) 4q

(4q) ! =

q q!(3q)! < q e

(;)q e

en 3q

=

4q2 (256) q. e 27

De aquí concluimos que

f(d) 2 g(q)

A partir de esto y usando

d

= (2q q=

1)(4q-3)

= 5q2+(q-3)(3q-1) 25 q2

~ + V~ + l4

>

[j,

y

paraq23,

(i~)V1 > 1.2032,

obtenemos

f(d) > 1;d(1.2032)v'd > (1.2)v'd

parad suficientemente grande.

O

Un contraejemplo en dimensión 560 se obtiene observando que para q = 9 el cociente g(q) R:ó 758 es mucho más grande que la dimensión d(q) = 561. Por tanto, se obtiene un contraejemplo para d = 560 tomando únicamente los "tres cuartos" de los puntos en S que satisfacen X21 + X31 + X32 = -1. Se sabe que la conjetura de Borsuk es cierta para d ::; 3, pero no ha sido verificada en ninguna dimensión mayor. En contraste, la conjetura sí es cierta hasta dimensión d = 8 si nos restringimos a subconjuntos S ~ {1, _l}d como los construidos aquí (véase [8]). En cualquier caso, es muy posible que puedan encontrarse contraejemplos en dimensiones razonablemente pequeñas.

Referencias [1] K. BORSUK: Drei Satze über die n-dimensionale euklidische Sphiire, Fundamenta Math. 20 (1933),177-190. [2] A. HINRICHS & C. RICHTER: New sets with large Borsuk numbers, Preprint, February 2002,10 pages; Discrete Math., to appear. [3] J. KAHN & G. KALAI: A counterexample to Borsuk's conjecture, Bulletin Amer. Math. Soc. 29 (1993), 60-62. [4] A. NILLI: On Borsuk's problem, in: "Jerusalem Combinatorics '93" (H. Barcelo and G. Kalai, eds.), Contemporary Mathematics 178, Amer. Math. Soc. 1994, 209-210. [5] A. M. RAIGORODSKII: On the dimension in Borsuk's problem, Russian Math. Surveys (6) 52 (1997), 1324-1325.

[6] O. SCHRAMM: Illuminating sets of constant width, Mathematika 35 (1988),180199. [7] B. WEISSBACH: Sets with large Borsuk number, Beitrage zur Algebra und Geometrie/Contributions to Algebra and Geometry 41 (2000), 417-423.

[8] G. M. ZIEGLER: Coloring Hamming graphs, optimal binary codes, and the 0/1Borsuk problem in low dimensions, Lecture Notes in Computer Science 2122, Springer-Verlag 2001,164-175.

Ii

I'"

16 Conjuntos, funciones y la hipótesis del continuo 93 17 Aquellas maravillosas desigualdades 1 09

18 Un teorema de Pólya sobre polinomios 117 19 Sobre un lema de Littlewood y Offord 123 20 La cotangente y el truco de Herglotz 127

21 La aguja de Buffon 133

"El hotel de Hilbert junto al mar"

1

La teoría de conjuntos, fundada por Georg Cantor en la segunda mitad del siglo ha transformado profundamente las matemáticas, de fonna que en la actualidad no tendrían sentido sin el concepto de conjunto o, en palabras de David Hilbert: "Nadie nos hará salir del paraíso (de la teoría de conjuntos) que Cantor ha creado para nosotros." Uno de los conceptos básicos definidos por Cantor fue el tamaño o cardinal de un conjunto M, denotado por INII. Para conjuntos finitos la definición no presenta dificultades: se cuentan los elementos y se dice que M tiene cardinal n si contiene n elementos. Por tanto, dos conjuntos finitos M y N tienen igual cardinal si tienen el mismo número de elementos. Para definir el concepto de igual tamaño para conjuntos infinitos, hacemos el siguiente experimento mental para conjuntos finitos. Supongamos que un grupo de personas quieren subir a un autobús. ¿Cuándo diremos que el número de personas es el mismo que el número de asientos libres? Sencillo: dejamos que las personas se sienten; si todas encuentran un asiento, y ningún asiento queda vacío, entonces (y sólo entonces) diremos que los conjuntos (de personas y de asientos) tienen igual tamaño. En otras palabras, el tamaño es el mismo si existe una biyección entre los dos conjuntos. Esta es por tanto nuestra definición: se dice que dos conjuntos cualesquiera M y N (finitos o infinitos) tienen el mismo tamaño o cardinal si y sólo si existe una biyección entre M y N. Es evidente que la noción de igual tamaño es una relación de equivalencia y, por tanto, podemos asociar un número, llamado cardinal, a cada clase de conjuntos del mismo tamaño. Por ejemplo, para conjuntos finitos obtenemos los cardinales O, 1, 2, ... ,n, ... donde n denota la clase de los conjuntos de n elementos y, en particular, O denota al conjunto vacío 0. Obsérvese que, evidentemente, un subconjunto propio de un conjunto finito M tiene siempre tamaño menor que M. La teoría se vuelve mucho más interesante (y bastante contraria a la intuición) cuando damos el salto a conjuntos infinitos. Consideremos el conjunto N = {l, 2, 3, ... } de los números naturales. Diremos que un conjunto M es numerable si se puede establecer una biyección entre M y N. En otras palabras, M es numerable si se pueden escribir sus elementos en una lista mI, m2, m3, . .. Nos encontramos ahora con un fenómeno extraño. Supongamos que añadimos.a N un nuevo elemento x. Entonces, N U {x} sigue siendo numerable y, por tanto, ¡del mismo tamaño que N! El "hotel de Hilbert" es una ilustración muy atractiva de este hecho. Supongamos que un hotel tiene una cantidad numerable de habitaciones, llamadas 1,2,3, ... , de forma que el cliente Ci ocupa la habitación i; por tanto, el hotel está completo. Llega un nuevo cliente x en busca de habitación y el director

Georg Cantor

94

Conjuntos, funciones y la hipótesis del continuo

x

del hotel le dice: Lo siento, todas las habitaciones están ocupadas. No hay problema, le contesta el recién llegado, cambie al cliente Cl a la habitación 2, a C2 a la 3, a C3 a la 4, y así sucesivamente, y yo me quedaré con la 1. Ante la sorpresa del director (que no es matemático) la idea funciona; sigue pudiendo alojar a todos los clientes, ¡más el recién llegado x! Ahora está claro que también podemos alojar a un nuevo cliente y, y a otro z, y así sucesivamente. Por tanto, al contrario que en el caso de conjuntos finitos, puede ocurrir que un subconjunto propio de un conjunto infinito M tenga el mismo tamaño que M. De hecho, como veremos, esta propiedad caracteriza el tamaño infinito: un conjunto es infinito si y sólo si tiene el mismo tamaño que alguno de sus subconjuntos propios. Abandonemos el hotel de Hilbert y volvamos a nuestros familiares conjuntos de números. El conjunto Z de los enteros también es numerable, ya que podemos ponerlo de la forma Z = {O, 1, -1,2, -2, 3, -3, ... }. Puede resultar más sorprendente que el conjunto de los números racionales también se puede enumerar de una forma similar. Teorema 1. El conjunto Ql de los números racionales es numerable. • Demostración. Enumerando el conjunto Ql+ de los racionales positivos como sugiere la figura del margen, omitiendo los ya encontrados, vemos que Ql+ es numerable y, por tanto, también lo es Ql si ponemos el O al principio y - ~ inmediatamente después de ~. Con esta estrategia, obtenemos Ql = {O, 1, -1, 2, -2,~, -~'!'

-!, 3, -3,4, -4,~, -~, ... }.

O

Otra forma de interpretar la figura es la siguiente afirmación: La unión de una cantidad numerable de conjuntos numerables M n es también numerable.

Si M n

hacemos

= {anl, a n 2, a n 3, ... } 00

U Mn

=

{an, a21, a12, a13, a22, a31, a41, a32, a23, a14,··· }

n=l

exactamente igual que antes. Detengámonos un poco más en el proceso de enumeración de Cantor de los racionales positivos. Directamente de la figura obtenemos la sucesión 121

1

2

3

432

1

1

2

345

l' l' 2' 3' 2' l' l' 2' 3' 4' 5' 4' 3' 2' l' .,.

t

y después tenemos que eliminar los números repetidos, como ~ = ó %= ~. Hay una enumeración que es todavía más elegante y sistemática, y que no contiene repeticiones - encontrada recientemente por Neil Calkin y Herbert Wilf. La lista comienza de la siguiente forma: 1

121

3

2

3

143

5

2

534

l' 2' l' 3' 2' 3' l' 4' 3' 5' 2' 5' 3' 4' l'

El denominador del n-ésimo número racional es igual al numerador del (n+ l)-ésimo. En otras palabras, la fracción n-ésima es b(n)jb(n + 1), donde (b( n) ) n2':0 es una sucesión que comienza con

(1, 1, 2, 1, 3, 2, 3, 1,4,3, 5, 2, 5, 3, 4, 1,5, ... ).

Conjuntos, funciones y la hipótesis del continuo

95

Esta sucesión fue estudiada por vez por el matemático alemán Moritz Abraham Stem, en un artículo de 1858, y es conocida como la "serie diatómica de Stem." ¿Cómo se obtiene esta sucesión y, por tanto, la enumeración de Calkin-Wilf de los racionales positivos? Consideremos el árbol binario infinito del margen. Es fácil encontrar su definición recursiva:

1

/I~ 1

} es el primer nodo del árbol I!I

todo nodo :Y tiene dos hijos: el de la izquierda es

1

i!j y el de la derecha es 1

1\

aparece en el árbol, entonces r y s son primos entre sí.

3

2

"2

1\

3

4

3

3

5"

5

2

"2

5"

5

3

5"

t

~

> O aparece en el árbol.

Procedemos por inducción sobre la suma r + s. El menor valor es r + s = 2, es decir, ~ = que aparece en el primer nodo. Si r > s, entonces aparece en el árbol por la hipótesis de inducción y, por tanto, ~ es su hijo derecho. De manera similar, si r < s, entonces aparece en el árbol y ~ es su hijo izquierdo.

t,

r-:;s

s:r

(3) Todas las fracciones irreducibles aparecen exactamente una vez.

El argumento es similar. Si ~ aparece más de una vez, entonces r que todos los nodos del árbol, excepto el primero, son de la forma

-=1=

i!j

s, ya

< 1ó

i+j > 1. Finalmente, si r > s ó r < s, seguimos el mismo argumento por J inducción que anteriormente. Todos los números racionales positivos aparecen exactamente una vez en el árbol y, por tanto, podemos enumerarlos escribiendo los números por niveles, de izquierda a derecha. Esto nos proporciona el comienzo de la sucesión de Calkin-Wilf mostrado anteriormente.

(4) El denominador de la n-ésima fracción de la lista es igual al numerador

de la (n

+ 1)-ésima.

Esto es claramente cierto para n = O y cuando la fracción n-ésima es un hijo izquierdo. Supongamos que la fracción n-ésima ~ es un hijo derecho. Si ~ está en la frontera de la derecha, entonces s = 1 y el siguiente término de la sucesión está en la frontera izquierda y tiene numerador 1. Finalmente, si ~ está en el interior y ~ es el siguiente término de la sucesión, entonces ~ es el hijo derecho de r-:;s, ~ es el hijo izquierdo de s/~rl y, por inducción, el denQminador de

r-:;s

es el numerador de s/~rl y, por tanto, s = r'.

Bonito, pero todavía hay más. Nos podemos plantear dos preguntas naturales: - ¿Tiene algún "significado" la sucesión (b( n) ) n:;::O ?

3

4:

4

1

r1r1r1r1r1r1r1r1

1

Esto es cierto para el nodo y para el resto lo demostramos por inducción hacia abajo. Si r y s son primos entre sí, tanto r y r + s como s y r + s lo son. (2) Toda fracción irreducible

3

1

r1 r1 r1 r1

4:

Las siguientes propiedades se pueden demostrar fácilmente: ~

1

3

i+j J

(1) Todas las fracciones que aparecen en el árbol son irreducibles, es decir, si

2

"2

rl s'-r'

r-s s

\

T.. s

1

rl



96

Conjuntos, funciones y la hipótesis del continuo

- Dado

~,¿es

sencillo encontrar el término siguiente en la enumeración?

Para responder a la primera pregunta, observemos que el nodo b( n) jb( n + 1) tiene como hijos a b(2n + 1)jb(2n + 2) Y b(2n + 2)jb(2n + 3). Reuniendo los tres obtenemos las recursiones

b(2n + 1)

Por ejemplo, h(6) = 3, Y las representaciones hiperbinarias son

6=4+2 6=4+1+1 6=2+2+1+1.

=

b(n)

y

b(2n + 2)

=

b(n)

+ b(n + 1).

(1)

Haciendo b(O) = 1, la sucesión (b(n))n>O está determinada por (l). ¿Existe alguna sucesión "conocida" y "elegante" que satisfaga la misma recUfsión? Sí, la hay. Sabemos que cualquier número n se puede escribir de forma única como suma de potencias de 2 distintas - obteniendo la representación binaria usual de n. Una representación hiperbinaria de n es una representación de n como suma de potencias de 2 donde cada potencia 2 k aparece a lo sumo dos veces. Sea h(n) el número de tales representaciones de n. El lector queda invitado a comprobar que la sucesión h( n) satisface la recursión (1) y, por tanto, b( n) = h( n) para todo n. Por cierto, hemos demostrado un hecho sorprendente: si ~ es una fracción irreducible, existe exactamente un entero n tal que 'r = h(n) y s = h(n + 1). Veamos ahora la segunda pregunta. En nuestro árbol se tiene x

es decir, con x

:= ~, x l+x

x+1

Utilizamos esto para generar un árbol binario infinito (sin raíz) de la siguiente forma:

o

1

o

1

o

~I

1

"5

Conjuntos, funciones y la hipótesis del continuo

97

En este árbol todas las filas son y en ellas aparece la enumeración de Calkin-Wilf de los racionales positivos (con un ~ adicional al principio). Ahora bien, ¿cómo se construye el siguiente racional a uno dado? Para responder a esta pregunta, recordemos que dado un racional x, su hijo derecho es x + 1, su "nieto" derecho es x + 2, y su k-descendiente derecho es x + k. De manera similar, el hijo izquierdo de x es l~x' cuyo hijo izquierdo es 1;2x y así sucesivamente: el k-descendiente izquierdo x es l;kx' Para determinar cómo obtener el número racional f (x) que va "a continuación" de ~ = x en la enumeración, tenemos que analizar la situación mostrada en el margen. De hecho, cualquier racional no negativo x en nuestro árbol binario infinito es el k-descendiente derecho del hijo izquierdo de un racional y ~ O (para algún k ~ O), en tanto que f (x) es el k-descendiente izquierdo del hijo derecho del mismo y. Por tanto, de las fórmulas para los k-descendientes izquierdo y derecho se deduce que y

x =

1+Y

+ k,

como se afirma en la figura del margen. Aquí, k = Lx J es la parte entera de x, = {x} es la parte decimal. De esto se deduce que mientras que

l¡y

y+1

f(x)

= 1 + k(y

1

+ 1)

1

Y!l + k

k

+ 1- Y¡l

l+k(y+1)

1

LxJ+1-{x}'

Por tanto, hemos determinado una bonita expresión para el sucesor f (x) de x, encontrada muy recientemente por Moshe Newman: La función

1

x

1----+

f(x)

=

LxJ+1-{x}

genera la sucesión de Calkin-Wilf lJ---+lJ---+~J---+lJ---+.:?J---+.:?J---+.:?J---+lJ---+i!J---+ 1 2 1 3 2 3 1 4 3

que contiene todos los racionales positivos exactamente una vez.

La forma de Calkin-Wilf-Newman de enumerar los racionales positivos tiene otras propiedades notables. Por ejemplo, nos podemos preguntar por una manera rápida de determinar la n-ésima fracción de la sucesión, por ejemplo para n = 106 . Aquí está: Para encontrar la fracción n-ésima de la sucesión de Calkin-Wilf, escriba n en binario, n = (bkbk-l".blbo)2 y, a continuación, siga el camino en el árbol de CaIkin-Wilf determinado por sus dígitos, comenzando por t = ~, de la siguiente forma: bi = 1 significa "escoja el hijo derecho," es decir, "sume el denominador al numerador," mientras que bi = O significa "escoja el hijo izquierdo," es decir, "sume el numerador al denominador." La figura del margen muestra el camino resultante para n = 25 = (llOOlh: por tanto, el término 25" de la sucesión de Calkin-Wilf es ~. El lector puede

1

"2

1\

98

Conjuntos, funciones y la hipótesis del continuo

encontrar fácilmente un método similar para calcular, dada una fracción % (y su representación binaria), el lugar que ocupa en la sucesión de Calkin-Wilf. Pasemos al conjunto de números reales R ¿Es también numerable? No, no lo es, y el método de la demostración - el proceso de diagonalización de Cantor - no es sólo de importancia fundamental en toda la teona de conjuntos, sino que entra en El Libro como un golpe de ingenio inusual. Teorema 2. El conjunto lR. de los números reales no es numerable. 11 Demostración. Cualquier subconjunto N de un conjunto numerable M = {mI, m2, m3, ... } es como mucho numerable (es decir, finito o numerable). Sencillamente, se enumeran los elementos de N tal y como aparecen en M. Por tanto, si podemos encontrar un subconjunto de lR. que no sea numerable, entonces IR no puede ser numerable. El subconjunto M de lR. que vamos a estudiar es el intervalo (0,1] de los números reales positivos T tales que < T S; 1. Supongamos que M es numerable, y sea M = {TI, T2, T3, ... } una enumeración de M. Escribimos la única expresión decimal infinita de T n sin una sucesión infinita de ceros al final:

°

donde ani E {O, 1, ... ,9} para todo n e i. Por ejemplo, 0.7 Consideremos ahora la lista doblemente infinita TI

0.aUaI2aI3···

T2

0.a2Ia22a23···

0.6999 ...

Para todo n, elegimos bn E {1, ... , 8} distinto de ann ; es evidente que esto es posible. Entonces b = 0.b I b2 b3 ... bn ... es un número real de M y, por tanto, debe aparecer en la lista anterior. Pero es imposible que b = Tk, ya que bk es distinto de akk. ¡Yeso es todo! O Continuemos un poco más con los números reales. Obsérvese que los cuatro tipos de intervalos (0,1), (O, 1]' [O, 1) Y [0,1] tienen el mismo cardinal. Como ejemplo, lo vamos a comprobar para (0,1] Y (0,1). La aplicación f: (0,1] ----+ (0,1), x 1----+ y definida por

¡ 2. 2

x para

2.- x

y:=

°

Una biyección f

: (0,1]

1 ---+

(0,1)

~

s-x

para para

~ < x S; 1, I

4 I

S

<x< < <X -

I

2' I

4'

sirve para este propósito ya que es biyectiva: en la primera línea el rango de y es ~ S; y < 1, en la segunda línea S; y < ~, en la tercera línea ~ S; y < y así sucesivamente.

i

i,

Conjuntos, funciones y la hipótesis del continuo

99

A continuación observar que cualesquiera dos intervalos (de longitud finita y no nula) tienen el mismo cardinal considerando la proyección central de la figura. Todavía más: todo intervalo (de longitud no nula) tiene el mismo cardinal que la recta real R Para ver esto, recurrimos al intervalo abierto (O, 1) doblado de la figura y lo proyectamos en l8I. desde el punto S. En conclusión, cualquier intervalo abierto, semiabierto o cerrado (finito o infinito) de longitud no nula tiene el mismo cardinal, y dicho cardinal es denotado por e, de continuo (un nombre utilizado a veces para el intervalo [0,1]). Que los intervalos finitos e infinitos tengan el mismo cardinal puede resultar razonable tras algo de reflexión, pero he aquí otro hecho que seguramente resulte más contrario a nuestra intuición. Teorema 3. El conjunto l8I. 2 de todos los pares ordenados de números reales (es decir, el plano real) tiene el mismo cardinal que R • Demostración. Para ver esto, es suficiente demostrar que el conjunto de los pares (x, y), O < x, y ~ 1, se puede poner en correspondencia biyectiva con el intervalo (O, 1]. La demostración es otra vez de El Libro .. Consideremos el par (x, y) y escribamos x e y en su única expresión decimal infinita, como en el siguiente ejemplo: 0.3 0.009

x Y

01 2

2 05

007 1

08 0008

Obsérvese que hemos separado los dígitos de x e y en grupos, de forma que en cada grupo hay exactamente un dígito distinto de cero que aparece en la posición de la derecha. Ahora asociamos a cada (x, y) el número z E (0,1] que se obtiene al escribir el primer grupo de la x, a continuación el primer grupo de la y, después el segundo grupo de la x, y así sucesivamente. En nuestro ejemplo se obtiene

z

=

0.3009 01 2 2 05 007 1 08 0008

Como ni la expresión de x ni la de y terminan con una cadena infinita de ceros, la expresión de z tampoco lo hace. Recíprocamente, a partir de la expresión de z podemos obtener de forma inmediata su imagen inversa (x, y), lo que demuestra que la aplicación es biyectiva, y así termina la demostración. O Como (x, y) f-----7 X + iy es una biyección entre l8I.2 y los números complejos e, concluimos que ICI = Il8I.l = e. ¿Por qué nos resulta tan inesperado el resultado Il8I.2 1= Il8I.l? Porque va contra nuestra intuición de dimensión. Este resultado dice que el plano 2-dimensional l8I.2 (y, en general, por inducción, el espacio n-dimensional l8I. n ) se puede poner en correspondencia biyectiva con la recta l-dimensional R Por tanto, la dimensión no se conserva al aplicar transformaciones biyectivas. Si, además, requerimos que la aplicación y su inversa sean continuas, entonces la dimensión sí se conserva, como demostró Luitzen Brouwer. Avancemos un poco más. Hasta ahora hemos desarrollado la noción de igual cardinal. ¿Cuándo diremos que M no es más grande que N? La respuesta viene dada de nuevo por las aplicaciones. Diremos que el cardinal m es menor o igual que n si para dos conjuntos M y N tales que IMI = m y INI = n,

S

Conjuntos,junciones y la hipótesis del continuo

100

N

existe una de NI en N. Es evidente que la relación m ::; es independiente de los conjuntos NI y N elegidos. Si los conjuntos son finitos esto se corresponde con la noción intuitiva: un conjunto con m elementos es menor o igual que un conjunto de n elementos si y sólo si m ::; n. Nos enfrentamos ahora a un problema fundamental. Nos gustaría que las propiedades usuales de las desigualdades siguieran siendo válidas para los cardinales. Pero, ¿es esto cierto para los cardinales infinitos? Por ejemplo, ¿es cierto que m ::; TI Y TI ::; m implica que m = TI? Esto no es en absoluto evidente: tenemos conjuntos infinitos NI y N Y aplicaciones j : NI ---+ N Y 9 : N ---+ M que son inyectivas pero no necesmiamente sobreyectivas. Esto sugiere construir una biyección enviando algunos elementos m E M a j (m) EN, Y algunos elementos n E N a 9 (n) E M. Pero no está claro cómo se pueden coordinar las distintas elecciones para que "encajen bien." La respuesta es afirmativa y viene dada por el famoso teorema de Schri:iderBernstein, que anunció Cantor en 1883. Las primeras demostraciones fueron dadas por Friedrich SchrOder y Felix Bernstein algún tiempo después. La demostración que presentamos apareció en un pequeño libro de uno de los gigantes de la teoría de conjuntos del siglo XX, Paul Cohen, famoso por resolver la hipótesis del continuo (sobre la que hablaremos posteriormente).

"Schroder y Bernstein pintando"

Teorema 4. Si existen aplicaciones inyectivas de M a N y de N a M, entonces existe una biyección entre M y N, es decir, IMI = INI .

M

N

• Demostración. Podemos suponer que M y N son disjuntos - en caso contrario, reemplazamos N por una nueva copia. Las aplicaciones inyectivas j y 9 mandan elementos de jlv! a elementos de N, y viceversa. Una forma de clarificar esta situación potencialmente confusa es alinear M U N en cadenas de elementos: tomamos un elemento arbitrario mo E M, Y desde él formamos una cadena de elementos aplicando j, después g, a continuación de nuevo j, otra vez g, y así sucesivamente. La cadena se puede cerrar (éste es el caso 1) si mo aparece de nuevo en el proceso, o puede continuar indefinidamente con elementos distintos. (Por ser las aplicaciones inyectivas, el primer elemento "repetido" de la cadena no puede ser distinto de mo). Si la cadena prosigue indefinidamente, tratamos de recorrerla en orden inverso: de mo a g-l(mo) si ffio está en la imagen de g, a continuación a

continuo (mo)) si (mo) está J-l J, y así sucesivamente. Pueden aparecer otros tres casos: el proceso de recorrer la cadena hacia atrás continuar indefinidamente detenerse en un elemento de NI que no está en la de 9 parar en un elemento de N que no está en la de J De esta forma, Iv! U N de cuyos elementos se

+ 2 elementos distintos (k 2: O) J 9 J

Caso l. Cadena finita de 2k mo

f

~

no -----311-- mI

~

~

mk~nk

~

9

Caso 2. Cadena doblemente infinita de elementos distintos ...

J

~

mo -----311-- no

9 ~

J

mI -----311-- nI

9 ~

f

m2-----311--

Caso 3. Cadena infinita de elementos distintos que empieza en el elemento mo E NI\g(N) mo

f

9

f

~

no -----311-- mI

~

9

f

nI -----311-- m2

~

Caso 4. Cadena infinita de elementos distintos que empieza en el elemento no E N\f(NI) no

9 ~

f

mo -----311-- nI

9 ~

f

mI -----311--

o

¿Qué ocurre con el resto de de las desigualdades? Como de cospero m 7=. n. Acabamos de ver tumbre, se dice que m < n si m < que para dos cardinales cualesquiera se verifica como mucho una de estas tres posibilidades m < n, m = n, tU > n y, según la teoría de los cardinales, se sabe que siempre se cumple exactamente una. (Véase la proposición 2 en el apéndice de este capítulo). Además, el teorema de Schroder-Bernstein asegura que la relación < es tranm < n y <.J;! que m < .J;!. Por tanto, el conjunto sltlva, es de los cardinales está totalmente ordenado, comenzando con los cardinales finitos 0, 1,2,3, .... Recurriendo a los axiomas de Zermelo-Fraenkel (en particular, al axioma de elección) se deduce fácilmente que cualquier conjunto infinito NI contiene un subconjunto numerable: 1\11 contiene un elemento mI; el conjunto NI \ {mI} es no vacío que es y, por tanto, contiene un elemento m2; considerando el conjunto NI\ {mI, m2} se asegura la existencia de m3, Y así sucesivamente. Por tanto, el cardinal de un conjunto numerable es el menor cardinal infinito, denotado usualmente por ~o (que se lee "aleph sub-cero").

"El menor cardinal infinito"

Conjuntos, funciones y la hipótesis del continuo

102

También hemos demostrado un resultado anunciado anteriormente: Todo conjunto infinito tiene el mismo tamaño que alguno de sus subconjuntos

propios.

Como un corolario de No ::; m para cardinal infinito m, IJV\JICUIVc> demostrar el resultado del "hotel de Hilbert" para cualquier cardinal infinito m, es decir, se tiene que 1M U {x} 1= 1M 1para cualquier conjunto infinito M. En efecto, M contiene un subconjunto N = {mI, m2, m3, .. . }. Ahora mandamos x a mI, mI a m2, Y así sucesivamente, dejando fijos los elementos de M\N. Esto nos proporciona la biyección requerida. Otra consecuencia del teorema de Schroder-Bemstein que podemos demostrar es que el conjunto P(N) de todos los subconjuntos de N tiene cardinal c. Tal y como hemos observado anteriormente, es suficiente demostrar que IP(N)\{0}1 = 1(0,1]1. Un ejemplo de aplicación inyectiva es

f:P(N)\{0}

---+

(0,1],

en tanto que g: (0,1]

---+

P(N) \ {0},

define una aplicación inyectiva en la otra dirección. Hasta ahora conocemos los números cardinales 0, 1, 2, ... , No, Y sabemos que el cardinal c de lR es mayor que No. El paso de CQl con ICQlI = No a lR con IlRl = c sugiere de manera inmediata la siguiente pregunta: ¿ Es c =

IlRl el siguiente cardinal infinito tras No?

Por supuesto, nos encontramos con el problema de si siquiera existe el cardinal siguiente o, en otras palabras, si NI tiene sentido. Lo tiene - daremos un esquema de la demostración de este hecho en el apéndice de este capítulo. La afirmación c = NI es conocida como la hipótesis del continuo. La pregunta de si la hipótesis del continuo es cierta fue durante décadas uno de los mayores retos de las matemáticas. La respuesta nos lleva a los límites de la lógica: Kurt Godel y Paul Cohen demostraron que la afirmación c = NI es independiente de los axiomas de Zermelo-Fraenkel, de la misma forma que el axioma de las paralelas es independiente del resto de los axiomas de la geometría euclídea. Existen modelos en los que se verifica c = NI Y existen otros modelos de la teoría de conjuntos donde se verifica c i- NI. A la vista de este hecho, es interesante preguntar si existen otras condiciones (por ejemplo, del análisis) que sean equivalentes a la hipótesis del continuo. Es natural preguntar por un ejemplo del análisis, ya que históricamente las primeras aplicaciones importantes de la teoría de conjuntos de Cantor se dieron en este campo, más concretamente en la teoría de funciones complejas. A continuación presentamos uno de estos ejemplos junto con la solución, extremadamente simple y elegante, encontrada por Paul Erd6s. En 1962, Wetzel hizo la siguiente pregunta: Sea { fa} un conjunto de funciones analíticas distintas dos a dos definidas sobre tales que para cada z E el conjunto de valores {fa (z)} es como mucho numerablé (es decir, es finito o numerable); llamemos a esta propiedad (Po). ¿Es cierto que el conjunto es, a lo sumo, numerable?

e

e

Conjuntos, funciones y la hipótesis del continuo

poco después, Erdos demostró que, pende de la hipótesis del continuo.

103

SOIlJfI~ncienternellte,

la respuesta de-

Teorema 5. Si e > N1 , entonces toda familia {joJ que satisface (Po) es numerable. Si, por el contrario, e = N1 , existe alguna familia {foJ con la propiedad (Po) que tiene tamaño c. Para presentar la demostración necesitamos algunos hechos básicos sobre números cardinales y ordinales. Los lectores poco familiarizados con estos conceptos pueden encontrar un resumen de los resultados necesarios en el apéndice del final del capítulo. 111 Demostración del teorema 5. Supongamos que e> N1 . Demostraremos que para cualquier familia {fa} de cardinal N1 de funciones analíticas existe un número complejo Zo tal que todos los N1 valores fa (zo) son distintos. Por tanto, si una familia de funciones satisface (Po), debe ser numerable. Para ver esto, hacemos uso de nuestro conocimiento de los números ordinales. En primer lugar, ordenamos la familia {fa} de acuerdo con el ordinal inicial W1 de N1 . Según la proposición 1 del apéndice, esto quiere decir que el conjunto de índices recorre los números ordinales a menores que W1. A continuación mostramos que el conjunto de pares (a, (3), a < (3 < W1, tiene cardinal N1 . Como todo (3 < W1 es un ordinal numerable, el conjunto de pares (a, (3), 00< (3, es numerable para cualquier (3 fijo. Tomando la unión sobre los N1 elementos (3, deducimos de la proposición 6 del apéndice que el conjunto de todos los pares (a, (3), a < (3, tiene cardinal N1. Para cada par a < (3 consideramos el conjunto

8(00, (3)

=

{Z E

ce : fa(z)

=

f(3(z)}.

Veamos que cada conjunto 8( a, (3) es numerable. En efecto, consideremos los círculos C k de radio k = 1,2,3, ... centrados en el origen del plano complejo. Si fa y f (3 son iguales en infinitos puntos de algún C ko entonces fa y f (3 son idénticas según un conocido resultado sobre funciones analíticas. Por tanto, fa y f (3 son iguales en un número finito de puntos de cada Ck y, por tanto, en una cantidad como mucho numerable de puntos en todo el plano. Ahora definimos 8 := Ua<(3 8(00, (3). De nuevo, según la proposición 6, se tiene que 8 tiene cardinal N1 , ya que cada conjunto 8(00, (3) es numerable. Llegamos ahora al punto clave: como ce tiene cardinal e y, por hipótesis, e es mayor que N1 , existe un número complejo Zo que no está en 8 y, para Zo los N1 valores fa (zo) son distintos. Supongamos ahora que e = N1. Consideremos el conjunto D S;;; ce de números complejos p + iq con parte real e imaginaria racional. Como para cada p el conjunto {p + iq : q E Q} es numerable, sabemos que D es numerable. Además, D es un conjunto denso en ce: cualquier disco abierto del plano complejo contiene puntos de D. Sea {za : O ::; a < W1} un buen orden de ce. Construiremos una familia {f(3 : O ::; (3 < W1} de N1 funciones analíticas distintas tales que

!(3(Za) E D siempre que a < (3.

(1)

104

Conjuntos, funciones y la hipótesis del continuo Z E re tiene Una familia tal satisface la condición (Po). En cada un índice, digamos Z = Zú' Ahora bien, para todo (3 > a los valores {f¡3(zú)} están en el conjunto numerable D. Como a es un ordinal numerable, las funciones f ¡3 tales que (3 :S a contribuirán a lo sumo con una cantidad numerable de valores f¡3(zú) y, por tanto, el conjunto de todos los valores {j¡3(zú)} es también como mucho numerable. Por tanto, si construimos una familia {f¡3} que verifique (1), habremos concluido la demostración. La construcción de {f¡3} utiliza inducción transfinita. Para fa podemos tomar cualquier función analítica, por ejemplo fa = constante. Supongamos que ya hemos construido f ¡3 para todo (3 < r' Como r es un ordinal numerable, podemos reordenar {f¡3 : O :S (3 < r} en una sucesión gl, g2, g3, . . .. La misma reordenación de {Za : O :S a < r} nos proporciona una sucesión W1, W2, W3, .... A continuación construimos una función f-y que satisface para todo n las condiciones

y

(2)

La segunda condición nos asegura que todas las funciones f'Y (O :S r < W1) son distintas, y la primera es exactamente (1), lo que implica (Po) como hemos visto anteriormente. Obsérvese que la condición f'Y (w n ) -=1=- gn (w n ) es una vez más un argumento de diagonalización. Para construir f'Y escribimos ca

f'Y(z)

+

+ c1(Z -

wd + c2(Z - wd(z - W2) c3(Z - wd(z - W2)(Z - W3) + ....

Si r es un ordinal finito, entonces f'Y es un polinomio y, por tanto, analítica, y podemos escoger números Ci para los que se satisfaga (2). Si r es un ordinal numerable, entonces 00

f'Y (z)

L

cn(z - W1)'" (z - w n ).

(3)

n=O

Obsérvese que los valores de Cm (m 2: n) no influyen en el valor f'Y(w n ) y, por tanto, podemos elegir los Cn paso a paso. Si la sucesión (cn) tiende a O suficientemente rápido, entonces (3) define una función analítica. Finalmente, como D es un conjunto denso, podemos elegir la sucesión (cn) de forma que f'Y verifique las condiciones de (2), lo que completa la demostración. D

y

"Una leyenda sobre San Agustín cuenta que, mientras caminaba por una playa y contemplaba el infinito, vio un niño que intentaba vaciar el océano con una pequeña concha . .. "

Comenzaremos preguntando si para cada número cardinal existe un siguiente. Como primer paso veamos que, dado un cardinal m, siempre existe un cardinal n mayor que m. Para ello utilizamos de nuevo una versión del proceso de diagonalización de Cantor. Sea M un conjunto. Veamos que el conjunto P(M) de todos los subconjuntos de M tiene cardinal mayor que M. La aplicación que envía m E M a {m} E P (M) demuestra que M se puede poner en correspondencia biyectiva con un subconjunto de P(M), que es la definición de que ¡M¡ :S ¡P(M)¡.

Conjuntos, funciones y la hipótesis del continuo Nos por demostrar que no existe entre P(IIIr) y un --+ P(M) subconjunto de M. Supongamos que esto es falso y sea cp : una biyección de N c;: M en P(M). Consideremos el subconjunto U c;: N de todos los elementos de N que no están contenidos en su imagen por cp, es decir, U == {m E N : m ti- cp(m)}. Como cp es una biyección, existe u E N tal que cp(u) = U. Pero ahora ¡tanto u E U como u ti- U resultan imposibles! En si u E U, entonces u ti- cp (u) = U según la definición de U, en tanto que si u ti- U = cp (u), entonces u E U, Y llegamos a una contradicción. Es probable que el lector haya visto este argumento anteriormente. Es el viejo enigma del barbero: "Existe un barbero que afeita a todos los hombres que no se afeitan a sí mismos. ¿Se afeita el barbero a sí mismo?" Para continuar señalamos algunas otras importantes ideas debidas a Cantor: los conceptos de conjuntos ordenados y números ordinales. Un conjunto M está ordenado por < si la relación < es transitiva y, para cualesquiera dos elementos a i=- b de M, se tiene que a < b o que b < a. Por ejemplo, podemos ordenar N de la forma usual, N = {l, 2, 3, 4, ... }, pero, por supuesto, también podemos ordenar N al revés, N = { ... , 4, 3, 2, l}, o enumerar primero los números impares y después los pares, N = {l, 3, 5, ... , 2, 4, 6, ... }. He aquí el concepto clave. Se dice que un conjunto ordenado M está bien ordenado si todo subconjunto no vacío de M tiene un primer elemento. Por tanto, los órdenes primero y tercero de N considerados anteriormente son buenos órdenes, pero el segundo no lo es. El importante teorema del buen orden, que es una consecuencia de los axiomas (incluido el axioma de elección), dice que todo conjunto M admite un buen orden. En adelante, sólo consideraremos conjuntos en los que se ha definido un buen orden. Diremos que dos conjuntos bien ordenados M y N son similares (o del mismo tipo de orden) si existe una biyección cp de M en N que respeta la ordenación, es decir, tal que m y v de los conjuntos bien ordenados M y N. Se dice que f.1> es menor que v, f.1> < v, si M es similar a un segmento de N. Aquí también se tiene la propiedad transitiva y f.1> < v, v < 1f implica que f.1> < 1f, ya que una aplicación que respeta el orden transforma un segmento en un segmento.

105

Estos dos conjuntos bien orde{l, 2, 3, 4, .. .} y nados, N N {1,3,5, ... ,2,4,6, ... } no son similares: el primer orden tiene un solo elemento que carece de uno inmediatamente anterior, en tanto que el segundo tiene dos.

El número ordinal de {l, 2, 3, ... } es menor que el número ordinal de {l, 3, 5, ... ,2,4,6, ... }.

106

Conjuntos, funciones y la hipótesis del continuo

Es evidente que, para conjuntos finitos, m < n conserva su sentido usual. Sea W el número ordinal de N = {l, 2, 3, 4, ... } con la ordenación usual. Considerando el segmento N n +1 se deduce que n < w para todo n finito. Veamos que w :::; a para todo número ordinal infinito a. En efecto, si el conjunto infinito bien ordenado M tiene número ordinal a, entonces M contiene un primer elemento mI, el conjunto NI\ {mI} contiene un primer elemento m2, M\ {mI, m2} contiene un primer elemento m3. De esta forma se construye la sucesión mI < m2 < m3 < ... de elementos de NI. Si M = {mI, m2, m3, ... }, entonces M es similar a N y, por tanto, a = w. Si, por el contrario, M\ {mI, m2, ... } es no vacío, contiene un primer elemento m, de donde se deduce que N es similar al segmento Mm, que es la definición dew < a. Presentamos ahora (sin incluir las demostraciones, que no son difíciles) tres resultados básicos sobre números ordinales. El primero dice que cualquier número ordinal p tiene un conjunto bien ordenado W,u como representante "canónico" . Proposición 1. Sea p un número ordinal y sea W,u el conjunto de números ordinales menores que p. Entonces se verifica que: (i) Los elementos de W,u son comparables dos a dos. (ii) Si ordenamos W,u de acuerdo al tamaño, entonces W,u está bien ordenado y tiene número ordinal p.

Proposición 2. Dos números ordinales cualesquiera p y v verifican una y sólo una de las relaciones p < v, p = v Ó p > v. Proposición 3. Todo conjunto de números ordinales (ordenado de acuerdo al tamaño) está bien ordenado. Tras esta excursión a los números ordinales volvemos a los números cardinales. Sea m un número cardinal y sea Om el conjunto de los números ordinales p tales que Ipl = m. De acuerdo con la proposición 3, existe un menor número ordinal Wm en Om, al que llamamos número ordinal inicial de m. Como ejemplo, w es el número ordinal inicial de ~o. Tras estos preparativos, ya podemos demostrar un resultado básico para este capítulo. Proposición 4. Para todo número cardinal m existe cierto número cardinal siguiente mayor que m . • Demostración. Ya sabemos que existe algún número cardinal mayor n. Sea JC el conjunto de los números cardinales mayores que m y menores o iguales que n. A cada,p E JC le asociamos su número ordinal inicial wp. De entre estos números iniciales elegimos el menor (el cual sabemos que existe por la proposición 3), y el correspondiente número cardinal es el menor de JC y, por tanto, el número cardinal siguiente a m que buscábamos. D Proposición 5. Sea M un conjunto infinito de cardinal m y bien ordenado con respecto al número ordinal inicial wm . Entonces M no tiene último elemento.

Conjuntos, funciones y la hipótesis del continuo

• Demostración. En efecto, si M tuviera un último elemento m, entonces el segmento Mm tendría un número ordinal IL < Wm tal que IILI = m, lo que contradice la definición de W m . O Para terminar, lo que necesitamos es una ampliación considerable del resultado de que la unión de una cantidad numerable de conjuntos numerables es tamLién numerable. En el siguiente resultado consideramos familias arbitrarias de conjuntos numerables.

Proposición 6. Supongamos que {A,,} es una familia de tamaño m de conjuntos numerables Aa> donde m es un cardinal infinito. Entonces, la unión U Aa tiene tamaño menor o igual que m. a

• Demostración. Podemos suponer que los conjuntos Aa son disjuntos dos a dos, ya que esto sólo puede aumentar el tamaño de la unión. Sea NI tal que IMI = m el conjunto de índices y consideremos su buen orden de acuerdo al número ordinal inicial W m . A continuación reemplazamos cada a E NI por un conjunto numerable Ba~ {b a1 = a,b a2 ,ba3 , ... }, ordenado con respecto a w, y denotamos por M al conjunto obtenido. Entonces, M es de nuevo un conjunto bien ordenado si definimos bai < bf!L cuando a < (3 y bai < baj cuando i < j. Sea ¡L el número ordinal de M. Como M es un subconjunto de M, se tie~ que IL :::; ¡L según el argumento anterior. Si IL = ¡L, entonces M e~imilar a NI, en tanto que si IL < ¡L, entonces M es similar a un segmento de M. Ahora bien, como la ordenación Wm de NI no tiene último elemento (proposición 5) vemos que, en ambos casos, M es similar a la unión de conjuntos numerables B{3 y, por tanto, tiene el mismo cardinal. El resto es sencillo. Sea r.p : UB{3 ---+ M una biyección y supongamos que r.p(B{3) = {al,a2,a3,.··}. Reemplazamos cada ai por Aai y consideramos la unión U Aai' Como U Aai es la unión de una cantidad numerable de conjuntos (y, por tanto, numerable), se tiene que B{3 tiene el mismo tamaño que U Aai' En otras palabras, existe una biyección entre B {3 y U Aai para todo (3 y, por tanto, una biyección 'Ij; entre U B{3 y U Aa. Finalmente, 'lj;r.p-l es la biyección buscada entre M y U A", con lo que IU Aa I = m. O

[1] L. E. J. BROUWER: Beweis der Invarianz der Dimensionszahl, Math. Annalen 70 (1911), 161-165. [2] N. CALKIN & H. WILF: Recounting the rationals, Amer. Math. Monthly 107 (2000),360-363. [3] P. COHEN: Set Theory and the Continuum Hypothesis, W. A. Benjamin, New York 1966.

[4] P. ERDOS: An interpolation problem associated with the continuum hypothesis, Michigan Math. J. 11 (1964), 9-10. [5] E. KAMKE: Theory of Sets, Dover Books 1950. [6] M. A. STERN: Ueber eine zahlentheoretische Funktion, Journal für die reine und angewandte Mathematik 55 (1858), 193-220.

107

108

"Una infinidad más de cardinales"

del continuo

En el ámbito del análisis abundan las desigualdades, como bien se refleja en el famoso libro de Littlewood y Pólya, que lleva precisamente por título "Desigualdades". Veremos dos de las más básicas, con dos aplicaciones para cada una, y conoceremos la opinión de George Pólya (colaborador de honor en El Libro) sobre cuáles son las demostraciones más apropiadas. Nuestra primera desigualdad se atribuye tanto a Cauchy como a Schwarz, e incluso a Buniakowski: TeoremaI ~ .... ,,.~;~..."'~'" de L~m(~!'n'-SchwlliJ'Z Sea b) un producto interno en un espacio vectorial real V (con norma [a[2 := a)). Entonces

se cumple para todos los vectores a, b E V. La igualdad se da si y sólo si a y b son linealmente dependientes .

• Demostración. La siguiente demostración, de origen desconocido, es quizás la más corta. Consideremos la función cuadrática

en la variable x. Podemos suponer que a i=- O. Si b = Aa, entonces es claro que (a, b)2 = [a[2[b[2. Si en cambio los vectores a y b son linealmente independientes, entonces se verifica que [xa+b[2 > Opara todo x, y por tanto el discriminante (a, b)2 - [a[2[b[2 es menor que O. . O Nuestro segundo ejemplo es la conocida desigualdad para las medias armónica, geométrica y aritmética: Teorema 11 \.LVJU"U"'" armónica, geométrica y aritmética) Sean al, ... , an números reales positivos. Entonces

n

<

En ambos casos, se da la igualdad si y sólo si todos los

ai

son iguales .

• Demostración. La siguiente demostración, bella y singular, se atribuye a Cauchy (véase [7]). Sea P(n) el enunciado de la segunda desigualdad, escrito en la forma al+ ... +an)n al a2 ... an :S ( n .

!a

Para n = 2, tenemos al a2 :S (al 2 )2 ~ (al - a2)2 2: O, lo cual es cierto. A continuación procedemos en dos pasos:

110

Aquellas maravillosas desigualdades P(n) =? P(n - 1) (E) P(n) y P(2) =? P(2n),

lo cual claramente implica el resultado. n-l

Para demostrar (A), sea A:= I.: na~l' Entonces k=l P(n)

< n-l

y por tanto

TI ak

< An -

l

k=l Para (E), vemos que P(n)

<

La condición para la igualdad se concluye con la misma facilidad. La desigualdad izquierda, entre la media armónica y geométrica, se sigue al O , ... , ~. considerar l an al 111 Otra demostración. De las muchas demostraciones de la desigualdad entre las medias aritmética y geométrica (la monografía [2] contiene más de 50), resaltaremos una particularmente impactante, la de Alzer, de fecha reciente. De hecho, esta demostración proporciona la desigualdad más fuerte

para cualquier al, ... , a n , PI, ... ,Pn positivos tales que I.:~=l Pi = 1. En adelante, denotaremos por G la expresión de la izquierda, y por A la de la derecha. Podemos suponer que al :s; .. , :s; ano Claramente al :s; G :s; an , por tanto debe existir algún k con ak :s; G :s; ak+!. Concluimos que

(1)

ya que todos los integrandos son 2: O. Al reescribir (1) obtenemos

Aquellas maravillosas desigualdades donde el primer miembro es

11

a

~

A - -1

ai- G G

~P'-­

i=l

2

G

'

y el segundo miembro es igual a n

n

LPi(log ai -log G)

= log

i=l

afi -log G = O. i=l

é-

Por tanto, 1 :::o: 0, es decir, A :::o: G. En el caso de igualdad, todas las D integrales en (1) deben anularse, lo cual implica al = ... = a n = G. Nuestra primera aplicación es un bonito resultado de Laguerre (véase [7]) acerca de la ubicación de raíces de polinomios. Teorema 1. Supongamos que todas las raíces de xn + an_lX n - 1 + ... + ao son reales. Entonces estas raíces están contenidas en el intervalo de extremos

• Demostración. Sea y una de las raíces e Yl, ... ,Yn-l las otras. Entonces el polinomio es (x - y) (x - Yl) ... (x - Yn-l). Por tanto, comparando coeficientes,

+ Yl + ... + Yn-l, Y(Yl + ... + Yn-d + LYiYj, y

i<j y obtenemos n-l 22 an-l - an -2

-

Y

2

=

LY;' i=l

Al aplicar la desigualdad de Cauchy a (Yl,' .. , Yn-d y (1, ... ,1) resulta

n-l

<

(n - 1) LY;

=

(n - l)(a;_l - 2a n -2 - y2),

i=l

o

2(n - 1) n- 2 2 a n -2 - --an-l :s; O. n n En consecuencia, y (y por tanto todos los Yi) están entre las dos raíces de la función cuadrática, y estas raíces son precisamente nuestras cotas. D Y

2

2a

(0,2)

-l

n + -y+ n

Nuestra segunda aplicación parte de una conocida propiedad elemental de las parábolas. Consideramos la parábola descrita por f (x) = 1- X2 entre x = -1 Y x = 1. Asociamos a f (x) el triángulo tangencial y el rectángulo tangencial de la figura.

(-1, O)

o

(1,0)

Aquellas maravillosas desigualdades

112

Nos encontramos con que el área sombreada A = J~l (1 - x 2)dx es igual a y las áreas T y R del triángulo y del rectángulo son ambas iguales a 2. Por

t,

T

3

R

3

tanto A = "2 Y A = "2' En un artÍCulo muy bonito, Paul Erd6s y Tibor Gallai .preguntaron qué pasa cuando f (x) es un polinomio real arbitrario de grado n, con f (x) > O para -1 < x < 1 Y f( -1) = f(l) = O. El área A es en este caso J~l f(x)dx. Supongamos que en el intervalo (-1, 1) el polinomio f (x) alcanza su valor máximo en b, de manera que R = 2f(b). Al calcular las tangentes en -1 y 1, se verifica fácilmente (véase el recuadro) que

T respectivamente T = O para

=

21'(1)1'(-1) 1'(1) - 1'( -1)'

f' (1)

=

(2)

l' (-1) = O.

LU"'UFiLUV tangencial es precisamente Yo, donde (xo, Yo) es el punto de intersección entre las dos tangentes. Las ecuaciones de dichas tangentes son Y = 1'( -l)(x + 1) e Y = 1'(l)(x - 1), por tanto

xo =

f'(l) f'(l)

+ 1'(-1) f'( -1)'

y en consecuencia

-1 '

Yo =

, 1

v

, (1'(1) + 1'( -1) ) f (1) f'(l) f'(_l)-l

2

2 1'(1)1'(-1) f'(l) - f'(-l)"

3i

En general, no hay cotas no triviales para y ~. Para darse cuenta de ello, basta tomar f (x) = 1- x2n. Entonces T = 2n, A = 2~~ 1 ' Y en consecuencia > n. De manera similar, R = 2 y ~ = 23~1, que se acerca tanto como queramos a 1 cuando n tiende a infinito. Sin embargo, tal y como demostraron Erd6s y Gallai, sí existen mejores cotas para polinomios que sólo tienen raíces reales.

3i

Teorema 2. Sea f (x) un polinomio real de grado n 2: 2 que sólo tiene raíces reales, y tal que f(x) > O para -1 < x < 1 Y f( -1) = f(l) = O. Entonces

2 2 -T < A < -R 3 - 3 '

Y en ambos casos se cumple la igualdad solamente para n = 2. Mathematical Reviews

Erd8s, P. and roota. Ano, Es seij(x) f(-l)~f(I)~O,

o
für -1<x
wobei -1<~<1, so dilSS p. d¡e SteIle des Maximums von ¡(x) im IntervaU (-1, 1) bedeutet. Dann ist

21'(1)1'(-1)

~---;g¡;

1'(1)-}'(-I)

l'

!(x)dx;g¡;!·2!(.), -,

Erd6s y Gallai establecieron este resultado mediante una compleja demostración por inducción. En una reseña del trabajo, que apareció en 1940 en la primera página de la primera edición de los Mathematical Reviews, George Pólya explicó cómo demostrar la primera desigualdad usando la desigualdad entre la media aritmética y la media geométrica - un ejemplo muy bello de una reseña hecha con mucho detalle, que al mismo tiempo proporciona una . demostración de El Libro.

113

Aquellas maravillosas desigualdades

• Demostración de :::; A. Dado que f (x) sólo tiene raÍCes ninguna de ellas en el intervalo abierto ( -1, 1), se puede escribir de la forma

+ x)

'--- x)

(3)

j

(3j

con Oí 2" 1, 2" 1 - no teniendo en cuenta un factor constante positivo que al final se cancelará. Por tanto,

- x)

+ x)dx. j

Al sustituir x

f-----+

-x, nos encontramos con que también

II ((3j -

+ x)

x)dx,

j

yen consecuencia, por la desigualdad entre la media aritmética y la geométrica (nótese que todos los factores son 2" O) 1

A

=

J~[

(1-x 2)II(aí- x )II((3j+x) +

-1

'

J

II(ai + x) II((3j - x)

(1- X2)

i

J J

j

1

>

(1 - x2)

(II (a; -

-1

x2)

>



(1- X2)

J

(II (a; - 1) II ((3; - 1)

-1

=

~

'

2

dx

2

dx

J

(II(a; -1) II((3; -1)) i

r/ r/

II ((3; - x2)

1

]dx

1/2.

j

Calculemos f'(l) Y f'(-l). (Podemos suponer que f'(-1), 1'(1) -=J O, ya que de otra manera T = Oy la desigualdad ~ T :S A se vuelve trivial.) Por (3) vemos que -1) + 1), f'(1) = -2

II((3j j

y de manera similar que

-1) . j

Por ende, podemos concluir que

A > ~(-f'(1)f'(-1))1/2 3 .

114

Aquellas maravillosas desigualdades

Al aplicar ahora la desigualdad entra la media aritmética y la media geométrica a - l' (1) Y JI (1), llegamos por medio de (2) a la conclusión

2 A ~ -

2 1

3 -f'(1)

4 1'(1)1'(-1) 31'(1) - 1'(-1)

1

+ f'(-I)

2

-T

3 '

que es lo que queríamos demostrar. Analizando el caso de igualdad en todas las desigualdades, el lector puede verificar fácilmente la última afirmación del teorema. O Queremos invitar al lector a que busque una demostración igualmente bonita de la segunda desigualdad del teorema 2. Era de esperar que en el análisis abundasen las desigualdades, pero he aquí un ejemplo de la teoría de grafos donde su uso surge de manera muy inesperada. Más adelante, en el capítulo 32, hablaremos del teorema de Turán, que en el caso más sencillo afirma lo siguiente: Teorema 3. Sea G un grafo con n vértices y sin triángulos. Entonces G tiene 2 como mucho ~ aristas, y se da la igualdad solamente si n es par y G es el grafo bipartito completo K n / 2,n/2 . • Primera demostración. Esta demostración, que saca buen partido de la desigualdad de Cauchy, se debe a Mantel. Sea V = {1, ... , n} el conjunto de vértices y E el conjunto de aristas de G. Denotamos por di el grado de i, de donde ¿iEV di = 21EI (véase la página 143 del capítulo 22). Supongamos que ij es una arista. Dado que G no tiene triángulos, nos encontramos con que di + d j ~ n, ya que ningún vértice es vecino a la vez de i y j. Se sigue que

L

(di

+ dj )

~

nlEI·

ijEE

Nótese que di aparece exactamente di veces en la suma, de manera que

iEV

ijEE

Y al aplicar la desigualdad de Cauchy a los vectores (dI, ... , dn ) y (1, ... , 1), se obtiene

nlEI ~

L d;

iEV

~ (¿ di )2 n

=

41E12, n

de donde se sigue el resultado. En el caso de la igualdad vemos que di = d j para todo i,j, y además que di = ~ (ya que di + d j = n). Puesto que G no tiene triángulos, de manera inmediata se sigue que G = Kn/2,n/2. O

i

o

'----v,----'

di

• Segunda demostración. La siguiente demostración del teorema 3, que usa la desigualdad entre la media aritmética y la geométrica, es realmente una demostración de El Libro, y a pesar de su popularidad no está claro a quién atribuirla. Sea a el cardinal de un conjunto independiente máximo A, y f3 = n-a. Puesto que G no tiene triángulos, los vecinos de un vértice i forman un conjunto independiente, de donde se deduce que di ~ a para todo i.

Aquellas maravillosas desigualdades

115

El conjunto B = de cardinal f3 es incidente con cada arista de G. Al contar las aristas de G según sus vértices extremos en B, obtenemos la relación IEI :::; ¿iEB di. La desigualdad entre la media aritmética y la geométrica ahora da

y de nuevo el caso de igualdad puede estudiarse fácilmente.

o

[1] H. ALZER: A proof of the arithmetic mean-geometric mean inequality, Amer. Math. Monthly 103 (1996), 585. [2] P. S. BULLEN, D. S. MITRINOVICS & P. M. VASlé: Means and their Inequalities, Reidel, Dordrecht 1988. [3] P. ERDOS & T. GRÜNWALD: On polynomials with only real roots, Annals Math. 40 (1939), 537-548. [4] G. H. HARDY, J. E. LITTLEWOOD & G. PÓLYA: Inequalities, Cambridge University Press, Cambridge 1952. [5] W. MANTEL: Problem 28, Wiskundige Opgaven 10 (1906), 60-61. [6] G. PÓLYA: Review of [3], Mathematical Reviews 1 (1940), 1. [7] G. PÓLYA & G. SZEGO: Problems and Theorems in Analysis, Vol. 1, SpringerVerlag, Berlin Heidelberg New York 1972/78; Reprint 1998.

Entre las muchas contribuciones de George Pólya al análisis, la siguiente ha sido siempre la favorita de Erd6s, tanto por lo sorprendente del resultado como por la belleza de la demostración. Supongamos que

es un polinomio complejo de grado n ::::: 1 con coeficiente director 1. Asociamos a f(z) el conjunto

e

:=

{z

E

re : If(z)1 :::; 2},

es decir, e es el conjunto de puntos cuya imagen por f está dentro del círculo de radio 2 y centro en el origen del plano complejo. Por tanto, para n = 1 el conjunto e es un círculo de diámetro 4. Utilizando un argumento asombrosamente simple, Pólya demostró la siguiente preciosa propiedad del conjunto e: Tomemos cualquier recta L del plano complejo y consideremos la proyección ortogonal eL del conjunto e en L. Entonces, la longitud total de dicha proyección es siempre menor o igual que 4.

George Pólya

¿ Qué quiere decir que la longitud total de la proyección eLes menor o igual que 4? Veremos que eLes una unión finita de intervalos disjuntos h, ... , Jt y, por tanto, la condición significa que C(h) + ... + C(Jt ) :::; 4, donde C(Jj ) es la longitud usual de un intervalo. Haciendo un giro del plano, vemos que es suficiente considerar el caso en que L es el eje real del plano complejo. Teniendo en cuenta estos comentarios, veamos el resultado de pólya. Teorema 1. Sea f(z) un polinomio complejo de grado mayor o igual que 1 y con coeficiente director 1. Sea e = {z E re : If(z)1 :::; 2} y sea R laproyección ortogonal de e sobre el eje real. Entonces, existen intervalos h, ... , Jt de la recta real cuya unión recubre R y que satisfacen

C(h)

+ ... + C(It)

:::; 4.

Es claro que la cota de 4 del teorema se alcanza para n = 1. Con el fin de ganar intuición sobre el problema veamos qué ocurre con el polinomio f(z) = z2 - 2, que también alcanza la cota de 4. Si z = x + iy es un número complejo, entonces x es su proyección ortogonal sobre la recta real. Por tanto,

R

=

{x

E IR :

x

+ iY E e

para algún y}.

L

Un teorema de Pólya sobre polinomios

18

El lector demostrar fácilmente que para el ~V'HR'UJLI"V f (z) = tiene x + iy E e si y sólo si

Z2 -

2 se

De aquí se deduce que x 4 ::; (X2 + y2)2 ::; 4X2 y, por tanto, x2 ::; 4, es decir, Ixl ::; 2. Por otra parte, todo z = x E ~ tal que Ixl ::; 2 verifica IZ2 - 21 ::; 2, de donde se deduce que n es el intervalo 2] de longitud 4. Como primer paso escribimos f(z) = (z - el) ... (z - en) con ek = ak + ib k , Y consideramos el polinomio real p(x) = (x - ad··· (x - an ). Para z = x + iy E e, según el teorema de Pitágoras

y

y, por tanto, Ix - akl ::;

x

Iz - ekl para todo k, es decir,

Hemos visto que n está contenido en el conjunto P = {x E ~ : Ip( x) I ::; 2}, y si podemos demostrar que este conjunto está contenido en una familia de intervalos de longitud total menor o igual que 4, habremos tenninado. Así, nuestro resultado principal (teorema 1) será una consecuencia del siguiente resultado. Teorema 2. Sea p( x) un polinomio real de grado n ;::: 1 con coeficiente direcEntonces el conjunto tor 1 y tal que todas sus raíces son reales. P = {x E ~ : Ip( x) I ::; 2} está contenido en un conjunto de intervalos de longitud total menor o igual que 4. Como Pólya demuestra en su artículo [2], el teorema 2 es, a su vez, una consecuencia del siguiente resultado, debido a Chebyshev. Para que este capítulo sea autocontenido hemos incluido una demostración en el apéndice (siguiendo una bonita exposición de Pólya y Szeg6). Teorema de Todo polinomio real p( x) de grado n ;::: 1 con coeficiente director 1 verifica 1 _~';~llp(x)1 ;::: 2n - l · Observemos la siguiente consecuencia inmediata. Corolario. Sea p( x) un polinomio real de grado n ;::: 1 con coeficiente director 1, y supongamos que Ip(x) I ::; 2 para todo x en el intervalo [a, b]. Entonces b - a ::; 4. 11 Demostración. Considérese el cambio de variable y = b~a (x x E [a, b], entonces y E 1,1]. El polinomio correspondiente

q(y)

=

p(b;a(y+1)+a)

tiene como coeficiente director (b;a)n y verifica

max Iq(y)1

Pavnuty Chebyshev en un sello soviético de 1946

-l~y~l

=

max Ip(x)l·

a~x~b

a) -1. Si

Un teorema de Pólya sobre polinomios Del teorema de

19

se deduce que

y, por tanto, b - a :S: 4, como queríamos demostrar.

O

Este corolario nos deja muy cerca del resultado del teorema 2. Si el conjunto p = {x : Ip( x) I :S: 2} es un intervalo, la longitud de P es menor o igual que 4. Sin embargo, el conjunto P puede no ser un intervalo, como en el ejemplo mostrado en la figura, en el que P está formado por dos intervalos. ¿Qué podemos decir sobre P? Como p(x) es una función continua, sabemos inmediatamente que P es una unión de intervalos cerrados disjuntos 11 , h, ... , y que p( x) toma los valores 2 ó -2 en cada extremo de un intervalo 1j. De aquí se deduce que hay un número finito de intervalos h, ... , ft, ya que p( x) sólo puede tomar un valor dado un número finito de veces. La maravillosa idea de Pólya fue construir otro polinomio f5( x) de grado n, también con coeficiente director 1, Y tal que 15 = {x : 1f5( x ) I :S: 2} es un intervalo de longitud al menos f(h) + ... + C(1t). Entonces, el corolario demuestra que f(h) + ... + C(1t) :S: C(15) :S: 4, y hemos terminado .

Para el polinomio p( x) = x2 (x - 3) se tieneP = [1-V3, l]U[l+V3, ~ 3.2]

• Demostración. del teorema 2. Consideremos p( x) = (x - al) ... (x - an ) con P = {x E lR : Ip(x)1 :S: 2} = hU ... U ft, donde hemos ordenado los intervalos 1j de forma que h es el primero por la izquierda e 1t es el primero por la derecha. La primera observación es que cualquier intervalo 1j contiene alguna raíz de p( x ). En efecto, sabemos que p( x) toma los valores 2 ó -2 en los extremos de 1j. Si un valor es 2 y el otro -2, debe haber una raíz en 1j. Supongamos que p( x) = 2 en ambos extremos (el caso -2 es análogo). Sea b E 1j un punto donde p( x) alcanza su mínimo en 1j. Entonces pi (b) = O y p"(b) ;::: O. Si p"(b) = O, entonces b es una raíz múltiple de p'(X) y, por tanto, una raíz de p( x) según la observación 1 del recuadro de la página siguiente. Si, por el contrario, p" (b) > O, entonces se tiene que p(b) :S: O según la observación 2 del mismo recuadro. Por tanto, o bien p(b) = O, Y hemos encontrado la raíz, o bien p(b) < O, y tenemos una raíz en el intervalo entre b y cualquiera de los dos extremos de 1j. He aquí la idea final de la demostración. Sean 11 , ... ,1t los intervalos considerados anteriormente, y supongamos que el primer intervalo por la derecha, ft, contiene m raíces de p( x), contadas según su multiplicidad. Si m = n, entonces 1t es el único intervalo (según lo que acabamos de demostrar), y hemos terminado. Supongamos que m < n y sea d la distancia entre 1t - l e 1t (como en la figura). Sean bl , ... , bm las raíces de p( x) contenidas en 1t y el, ... en-m el resto de las raíces. Escribimos p(x) = q(x )r(x), donde q(x) = (x - bl ) ... (x - bm ) y r(x) = (x - el)'" (x - en-m), y definimos Pl(X) = q(x + d)r(x). El polinomio PI (x) es también de grado n y tiene un 1 como coeficiente director. Para x E hU ... U 1t - l se tiene Ix + d - bil < Ix - bil para todo i y, por tanto, Iq(x + d)1 < Iq(x)l. De aquí se sigue que para xEhu ... U1t - l .

h ...

1t-l

1t

120

Un teorema de Pólya sobre polinomios

entonces Ir(x - d)1 :::; Ir(x)1 y, por tanto,

Si, por el contrario, x E

Ipl(X

d)1

=

Iq(x)llr(x

d)1 :::; Ip(x)1 :::; 2,

loquesignificaqueIt -d<;;;P1 ={x: Ipl(X)1 :::;2}. En resumen, hemos visto que PI contiene a hU ... UIt -l u( It -d) y, por tanto, su longitud es mayor o igual que la de P. Obsérvese que en el paso de p( x) a Pl(X) los intervalos It-l e It - d se unen en un solo intervalo. Concluimos que los intervalos h, ... , J s de PI (x) que forman PI tienen longitud al menos f(h) + ... + f(It), y que el primer intervalo por la derecha, J s , contiene más de m raíces de PI (x). Repitiendo este procedimiento como mucho t - 1 veces, obtenemos un polinomio p(x) tal que 15 = {x : Ip(x)1 :::; 2} es un intervalo O de longitud f(15) 2: f(h) + ... f(It ), lo que completa la demostración.

con Sea p( x) un polinomio no constante que sólo tiene raíces reales.

Hecho 1. Si b es una raíz múltiple de pi (x), también es raíz de p(x). 11 Demostración. Sean b1 , ... , br las raíces de p( x) con multiplicidades respectivas SI, ... , S,.., donde 2::;=1 Sj = n. Como p(x) = (x - bj )Sj h(x), se tiene que bj es una raíz de pi (x) si Sj 2: 2 y que la multiplicidad de bj en pi (x) es Sj - 1. Además, existe una raíz de pi (x) entre b1 y b2 , otra raíz entre b2 y b3 , ••. , y una entre br - 1 Y br , y todas ellas deben ser raíces simples, ya que 2::;=1 (Sj - 1) + ('1' - 1) suma n - 1, el grado de p'(X). Por tanto, las raíces múltiples de p'(X) son necesariamente raíces de p( x). O

Hecho 2. Se tiene p'(x? 2: p(X)p"(X) para todo x E lIt

.!

11 Demostración. Si x = ai es una raíz de p( x), entonces no hay nada que demostrar. Supongamos que x no es una raíz. La regla de derivación del producto dice que n

p'(X) k=l

p(x) , x-ak

n

pi (x) p(x)

es decir,

1

¿~.

k=l

Derivando de nuevo se obtiene

p"(x)p(x) - p'(X)2 p(x)2

n

1

k=l (x - ak)2

< O.

O

Un teorema de Pólya sobre polinomios

121

1 ........... .

Teorema. Sea p(i) un polinomio real de grado n 2': 1 con coeficiente director 1. Entonces . 1

_~';~llp(x)1 2': 2n - 1 '

Antes de comenzar, veamos algunos ejemplos donde se da la igualdad. En el margen se muestran las gráficas de los polinomios de grado 1, 2 Y 3 que alcanzan la igualdad. De hecho, veremos que hay exactamente un polinomio en cada grado que alcanza la igualdad en el teorema de Chebyshev. • Demostración. Sea p(x) = xn + an_1X n- 1 + ... + aa un polinomio real y con coeficiente director 1 . Como estamos interesados en el intervalo -1 :S x :S 1, hacemos x = cos {} y llamamos g( {}) := p( cos {}) al polinomio resultante en cos {}, (1)

Los dos siguientes pasos de la demostración son a la vez resultados clásicos e interesantes en sí mismos. (A) Expresamos g( {}) como un polinomio en coseno, es decir, un polinomio de la forma

g( {})

= bn cos n{}

+ bn - 1 cos( n

- 1){}

+ ... + b1 COS {} + ba

(2)

donde bk E IR., Y demostramos que el coeficiente director es bn = 2}-1' (H) Dado cualquier polinomio en coseno h( {}) de grado n (es decir, tal que An es el último coeficiente no nulo)

h({})

=

Ancosn{}+An_lcos(n-1){}+ ... +Aa,

(3)

demostramos que IAnl :S max Ih({})I, lo que, al aplicarlo a g({}), concluirá la demostración del teorema. Demostración de (A). Para conseguir (2) a partir de (1), tenemos que expresar las potencias (cos {})k como polinomios en coseno. Por ejemplo, de la fórmula para el coseno del ángulo doble cos 2{} = cos 2 {}

-

sen 2 {} = 2 cos 2 {}

-

1,

se deduce que cos 2 {} = ~ cos 2{} + ~. Para hacer esto con una potencia arbitraria (cos {}) k introducimos los números complejos mediante la relación eix = cos x + i sen x. Los números eix son los complejos de módulo 1 (véase el recuadro sobre raíces complejas de la unidad de la página 25). En particular, esto proporciona la igualdad eim9

=

cos n{} + i sen n{}.

(4)

Por otra parte, (5)

Los polinomios Pl (x) = X, P2 (x) X2 - ~ y P3(X) = x 3 - ~x alcanzan la igualdad en el teorema de Chebyshev.

Un teorema de Pólya sobre polinomios

122

Igualando las partes reales de (4) y (5) se obtiene, utilizando que i 4H2 i 4f = 1 Y que sen 2 = 1 - cos 2

e

cos mJ

e,

L: (:e) (cos 19t-

4f

(1 - cos 2 'l9)2f

f?:O

-L:( e?:o

=

(6)

4,(i

n )(cOS'l9)n-4e-2(I_Cos 2 'l9)2Hl. +2

Por tanto, cos n'l9 es un polinomio en cos 'l9, cos n'l9 = Lk2:0 (2~)

=

2

n -

1 se verifica para

todo n > O: todo subconjunto de {l, 2, ... , n - l} se puede asociar a un subconjunto de {l, 2, ... ,n} de tamaño par si se añade el elemento n "cuando sea necesario."

cn ( cos 'l9)n

+ Cn-l (cos 'l9)n-l + ... + Co.

(7)

A partir de (6) se obtiene que el coeficiente director es Cn

=

L: (:e) + L: (4,(i:2) e?:o

e?:o

2n -

1 .

Ahora le damos un giro total a nuestro argumento. Suponiendo por inducción que, para k < n, (cos 'l9)k se puede expresar como un polinomio en coseno de grado k, deducimos de (7) que (cos 'l9) n se puede escribir como un polinomio en coseno de grado n con coeficiente director bn = 2nl_l'

Demostración de (B). Sea h( 'l9) un polinomio en coseno de grado n como en (3) y supongamos, sin pérdida de generalidad, que An m( 'l9) := An cos n'l9 se tiene que m(~7r) =

> O. Definiendo

parak=O,l, ... ,n.

(-llAn

Para llegar a una contradicción, supongamos que max Ih( 'l9) I < An. Entonces m(~7r) - h(~7r)

=

(_l)k An - h(~7r)

es positivo si k es par y negativo si k es impar en el intervalo O S; k S; n. Se concluye que m( 'l9) - h( 'l9) tiene al menos n raíces en el intervalo [O, 7r]. Pero esto es imposible ya que m( 'l9) - h( 'l9) es un polinomio en coseno de grado n - 1, que se puede escribir como en (1) y que tiene, por tanto, como mucho n - 1 raíces. D Esto concluye la demostración de (B) y del teorema de Chebyshev. Ahora es fácil completar el análisis, demostrando que gn ('l9) := 2nl_l COS n'l9 es el único polinomio en coseno de grado n y con coeficiente director 1 que alcanza la igualdad max Ig( 'l9) I = 2nl_l' Los polinomios T n (x) = cos n 'l9, x = cos 'l9, se conocen como polinomios de Chebyshev (de primera especie); por tanto, 2nl_l Tn(x) es el único polinomio de grado n con coeficiente director 1 que alcanza la igualdad en el teorema de Chebyshev.

[1] P. L. CEBYCEV: (Euvres, Vol. l, Acad. Imperiale des Sciences, St. Petersburg 1899, pp. 387-469. [2] G. PÓLYA: Beitrag zur Verallgerneinerung des Verzerrungssatzes auf rnehifach zusarnrnenhiingenden Gebieten, Sitzungsber. Preuss. Akad. Wiss. Berlin (1928),

228-232; Collected Papers Vol. l, MIT Press 1974,347-351. [3] G. PÓLYA & G. SZEGO: Problerns and Theorerns in Analysis, Vol. 1I, SpringerVerlag, Berlin Heidelberg New York 1976; Reprint 1998.

En 1943, Littlewood y Offord demostraron el siguiente resultado mientras trabajaban en la distribución de raÍCes de ecuaciones algebraicas: Sean al, a2, ... ,a n números complejos con Iai I 2: 1 para todo i, y consideremos los 2n combinaciones lineales 2:7=1 Eiai tales que Ei E {1, -1}. Entonces el número de sumas 2:7=1 Eiai contenidas en el interior de cualquier circunferencia de radio 1 no es mayor que

e

2n

fo

log n

para alguna constante e > O.

Unos años más tarde, Paul Erd6s mejoró esta cota eliminando el término log n, pero lo que aún es más interesante, pudo demostrar que esta afirmación es una sencilla consecuencia del teorema de Spemer (véase página 151). Para hacerse una idea de este argumento, consideremos el caso en el que todos los ai son reales. Podemos incluso suponer que todos ellos son positivos, cambiando ai por -ai Y Ei por -Ei cuando ai < O. Suponemos ahora que un conjunto de combinaciones 2: Eiai está contenido en el interior de un intervalo de longitud 2. Sea N = {1, 2, ... ,n} el conjunto total de índices. Para cada 2: Eiai ponemos 1 := {i E N : Ei = 1}. Ahora, si 1 ~ I' para dos de estos conjuntos, concluimos que

¿E~ai

-

¿Eiai =

2

¿

ai

John E. Littlewood

2: 2,

iEI'\I

una cóntradicción. Por tanto, los conjuntos 1 forman una anticadena, y por el teorema de Spemer hay como mucho (Ln/2J) de aquellas combinaciones. De la fórmula de Stirling (véase página 11) se sigue que para algún e > O. Si n es par y todos los ai = 1, obtenemos (n/2) combinaciones 2:7=1 Eiai que suman O. Fijándonos en el intervalo ( -1, 1), concluimos que este número binomial nos da la cota exacta. En el mismo artículo, Erd6s conjeturó que (L n/2 J) era la cota correcta también para números complejos (sólo consiguió demostrar e 2nn-1/2 para alguna constante e), y además que la misma cota es válida para vectores al, ... , a n con lail 2: 1 en un espacio de Hilbert real, si reemplazamos la circunferencia de radio 1 por una bola abierta de radio l. Erd6s estaba en lo cierto, pero tuvieron que pasar veinte años hasta que tanto Gyula Katona como Daniel Kleitman dieran, de manera independiente, con

El teorema de "'I""AlI""'. El tamaño de cualquier anticadena de subconjuntos de un conjunto de n elementos es como mucho

(Ln/2J)'

124

Sobre un lema de Littlewood y Offord una demostración para los números complejos (o, lo que es lo mismo, para el plano ]R2). Sus demostraciones usaron de manera explícita que el plano tiene dimensión 2, y no quedaba claro en absoluto cómo extender su resultado para el caso de espacios vectoriales reales de dimensión finita. Entonces, en 1970 Kleitman demostró toda la conjetura en espacios de Hilbert mediante un argumento de asombrosa sencillez. De hecho, demostró aún más. Su argumento es un todo un ejemplo de lo que se puede conseguir con la hipótesis de inducción adecuada. Unas palabras de ánimo para los lectores que no están familiarizados con los espacios de Hilbert: No los necesitamos realmente. Ya que sólo trataremos con un número finito de vectores aí, basta considerar el espacio vectorial real]Rd con el producto escalar usual. He aquí el resultado de Kleitman.

Teorema. Sean al, ... , a n vectores en ]Rd, cada uno de longitud por lo menos 1, y consideremos k regiones abiertas R l , ... , Rk de ]Rd, de manera que Ix yl < 2 para cualesquiera x, y contenidos en la misma región Rí. Entonces el número de combinaciones lineales I:7=l Siai, de modo que Si E {1, -1}, que pueden estar dentro de la unión Ui Ri de las regiones es como mucho la suma de los k mayores coeficientes binomiales (~). En particular, para k = 1 obtenemos la cota (Ln/2J).

Antes de pasar a la demostración, notaremos que la cota es ajustada para la elección de vectores al =

... =

an

En efecto, para n par obtenemos

=

(n/2)

a

=

(l,O, ... ,O)T.

sumas igual a O, (n/~-l) sumas igual

a (-2)a, (n/~+1) sumas igual a 2a, y así sucesivamente. Eligiendo bolas de radio 1 alrededor de

(-2)a,

0,

2a,

2l k;l Ja,

obtenemos

sumas contenidas en estas k bolas. Esta es la expresión que buscamos, ya que los coeficientes binomials mayores se hallan en el centro (véase página 12). Podemos razonar de manera similar para n impar. • Demostración.. Podemos suponer sin pérdida de generalidad que todas las regiones Ri son disjuntas, y esto es lo que haremos a continuación. La clave de la demostración es la recursión característica de los coeficientes binomiales, ya que nos proporciona una relación entre los mayores coeficientes binomiales de n y n - 1. Para verlo, ponemos r = l n-~+1 J y s = l n+~-l J, de manera que

Sobre un lema de Littlewood y Offord (~), (r~l)'

G) =

... , G)

(n~l)

125

son los k mayores coeficientes para n. Ahora la recursión

+ G~;) implica que

t(n~l)+t(~~n 1,=7'

'l,=T

~ (n ~ 1) +

.I (n -1)

itl (n ~ 1)

+~

1

(1)

(n ~ 1),

y un cálculo fácil nos muestra que la primera expresión suma los k+ 1 mayores coeficientes binomiales (n~ 1 ), y la segunda los k - 1 mayores. La demostración de Kleitman sigue un razonamiento por inducción sobre n, siendo el caso n = 1 trivial. Teniendo en cuenta (1), para el paso de inducción sólo tenemos que demostrar que las combinaciones lineales de al, ... , a n que están en k regiones disjuntas se corresponden de manera biyeetiva con combinaciones de al, ... ,an-l que están en k + 1 ó k - 1 regiones. nr.m{j!czórm. Por lo menos una de las regiones trasladadas Rj - a n es disjunta de todas las regiones trasladadas Rl + an, ... ,Rk + an0

Para verlo, consideramos el hiperplano H = {x : (a n , x) = e} ortogonal a an, que contiene a todas las regiones trasladadas Ri + a n en el lado dado por (a n , x) ~ e, y que está en contacto con la adherencia de alguna región, por ejemplo Rj + an0 Tal hiperplano existe porque las regiones son acotadas. Ahora se cumple Ix - yl < 2 para cualquier x E Rj e yen la adherencia de Rj, porque Rj es abierta. Queremos demostrar que Rj - a n está en el lado contrario de H. Supongamos, por el c~ntrario, que (a n , x - an) ~ e para algún x E Rj, esto es, (a n , x) ~ la n l2 + e. Sea y + a n un punto donde H está en contacto con Rj + a n . Entonces y está en la adherencia de R j , y (a n , y + an) = e, esto es, (a n , -y) = la n l2 - C. Por tanto (a n , x - y) ~ 21an12, y deducimos de la desigualdad de Cauchy-Schwarz que

Obtenemos pues (usando lanl ~ 1) que 2 :S 21a n l :S Ix - yl, lo cual es una contradicción. Lo demás es fácil. Clasificamos las combinaciones ¿ Eiai que están en la unión Rl U ... U Rk de la manera siguiente. En la clase 1 agrupamos a todas las sumas ¿~=l Eiai con En = -1 Y todas las sumas ¿~=l Eiai con En = 1 que están en Rj, Y en la clase 2 agrupamos las demás combinaciones ¿~=l Eiai con En = 1 que no están en Rj. Concluimos que las combinaciones ¿~:ll Eiai de la clase 1 están contenidas en las k + 1 regiones disjuntas Rl + a n , . .. , Rk + a n y Rj - an, y que las combinaciones ¿~:ll Eiai de

H

126

Sobre un lema de Littlewood y Offord

la clase 2 están en las k - 1 regiones disjuntas Rl - an, ... ,Rk - a n sin Rj - an' Por inducción, la clase 1 contiene como mucho 2:::=r~l (n~l) combinaciones, mientras que la clase 2 contiene como mucho 2::::::; (n~l) combinaciones - y por (1) esto ya es toda la demostración, tal y como está recogido en El Libro. D.

[1] P. ERDOS: On a lemma of Littlewood and Offord, Bulletin Amer. Math. Soco 51 (1945), 898-902. [2] G. KATONA: On a conjecture of Erdffs and a stronger form of Sperner's

theorem, Studia Sci. Math. Hungar. 1 (1966), 59-63. [3] D. KLEITMAN: On a lemma of Littlewood and Offord on the distribution of certain sums, Math. Zeitschrift 90 (1965), 251-259. [4] D. KLEITMAN: On a lemma ofLittlewood and Offord on the distributions oflinear combinations ofvectors, Advances Math. 5 (1970),155-157.

[5] J. E. LITTLEWOOD & A. C. OFFORD: On the number of real roots of a random algebraic equation 1Il, Mat. USSR Sb. 12 (1943), 277-285.

¿Cuál es la fórmula más interesante que involucra funciones elementales? En su bonito artículo [2], cuya exposición seguiremos bastante de cerca, Jürgen Elstrodt nos propone como un primer candidato el desarrollo en fracciones parciales de la función cotangente: 1

'ircot'irX =

X

+

00

1

1

(-- + --) x-n n=l X + n

(x

E ffi.\Z).

Esta fórmula tan elegante fue probada por Euler en el § 178 de su Introductio in Analysin Injinitorum del año 1748, y ciertamente es uno de sus hallazgos más bellos. Se puede escribir de manera todavía más elegante como 1

N

'ir cot 'irX

lim N-+oo

(1)

"" - L-,¡ X + n

n=-N

pero hay que tener en cuenta que la evaluación de la suma ¿nEZ x~n es un tanto delicada, ya que tan solo es condicionalmente convergente. Por tanto, su valor depende del orden en que se sume. Deduciremos (1) mediante un argumento asombrosamente sencillo, que se atribuye a Gustav Herglotz - el "truco de Herglotz." Para empezar, ponemos :=

g(x)

'ir cot 'ir X ,

:=

lim

N

-+00

!

1

N

f(x)

Gustav Herglotz

"" - L-,¡ X + n'

n=-N

f(x)

e intentamos demostrar que estas funciones tienen tantas propiedades en común que en realidad deben coincidir.

CA) Las funciones f y g están definidas para todos los valores no enteros, y en ellos son continuas. Para la función f (x) = 'ir cot 'irX = 'ir ~~~ ;~ , esto es claro (véase la figura). Para g(x), primero usamos la identidad _+1 x n + _1_ x-n = - n }x -x 2 para reescribir la fórmula de Euler como 1 00 2x (2) 'ir cot 'irX n 2 x2·

x

; - n=l L

Por tanto, para CA) tenemos que demostrar que para todo x 00

L

n=l

1

n 2 -x2

converge de manera uniforme en un entorno de x.

~

Z, la serie

La función f (x) = 'ir cot 7TX

La cotangente y .el truco de Herglotz

128

No hay ningún problema para el primer término n = 1, o para los términos con 2n - 1 ::; x 2 , ya que sólo hay un número finito de ellos. Por otro lado, para n 2: 2 Y 2n -1> x 2 , esto es n 2 - X2 > (n - 1)2 > O, los sumandos están acotados por 1 1

O <

< (n-1)2'

cota que no es válida sólo para x, sino también para valores en un entorno de x. Finalmente, el hecho de que ¿ (n-=1)2 converge (a ~2, véase la página 35) proporciona la convergencia uniforme que necesitarnos para demostrar (A). (B) Tanto f como 9 son funciones periódicas de periodo 1, lo cual quiere decir que f(x + 1) = f(x) Y g(x + 1) = g(x) para todo x E ffi.\Z. Ya que la cotangente tiene periodo 7T, vemos que f tiene periodo 1 (véase otra vez la figura de arriba). Para 9 argumentaremos como sigue. Sea N

1

L

x+n'

jli

n=-N

11'1

ii

entonces

I

1

II

¡I

N

1

L

x+1+n

n=-N 1'1

N+1

1

L

x+n

n=-N+l

1

gN-l (x) Por tanto, g(x

+ 1) =

lim gN (x

N-+oo

1

+ -x-+-N- + -x-+-N-+-1

+ 1) =

lim gN-l (x) = g(x).

N-+oo

Tanto f como 9 son funciones impares, lo cual quiere decir que tenemos f(-x) = -f(x) y g(-x) = -g(x) para todo x E ffi.\Z.

(C) 1 I

i

La función f obviamente tiene esta propiedad, y para ver que 9 también la tiene basta observar que 9N (-x) = -gN (x).

l'

Las últimas dos afirmaciones constituyen el truco de Herglotz: Primero vemos que f y 9 satisfacen la misma ecuación funcional, y en segundo lugar que h := f - 9 se puede extender de manera continua a todo IR..

1

l'

1I '

1

1: 1

Las dos funciones f y 9 satisfacen la misma ecuación funcional: f(~)+f(X!1)=2f(x) y g(~)+g(xtl)=2g(x).

(D)

li

Fórmulas de adición: sen(x + y) = senx cosy + cosx seny cos(x + y) = cosxcosy - senxseny ===}

sen(x + ~) cos(x+~)

sen x cosx

= cos x = -senx

= 2 sen ~ cos ~ = cos 2 ~ - sen2

Para f (x) esto se sigue de los teoremas de adición para el seno y coseno: f(~)

~.

+ f(xt 1 )

7T [COS

1r2X

sen

1r X

27r

2

sen (1r2X

sen 1f2X cos 1r X

]

2

2

cos(1rX

La ecuación funcional para 9 se sigue de

_

+ +

1rX)

2 1r X)

2

2 f(x).

La cotangente y el truco de Herglotz

129

lo cual a su vez es consecuencia de 1 -_. + 3'. + n 2

1

2

--;-c;---

x+I 2

+n

. (-x +-12n+ x + 2n1) +1

Ahora examinaremos la función

h(x) =

f(x) - g(x)

=

1 ( -x

JrcotJrX -

¿oo__

-

n=l

2x ) n 2 - x2

.

(3)

Llegados a este punto, ya sabemos que h es una función continua en ffi.\Z que satisface las propiedades ¿Qué le pasa en los valores enteros? A partir de los desarrollos del seno y del coseno, o aplicando dos veces la regla de l'Hospital, hallamos que lim (cotx

x->O

x cosx - senx lim xsenx x->O

-~) X

o,

y por tanto también

1)

1im ( Jr cot JrX

;;

x->O

= -

O.

Pero puesto que la suma L~=I n}::x 2 en (3) converge a O si x -----+ O, tenemos de hecho que lim h( x) = O, Y por tanto por la periodicidad que x->O

lim h(x) =

x->n

para todo n E Z.

O

Resumiendo, hemos demostrado lo siguiente: (E) Al definir h(x) := O para x E Z, la función h es continua en todo ffi. y tiene las propiedades (B), (e) Y (D). Ya estamos en posición de dar el golpe de gracia. Puesto que h es una función periódica y continua, tiene un máximo m. Sea Xo un punto en [0,1] tal que h(xo) = m. De (D) deducimos que

h( x20)

+ h( XOiI)

=

2m,

y por tanto que h( X20) = m. Iterando, obtenemos h( ~~) = m para todo n, y por tanto h(O) = m por continuidad. Pero h(O) = O, Y por tanto m = O, esto es, h(x) .:::; O para todo x E R Ya que h(x) es una función impar, h(x) < O es imposible, y por ende h(x) = O para todo x E ffi., Y hemos demostrado el O teorema de Euler. Entre los muchos corolarios que son consecuencia de (1), los más famosos son los que tratan de los valores de la función zeta de Riemann en enteros pares positivos (véase el apéndice al capítulo 6),

¿

1

00

((2k)

=

n=l

2:k

(k E N).

(4)

n

. Para acabar nuestra historia, veremos de qué manera trató Euler - unos años más tarde, en 1755 -la serie (4). Empezamos con la fórmula (2). Al multiplicar (2) por x y poner y = JrX encontramos para Iyl < Jr que

sen x

=x-

x3

3T

+ 5T ::r;5

x7

7!

± ...

130

La cotangente y el truco de Herglotz

ycoty

0

y2

1

-7f2-n-2

-1-_-(-y-)--;'-2 .

00

1- 2

n-l

7rn

El último factor es la suma de una serie geométrica, y por tanto 00

00

1-2~~ (:n)

ycoty

2k

"

n=lk=l

~

1 - 2 L-,

( 1

7f2k

k=l

~

1 )

L-, n 2k

y

2k

,

n=l

y hemos demostrado el siguiente resultado notable:

Para todo k E N, el coeficiente de de y coty es [Y

2k]

y2k

en el desarrollo en serie de potencias

2 ~ 1 - 2 f L-, 2f =

ycoty =

7f

n=l

n

2 -2f((2k).

(5)

7f

Hay otra manera, mucho más "canónica", de obtener un desarrollo en serie de y cot y. Sabemos del análisis que e iy = cos y + i sen y, y por tanto

e iy

cosy

+ e- iy 2

e- iy

éy

sen y =

2i

lo cual conduce a

y cot y Ahora sustituimos z

iy

=

eiy

+ e- iy

eiY -

e- iy

~y

e2iy e 2iy

+1 -

1

2iy, Y obtenemos

ycoty =

z eZ + 1 2 e Z -1

---

z

-2 +

z

(6)

e z -1

Por tanto, todo lo que nos hace falta es una expansión en serie de potencias de la función e'=-l; nótese que esta función está definida y es continua en todo lPI. (para z = O usamos la serie de la función exponencial, o de manera alternativa la regla de l'Hospital, lo cual nos da el valor 1). Escribimos

(7) Los coeficientes Bn son conocidos como los números de Bernoulli. El primer miembro de (6) es una función par (esto es, f(z) = f( -z)), y por tanto vemos que Bn = Opara n 2:: 3 impar, mientras que B 1 = - ~ corresponde al término de ~ en (6). De

z

La cotangente y el truco de Herglotz

131

obtenemos al comparar coeficientes para zn que n-1

'\:-:-' Bk 6 k!(n - k)! ck=O

=

{

01

paran = 1, para ni- 1.

(8)

A partir de (8) podemos calcular los números de Bemoulli de manera recursiva. El valor n = 1 nos da Bo = 1, el siguiente valor n = 2 nos proporciona la relación ~o + B 1 = O, de donde B 1 = -~, y así sucesivamente. Ahora casi hemos terminado: Al combinar (6) y (7) obtenemos 00 00 (2iy)2k (_1)k2 2k B 2k 2k ycoty = ¿B2k (2k)! (2k)! y, = k=O k=O

n012345678

Bn 1 - ~

i O-

1 30

O

12

O-

1 30

Los primeros números de Bernoulli

¿

y de aquí se deduce, con (5), la fórmula de Euler para ((2k): 00

1

~ n 2k

=

(_1)k-122k-1B2k 2k (2k)! 7'1

(k

E

N).

(9)

De nuestra tabla de los números de Bemoulli obtenemos así otra vez la suma L = ~2 del capítulo 6, y además las relaciones

;2

00

¿

n=l

darÍus

perrpída~

commodiori modo

1 6917'112 n 12 = 638512875'

5 6 6'

El número de Bemoulli BlO = que proporciona el valor de ((10), parece bastante inofensivo, pero el siguiente valor B 12 = - 26i310' que necesitamos para ((12), contiene el número primo bastante grande 691 en el numerador. Euler había calculado unos cuantos valores (( 2k ), pero sin darse cuenta de la conexión con los números de Bemoulli - sólo la aparición del extraño primo 691 le puso sobre aviso. Dicho sea de paso, puesto que ((2k) converge a 1 si k ---+ 00, la ecuación (9) nos dice que los números IB 2k I crecen muy deprisa - algo que no es evidente a la vista de los primeros valores. Por otra parte, sabemos muy poco sobre los valores de la función zeta de Riemann en los enteros impares k 2: 3; véase la página 41.

[1] S. BOCHNER: Book review of "Gesammelte Schriften" by Gustav Herglotz, Bulletin Amer. Math. Soco 1 (1979), 1020-1022. [2] J. ELSTRODT: Partialbruchzerlegung des Kotangens, Herglotz-Trick und die Weierstraj3sche stetige, nirgends differenzierbare Funktion, Math. Semesterberichte 45 (1998), 207-220. [3] L. EULER: lntroductio in Analysin lnfinitorum, Tomus Primus, Lausanne 1748; Opera Omnia, Ser. 1, Vol. 8. In English: lntroduction to Analysis of the lnfinite, BookI (translated by J. D. Blanton), Springer-Verlag, New York 1988. [4] L. EULER: lnstitutiones calculi differentialis cum ejus usu in analysifinitorum ac doctrina serierum, Petersburg 1755; Opera Omnia, Ser. 1, Vol. 10.

iCios Potefiarum ipfius;r continuare licuit, quod R ".

artificio adjurud,

La página 131 de la "Introductio in Analysin Infinitorum" de Euler del año 1748

Se dice que un noble francés, Georges Louis Leclerc, Conde de Buffon, propuso el siguiente problema en 1777: que se lanza una aguja corta en es la de que la una de las lineas?

¡JUJ'Jurll!u:rrtLIS

La probabilidad depende de la distancia d entre las líneas y también de la longitud R, de la aguja. De manera más precisa, depende sólo de la razón ~. Para nuestro objetivo, una aguja corta es una de longitud R, ::; d, es decir que no puede cruzar dos líneas a la vez (y la probabilidad de que toque dos líneas es cero). La solución al problema de la aguja de Buffon puede resultar sorprendente, ya que involucra el número H.

Teorema ("Problema de la aguja de Buffon") Si se lanza una aguja corta de longitud R, sobre un papel pautado con líneas equidistantes a distancia d 2: R" entonces la probabilidad de que la aguja caiga en una posición tal que cruce una de las líneas es p

=

2R,

El conde de Buffon

--o

Hd

Como consecuencia de este resultado, podemos obtener valores aproximados de H mediante un experimento: Si lanzamos una aguja N veces, y resulta éxito (una intersección) en P casos, entonces ~ debería ser aproximadamente ~ ~, es decir, el número 2Jj'! debería ser una aproximación de H. Quizás el experimento más largo (y exhaustivo) fue llevado a cabo en 1901 por Lazzarini, quien supuestamente llegó incluso a construir una máquina para lanzar una aguja 3408 veces (con ~ = ~). Se encontró con que la aguja cruzaba una línea en 1808 ocasiones. Después de hacer las cuentas, llegó a la aproximación H :=::; 2 . ~ f~g~ = 3.1415929 .... , que es correcta hasta el sexto dígito de H, ¡y demasiado bonita para ser verdad! (Los valores elegidos por Lazzarini conducen a la conocida aproximación H :=::; ~i~, que apareció en la página 31. Esto explica las más que sospechosas elecciones de 3408 y ~, cuyo producto es un múltiplo de 355. Véase [5] para una discusión del engaño de Lazzarini.) El problema de la aguja puede resolverse evaluando una integral. Lo haremos más adelante, y así también resolveremos el problema para una aguja "larga". Pero la demostración de El Libro, presentada por E. Barbier en 1860, no necesita integrales. Simplemente lanza una aguja diferente ...

\

\

/

~

\

~~ / ,\ t I

d

I

,

"

""'--

.

,

\

7 \

\

-----

,/

,/

~// IR,

La aguja de Buffon

134 Si se lanza cualquier aguja, corta o cruces será E = PI + 2P2

entonces el número

de

+ 3P3 + ... ,

donde PI es la probabilidad de que la aguja cruce exactamente una línea, P2 es la probabilidad de que cruce dos, P3 la de que cruce tres, etc. Por lo tanto, la probabilidad de que obtengamos por lo menos un cruce, que es la que se pide en el problema de Buffon, es P = PI

+ P2 + P3 + ...

(Los sucesos en los cuales la aguja cae exactamente sobre una línea, o con un extremo en una de ellas, tienen probabilidad cero; por tanto, pueden ser ignorados a lo largo de la discusión del problema.) Por otro lado, si la aguja es corta, entonces la probabilidad de obtener más de un cruce es cero, P2 = P3 = ... = O, Y de aquí se obtiene E = p: la probabilidad que buscamos es precisamente el número esperado de cruces. Esta reformulación del problema es extremadamente útil, ya que ahora puede utilizarse la linealidad de la esperanza (véase la página 84). Escribiremos E (e) para el número esperado de cruces que se obtienen al lanzar una aguja recta de longitud e. Si esta longitud es e = x + y, y consideramos por separado su "parte de delante", de longitud x, y su "parte de detrás", de longitud y, entonces obtenemos E(x

+ y)

E(x)

=

+ E(y),

ya que cualquier cruce siempre se produce o bien por la parte de delante o bien por la parte de detrás. Por inducción sobre n, esta "ecuación funcional" implica que E(nx) = nE(x) para todo n E N, y por tanto que mE(~x) = E(m~x) = E(nx) = nE(x). Así, se verifica E (rx) = rE (x) para todo racional r E Q. Además, E (x) es claramente monótona en x 2: O, de lo cual obtenemos que E(x) = ex para todo x 2: O, donde e = E(l) es alguna constante. Pero, ¿cuál es esta constante? Para hallar la respuesta usaremos agujas de diferente forma. Lancemos pues una aguja "poligonal" de longitud total eformada por segmentos de recta. El número de cruces que se producen es (con probabilidad 1) la suma del número de cruces que se producen en cada una de sus partes. De aquí se deduce que el número esperado de cruces es, de nuevo, E

OOO(JO

=

ce,

por la linealidad de la esperanza. ¡Para este resultado ni siquiera importa si los segmentos de recta están unidos de manera rígida o flexible! La clave para la solución de Barbier al problema de la aguja de Buffon es considerar una aguja que sea una circunferencia perfecta e de diámetro d, cuya longitud es x = dlr. Si se lanza esta aguja sobre un papel pautado, produce siempre dos intersecciones. La circunferencia puede aproximarse mediante polígonos. hnagínese que junto a la aguja circular e lanzamos un polígono inscrito Pn , y otro polígono

La aguja de Buffon

135

a Pn también intersecará a e, circunscrito pn. Cualquier línea que y si una línea interseca a entonces también cortará a pn . Por lo tanto, los números esperados de intersecciones satisfacen

e

Tanto Pn como pn son polígonos, de manera que el número esperado de cruces es "e multiplicado por la longitud" en ambos casos, mientras que para es 2. Por tanto, (1) cf!(Pn) :::; 2 :::; cf!(p n ).

o

e

Ahora, Pn y pn aproximan

e para n ---+ oo. En particular,

lim f!.(Pn)

n-+oo

y por tanto para n

---+ 00

= d7r =

Q ()

lim f!.(p n ),

n-+oo

o

deducimos de (1) que e d7r :::; 2 :::; e d7r,

o

lo cual conduce a que e = ~ ~.

Pero también podríamos haberlo hecho utilizando cálculo. La clave para obtener una integral "sencilla" es considerar en primer lugar la pendiente de la aguja. Supongamos que la aguja cae formando un ángulo a con la horizontal, con a variando en el intervalo O :::; a :::; ~. (Ignoraremos el caso en el que la aguja cae con pendiente negativa, ya que este caso es simétrico al de la pendiente positiva y tiene la misma probabilidad.) Una aguja que cae con ángulo a tiene altura f!. sen a, y la probabilidad de que cruce una de las líneas horizontales separadas por una distancia d es Ji s':ina. De aquí obtenemos la probabilidad calculando la media sobre los posibles valores de a:

J 1r/2

p

~ 7r

o

f!.sena da d

= ~~ [- cosa] 1r/2 = ~~. o

7rd

7rd

Jis':in a

Para una aguja larga obtenemos la misma probabilidad miel!tras que se verifique f!. sen a :::; d, esto es, en el intervalo O :::; a :::; arcsen ~. Sin embargo, para ángulos a más grandes la aguja tiene que cruzar una línea y por lo tanto la probabilidad es 1. De aquí calcularnos, para f!. ;:::: d, que

J 1r /2

p

2 (¡arCSen(d/Ji) f!. sen a --da 7r d o

;:2(f!.[ d -

]arCSen(d/Ji)

cos a o

+

arcsen( d/ Ji)

+ (7r2" -

I+ ~ (~ (I- VI - ~:) -

Ida

)

arcsen

arcsen

fd))

~) .

La respuesta no ha resultado tan bonita para una aguja larga, pero en cambio nos proporciona un problema interesante: Demuéstrese que la fórmula da como resultado ~ en el caso f!. = d, que es estrictamente creciente como función de f!., y que tiende a I para f!. ---+ oo.

\

\\

/ I

I

/

136

La aguja de Buffon

[1] E. BARBIER: Note sur le problhne de l'aiguille et le jeu dujoint couvert, J. Mat-

hématiques Pures et Appliquées (2) 5 (1860), 273-286. [2] L. BERGGREN, J. BORWEIN & P. BORWEIN, EDS.: Pi: A Source Book, SpringerVerlag, New York 1997. [3] G. L. LECLERC, COMTE DE BUFFON: Essai d'arithmétique morale, Appendix to "HistoÍre naturelle générale et particuliere," Vol. 4, 1777. [4] D. A. KLAIN & G.-C. ROTA: Introduction to Geometric Probability, "Lezioni Lincee," Cambridge University Press 1997. [5] T. H. O'BEIRNE: Puzzles and Paradoxes, Oxford University Press, London 1965.

111 :

,11,

"¿ Tiene algún problema?"

I

.

I

.. I

22 El principio del palomar y el doble recuento 139

23 Tres teoremas famosos sobre conjuntos finitos 151

24 Barajando el mazo 157

25 Caminos, retículas y determinantes 167 26 La fórmula de Cayley para el número de árboles 173

27 Completando cuadrados latinos 179

28 El problema de Dinitz 185

29 Identidades y biyecciones 191

"Un cuadrado latino melancólico"

Algunos principios matemáticos, como los dos que ilustraremos en este capítulo, son tan obvios que podría pensarse que sólo pueden producir resultados igualmente obvios. Para convencerle de que esto no siempre es cierto los ilustramos con algunos ejemplos cuya inclusión en el Libro fue sugerida por Paul Erd6s. En capítulos posteriores encontraremos más aplicaciones de estos principios.

Principio del pallJm~u:. Si colocamos n objetos en r cajas y r las cajas contiene más de un objeto.

< n, entonces al menos una de

Esto es tan evidente que no hay nada que demostrar. En el lenguaje de las aplicaciones el principio dice lo siguiente: sean N y R dos conjuntos finitos tales que

INI = n > r = IRI, f : N ---+ R una aplicación. Entonces existe algún a E R tal que If~l(a)1 2: 2. Es posible incluso escribir una desigualdad más fuerte: existe algún a E R tal que

y sea

(1)

En efecto, en otro caso tendríamos If~l(a)1 < !f: para todo a y, por tanto, n = L If~l(a)1 < r!f: = n, lo que es imposible. aER

1. n

Consideremos el conjunto 1,2,3, ... , 2n y tomemos Entre ellos hay dos que son primos entre sí.

+ 1 cualesquiera.

De nuevo, esto es evidente. Debe haber dos números consecutivos, y por tanto primos entre sí. Ahora démosle la vuelta a la afirmación. Sea A <:;: {1, 2, ... , 2n} tal que IAI = n dos números de A tales que uno es divisor del otro.

+ 1.

Existen

Esto ya no es tan evidente. Según nos contó Erd6s, él propuso la cuestión al joven Lajos Posa durante una cena, y para cuando acabaron de comer Lajos tenía la respuesta. Se convirtió en una de las preguntas favoritas de Erd6s

"El palomar a vista de pájaro"

El principio del palomar y el doble recuento

140

Ninguno de estos dos resultados sigue siendo cierto al reemplazar n+ 1 por n: para ver esto, basta considerar los dos conjuntos {2, 4, 6, ... , 2n} y {n+l, n+2, ... , 2n}.

de "iniciación" a las matemáticas. El del la respuesta (afirmativa) al problema. Escribamos cada número a E A de la forma a = 2 k m, donde m es un número impar entre 1 y 2n - 1. Como hay n + 1 números en pero sólo n partes impares distintas, debe haber dos números en A con la misma parte impar. Por tanto, uno de ellos debe ser múltiplo del otro. O

Este es otro de los problemas favoritos de Erdéís, que aparece en un artÍCulo de Erdéís y Szekeres sobre problemas de Ramsey. En cualquier sucesión al, a2," ., aTnn+l de mn números reales distintos hay una subsucesión creciente ,

+1

"

,1

j' I

El lector puede divertirse demostrando que para mn números la afirmación ya no es cierta.

de longitud m

+ 1, o una subsucesión decreciente

de longitud n

+ 1, o ambas.

En esta ocasión la aplicación del principio del palomar no es inmediata. Asociemos a cada término ai el número ti, que es la longitud de la sub sucesión creciente más larga que comienza en ai. Si ti 2': m + 1 para algún i, entonces tenemos una subsucesión creciente de longitud m + 1. Supongamos, por tanto, que ti S; m para todo i. La función f : ai f----+ ti, que transforma {al, ... , amn+l} en {1, ... , m} nos dice, según (1), que existe algún valor s E {1,. " ,m} tal que f(ai) = s para ":' + 1 = n + 1 términos ai. Sean aj1' aj2' ... ,ajn+1 (JI < ... < jn+l) tales números. Analicemos dos términos consecutivos aji' aji+1' Si aji < aji+1 obtenemos una subsucesión de longitud s que comienza en aji+1 y, por tanto, una sub sucesión creciente de longitud s + 1 que comienza en aji' lo que es imposible, pues f (aji) = s. De esta forma obtenemos una subsucesióndecreciente ajl > ajz > ... > ajn+l de longitud n + 1. O Este resultado de apariencia sencilla sobre subsucesiones monótonas tiene consecuencias nada triviales en el concepto de dimensión de un grafo. No necesitamos aquí la noción de dimensión para un grafo general, sino sólo para el grafo completo Kn. Se puede enunciar de la siguiente forma. Sea N = {1, ... , n}, n 2': 3, y consideremos m permutaciones 1l"1, . . . , 1l"m de N. Se dice que las permutaciones 1l"i representan Kn si para cualesquiera tres números distintos i, j, k existe una permutación 1l" en la que k aparece después de i y j. La dimensión de Kn es el menor entero m para el que existe una representación 1l"1, . . . ,1l"Tn' Como ejemplo, dim(K3) = 3 ya que los tres números deben aparecer en último lugar, como en 7fl = (1,2,3), 7f2 = (2,3,1), 7f3 = (3,1,2). ¿Qué ocurre con K4? Obsérvese, en primer lugar, que dim(Kn ) S; dim(Kn+l): sólo hay

El principio del palomar y el doble recuento que eliminar n + 1 en una y, de dim(K4) = 3 tomando 7rl

= 0(1, 2, 3, 4),

7r2

=

141 o

(2,4,3,1),

7r3

Por tanto, dim(K4) 2': 3

=

(1,4,3,2).

No es tan sencillo demostrar que dim(K 5 ) = 4; para valores mayores de n, de forma sorprendente, la dimensión de Kn sigue siendo 4 hasta n = 12, en tanto que dim(K13) = 5. Parece que dim(Kn ) es una función bastante extraña... pero no es así. Cuando n tiende a infinito, dim(Kn) es, de hecho, una función bien conocida - y la clave para encontrar una cota inferior es el principio del palomar. Veamos que (2)

7rl:

1 2 3 5 6 7 8 91011 12 4

7r2:

2 3 4 8 7 6 5121110 9 1

7r3:

3 4 11112 910 6 5 8 7 2

7r4:

4 1 210 91211 7 8 5 6 3

Estas cuatro permutaciones representan K1 2

Como hemos visto que dim(Kn ) es una función monótona con respecto a n, es suficiente demostrar (2) para n = 22P + 1, es decir, tenemos que demostrar que Supongamos, por el contrario, que dim(Kn ) :S p, y sean 7rl, ... ,7rP las permutaciones que representan a N = {1, 2, ... ,2 2P + 1}. Ahora utilizamos el resultado sobre sub sucesiones monótonas p veces. En 7rl existe alguna 1 sub sucesión monótona Al de longitud 22P - + 1, que puede ser creciente o decreciente. Fijémonos en este conjunto Al en 7r2. Utilizando de nuevo el resultado, encontramos en 7r2 alguna sub sucesión monótona A 2 e Al de lon2 gitud 22P - + 1, Y A 2 es, por supuesto, también monótona en 7rl. Continuando de esta misma forma, encontramos una sub sucesión Ap de tamaño 22° + 1 = 3 que es monótona en todas las permutaciones 7ri. Si Ap = (a, b, e), entonces o bien a < b < e, o bien a > b > e en toda 7ri. Pero esto es imposible, ya que O debe existir una permutación en la que b aparece después de a y c. El comportamiento asintótico correcto fue determinado por Joel Spencer (cota superior) y por Erd6s, Szemerédi y Trotter (cota inferior):

dim(Kn ) =

log2 log2 n

1

+ (2" + 0(1)) 10g2log210g2 n.

Sin embargo, la historia no termina aquí: muy recientemente, Morris y Ho§ten encontraron un método que, en principio, puede determinar el valor exacto de dim(Kn). Utilizando su resultado y un ordenador se pueden obtener los valores que mostramos al margen. ¡Esto es verdaderamente asombroso! Por ejemplo, piénsese en el número de permutaciones de 1422564 elementos. ¿Cómo se determina si hacen falta 7 u 8 de ellas para representar K1422564?

Paul Erd6s atribuye a Andrew V ázsonyi y Marta Sved la siguiente atractiva aplicación del principio del palomar:

Consideremos n enteros al, ... ,an , no necesariamente distintos. Entonces, existe siempre un conjunto de elementos consecutivos ak+l, ak+2,· .. ,ae cuya suma I:;=k+l ai es múltiplo de n.

dim(Kn) ::; 4

~

dim(Kn ) ::; 5

~

dim(Kn) ::; 6

~

dim(Kn ) ::; 7

~

n::; n ::; n::; n::;

12 81 2646 1422564

El principio del palomar y el doble recuento

142

Para demostrar este hecho definimos los N = {O, 1, ... ,n} y R = {O, 1, ... , n - 1} Y consideramos la aplicación f : N ---+ R, donde f(m) es el resto de dividir la suma al + . " + a m entre n. Puesto que INI = n + 1 > n = IRI, podemos asegurar la existencia de dos sumas al + ... + ak Y al + ... + ac (k < .e) que proporcionan el mismo resto, donde la primera suma puede ser la vacía, denotada por O. Por tanto,

i=l

i=l

o

tiene resto O, lo que concluye la demostración.

Pasemos ahora al segundo principio: contar de dos formas. De manera más formal, podemos presentarlo aSÍ.

Doble recuento. Supongamos que tenemos dos conjuntos finitos R y e y un subconjunto S ~ R x e. Decimos que p y q son incidentes siempre que (p, q) E S. Si r p denota el número de elementos incidentes a p E R, y cq denota el número de elementos incidentes a q E e, entonces

I: c

q•

(3)

qEC

De nuevo, no hay nada que demostrar. La primera suma clasifica los pares de S de acuerdo con su primera componente, en tanto que la segunda clasifica los mismos pares de acuerdo con su segunda componente. Podemos dibujar el conjunto S de una manera útil. Consideremos la matriz la matriz de incidencia de S, cuyas filas y columnas se corresponA = (a den con los elementos de R y e, respectivamente, donde

pq ),

e

R 1 2

3 4 5 6 7 8

1

2

3 4

5 6

7

8

1

1 1

1

1

1 1 1

1

1 1

1 1

1

1

1

1 1

1 1

apq={~

si (p, q) E S si (p,q)

tJ. S.

Con esta definición, r p es la suma de la fila p-ésima de A y c q es la suma de la columna q-ésima. Por tanto, el primer término de (3) suma los elementos de A (es decir, cuenta los elementos de S) por filas, en tanto que el segundo término los suma por columnas. El siguiente ejemplo terminará de aclarar esta correspondencia. Pongamos R = e = {1, 2, ... , 8}, Y escogemos S = {(i,j) : i divide aj}. Se obtiene la matriz del margen, en la cual sólo mostramos los unos.

El principio del palomar y el doble recuento

143

Obsérvese la tabla de la izquierda. La cantidad de unos en la columna j es exactamente e1llúmero de divisores de j; denotemos este número por t(j). Nos podemos preguntar cómo es t(j) en media cuando j toma los valores entre 1 y n. Es decir, nos preguntamos por _

1

t(n)

= ;

n

n

12345678

16 5 t(n) I "23 :35 2 2 :37 '7 "2

L t(j). j=l

Los primeros valores de t(n)'

¿Cómo de grande es t(n) para un n arbitrario? A primera vista, esta pregunta puede parecer muy complicada. Para los números primos t(p) = 2, en tanto que para 2k se tiene un término grande, t(2 k ) = k + 1. Por tanto, t(n) es una función que oscila salvajemente, y podríamos conjeturar que algo parecido es cierto para t(n). Pues no, nada más lejos de la realidad. El doble recuento proporciona una respuesta sencilla y sorprendente. Consideremos la matriz A (igual que antes) para los enteros de 1 a n. Contando por columnas obtenemos ¿7=1 t(j). ¿Cuántos unos hay en la fila i? Evidentemente, los unos corresponden a los múltiplos de i: li, 2i, ... , y el mayor múltiplo menor o igual que n es lTJi. Por tanto, _ In lnn lnn nI

t(n)

=

-nL..t ""' tU) = j=l

-n

L l---:-Jz i=l

~ -nL..t ""' ---:zi=l

=

L-;-'z i=l

donde el error en cada sumando al pasar de lTJ a Tes menor que 1. Como la última suma es el n-ésimo número armónico Hn, obtenemos la acotación Hn -1 < t(n) < Hn que, junto con las estimaciones para Hn de la página 11 nos proporciona logn-l < Hn-l-.!. < t(n) < Hn < 10gn+1. n Hemos demostrado un resultado notable: aunque t( n) es totalmente errática, la media t( n) se comporta muy bien: difiere de log n en menos de l.

Sea G un grafo simple finito y sean V y E los conjuntos de sus vértices y aristas, respectivamente. Ya definimos en el capítulo 11 el grado d( v) de un vértice v como el número de aristas que tienen a v como extremo. En el ejemplo de la figura, los vértices 1,2, ... ,7 tienen grados 3,2,4,3,3,2,3, respectivamente. Casi todos los libros de teoría de grafos comienzan con el siguiente resultado (con el que ya nos encontramos en los capítulos 11 y 17):

L

d(v)

=

2\E\.

(4)

vEV

Para demostrarlo, consideremos S ~ V x E, donde S es el conjunto de pares (v, e) tales que v E V es un extremo de e E E. El doble recuento de S proporciona, por una parte, ¿vEV d( v), ya que cada vértice contribuye con O d( v) al recuento y, por otra, 2\E\, ya que cada arista tiene dos extremos.

I

6

3

7

2
El principio del palomar y el doble recuento

144

Este sencillo resultado tiene les serán presentadas posteriormente. Queremos destacar en esta sección la siguiente hermosa aplicación a un problema extremal en grafos. Aquí está: Supongamos que G = (V, E) tiene n y no contiene ciclos de longitud 4 (que denotaremos por C4 ), es decir, ningún subgrafo ¿ Cuántas aristas puede tener G como máximo?

Como ejemplo, el grafo del margen tiene 5 vértices, no contiene ningún 4-ciclo y tiene 6 aristas. Es sencillo demostrar que si el número de vértices es 5 entonces el número máximo de aristas es 6 y que, de hecho, éste es el único grafo de 5 vértices con 6 aristas que no contiene ningún 4-ciclo. Pasemos ahora al problema general. Sea G un grafo con n vértices y sin ningún 4-ciclo. Como antes, denotamos por d( u) el grado de u. Ahora hacemos doble recuento en el conjunto 8 de pares (u, {v, w } ), donde u es adyacente a v y a w, de forma que v -1- w. En otras palabras, contamos las veces que aparece

Sumando en u se tiene que 181 = I:uEV (d~u)). Por otra parte, todo par {v, w} tiene como mucho un vecino común (debido a la ausencia de C4 ). Por tanto, 181 :s; G), y se concluye que

o

2: d(u)2

:s; n(n - 1) +

2: d(u).

(5)

uEV

A continuación, como es típico en esta clase de problemas extremales, aplicamos la desigualdad de Cauchy-Schwarz a los vectores (d(Ul)"'" d(u n )) y (1,1, ... ,1), de donde obtenemos

(l:d(u)/ < nl:d(u)2, uEV

uEV

y, según (5),

(2: d(u) /

< n 2(n -

uEV

1) + n

2: d(u). uEV

Utilizando (4) se deduce que

o

IEI2 - ~IEI-

2

n (n - 1) :s; O. 4 Resolviendo esta ecuación de segundo grado obtenemos el siguiente resultado, debido a Istvan Reiman.

El principio del palomar y el doble recuento

145

Teorema. Si un graÍo G de n vértices no contiene

entonces

(6) Para n = 5 se obtiene IEI :::; 6, Y el grafo que apareció anteriormente muestra que laigualdad es posible. El doble recuento nos ha proporcionado, de forma sencilla, una cota superior para el número de aristas. Pero, ¿cómo de ajustada es la cota (6) en general? Este precioso ejemplo [2] [3] [6] muestra que es casi justa. Como ocurre frecuentemente en este tipo de problemas, la geometría finita muestra el camino. Al presentar el ejemplo suponemos que el lector está familiarizado con el cuerpo finito ::Zp de los enteros módulo un número primo p (véase la página 18). Consideremos el espacio vectorial tridimiensional X sobre ::Zp. A partir de X construimos el siguiente grafo Gp . Los vértices de Gp son los subespacios de dimensión 1 [v] := {Av I A E ::Zp}, donde O i= v E X, Y dos de estos subespacios [v], [w] están conectados por una arista si

(v, w) =

+ V2W2 + V3W3 = O. vector i= O escojamos del

V1Wl

Obsérvese que no importa qué subespacio. En lenguaje geométrico, los vértices son los puntos del plano proyectivo sobre ::Zp, y [w] es adyacente a [v] si w está en la recta polar de v. Como ejemplo, el grafo G 2 no contiene 4-ciclos y tiene 9 aristas, cerca de la cota de 10 dada por (6). Veamos que esto es cierto para cualquier primo p. En primer lugar demostraremos que Gp no tiene ningún C4 . Si [u] es un vecino común de [v] y [w], entonces u es solución del sistema lineal

+ V2 Y + V3 Z W1X + W2Y + W3Z Vl x

(0,0,1)

=

°

=

O.

Como v y w son linealmente independientes, sabemos que el subespacio de soluciones tiene dimensión 1 y, por tanto, que el vecino común [u] es único. Nos preguntamos ahora cuántos vértices tiene Gp , y hacemos otra vez doble recuento. X contiene p3 - 1 vectores i= O. Como cualquier subespacio de dimensión uno contiene p - 1 vectores i= O, deducimos que X tiene un total de p:~; = p2 + p + 1 subespacios de dimensión uno, es decir, G tiene n = p2 + p + 1 vértices. De forma similar, cualquier subespacio de dimensión dos contiene p2 - 1 vectores i= O y, por tanto, P:~ll = p + 1 subespacios de dimensión uno. Nos falta por determinar el número de aristas de Gp o, lo que es equivalente gracias a (4), los grados de los vértices. Según la construcción de G p , los vértices adyacentes a [u] son las soluciones de la ecuación

p

(7)

El conjunto de soluciones de (7) es un subespacio de dimensión dos y, por tanto, hay p + 1 vértices adyacentes a [u]. Pero cuidado, es posible que el mismo u sea solución de (7) y, en tal caso, hay sólo p vértices adyacentes a [u].

(1,0, O)

(1,1,0)

(0,1, O)

El grafo G 2 : sus vértices son las siete temas (x, y, z) no nulas.

El principio del palomar y el doble recuento

146

En resumen, hemos obtenido el siguiente resultado: si u está en la cónica dada por x2 + y2 + Z2 = O, entonces d([u]) = p, y en el resto de los casos d([u]) = p + 1. Por tanto, debemos detenmnar la cantidad de subespacios de dimensión uno que hay en la cónica X2

+ y2 + Z2

=

O.

Demostraremos el siguiente resultado dentro de un momento.

Afirmación. Hay exactamente p2 soluciones (x, y, z) de la ecuación x2 +y2 + Z2 = Oy, por tanto, ignorando la solución (O, O, O), exactamente ~~} = p

+ 1 vértices de grado p en G p .

Esto nos penmte completar el análisis de G p . Hay p + 1 vértices de grado p y, por tanto, (p2 + p + 1) - (p + 1) = p2 vértices de grado p + 1. Utilizando (4) obtenemos (p + l)p p2(p + 1) (p + 1)2p IEI + 2 2 2 = (p

V

+ l)p

Haciendo n = p2

(1 + (2p + 1)) = p2+ P (1 + 4p2 + 4p + 1). 4 4 .

+ p + 1, la última ecuación queda

IEI

=

n-1 -4- (1

+ v4n -

3),

que está muy cerca de la cota de (6).

o A=

1 1 O 1 1 1 O O 1 O O O O

1 1 1 O O O O 1 O O 1 O O 1

La matriz de G 2

O 1 O O 1 O 1

O O 1 O O 1 1

O O O 1 1 1 O

Vamos ahora con la demostración de la afirmación. El siguiente argumento es una hermosa aplicación del álgebra lineal que involucra a las matrices simétricas y sus autovalores. Nos encontraremos con el mismo método en el capítulo 34, y no por casualidad: las dos demostraciones proceden del mismo artículo de Erd6s, Rényi y Sós. Igual que antes, representamos los subespacios de dimensión uno de X por vectores VI, V2, ... , V p 2+p +I, de forma que dos cualesquiera de ellos son linealmente independientes. De manera similar, podemos representar los subespacios de dimensión dos con el mismo conjunto de vectores, de forma que el subespacio correspondiente a u = (UI, U2, U3) es el conjunto de soluciones de la ecuación UIX + U2Y + U3Z = O igual que en (7). (Por supuesto, esto es simplemente el principio de dualidad en álgebra lineal.) Por tanto, según (7), un subespacio de dimensión uno representado por Vi está contenido en el sub espacio de dimensión dos representado por V j si y sólo si (Vi, V j) = O. Consideremos la matriz A = (aij) de tamaño (p2 + p + 1) X (p2 + p + 1), definida de la siguiente forma: las filas y columnas de A corresponden a VI, ... , V p 2+p+l, utilizando la misma numeración para filas y columnas, y

a .. . 'J

.

={1

=0,

si (Vi,Vj) O en otro caso.

Por tanto, A es una matriz real simétrica y aii = 1 si (Vi, Vi) = O, es decir, precisamente cuando Vi está en la cónica x 2 + y2 + z2 = O. Ahora todo lo que queda por demostrar es que traza A

p+l.

El principio del palomar y el doble recuento

147

Del álgebra lineal sabemos que la traza es a la suma de los autovalores. y aquí viene el truco: aunque A parece complicada, la matriz A 2 es fácil de analizar. Nos serán útiles las siguientes observaciones: e Todas las filas de A tienen exactamente p + 1 unos. De aquí se deduce que p + 1 es un autovalor de A, ya que Al = (p + 1)1, donde 1 es el vector formado por unos. @

Para dos filas cualesquiera Vi, Vj hay exactamente una columna con un 1 en ambas filas (la columna conespondiente al único subespacio generado por Vi, Vj).

Utilizando estas observaciones obtenemos

1 p+1

pI

+

J,

donde I es la matriz identidad y J es la matriz formada enteramente por unos. Ahora bien, J tiene los autovalores p2 + p + 1, de multiplicidad 1, y O, de multiplicidad p2 + p. De aquí se deduce que los autovalores de la matriz A 2 son p2 + 2p + 1 = (p + 1)2 con multiplicidad 1 y p con multiplicidad p2 + p. Como A es real y simétrica, es diagonalizable y, por tanto, A tiene el autovalor p + 1 ó -(p + 1) Y p2 + p autovalores ±y'P. Según la observación 1 anterior, el primer autovalor debe ser p + 1. Supongamos que y'P tiene multiplicidad T y que -y'P tiene multiplicidad s, entonces traza A = (p

+ 1) + Ty'P -

sy'P.

y hemos terminado: como la traza es un entero, debe ocurrir que T = tanto, traza A = p + 1.

S

y, por

O

En 1911, Luitzen Brouwer publicó su famoso teorema del punto fijo: Toda función continua f: En ------7 En de una bola n-dimensional en sí misma tiene un punto fijo (algún x E En tal que f (x) = x). Para dimensión 1, es decir, para un intervalo, este resultado es una consecuencia sencilla del teorema de Bolzano, pero para dimensiones superiores la demostración de Brouwer necesita henamientas más sofisticadas. La sorpresa fue general cuando en 1928 el joven Emanuel Spemer (tenía entonces 23 años) encontró un sencillo resultado combinatorio del que se pueden deducir tanto el teorema del punto fijo de Brouwer como la invariancia de la dimensión bajo aplicaciones biyectivas continuas. Más aún, el ingenioso lema de Spemer vino acompañado de una demostración igualmente hermosa - simplemente doble recuento. Presentamos el lema de Spemer, y el teorema de Brouwer que se deduce de él, para el primer caso interesante, es decir, para dimensión n = 2. El lector

148

El principio del palomar y el doble recuento no debería tener dificultades para extender las demostraciones a dimensión arbitraria (por inducción sobre la dimensión). 3

Los triángulos que tienen los vértices de tres colores distintos aparecen sombreados

3

2 /

---0-------

Lema de 'n."....'''.. Supongamos que un triángulo "grande" con vértices V 2 , V3 es triangulado (es decir, descompuesto en un número finito de triángulos "pequeños" pegados por sus aristas). Supongamos que asociamos a cada vértice de la triangulación un "color" del conjunto {1, 2, 3} de forma que Vi recibe el color i (para cada i), y que sólo los colores i y j son utilizados para los vértices de la arista que va de a Vi (para i i= j), mientras que los vértices interiores son coloreados de forma arbitraria con 1, 2 o 3. Entonces en la triangulación debe encontrarse algún triángulo pequeño "trescoloreado ", es decir, que tiene los tres vértices de colores distintos. • Demostración. Probaremos un resultado aún más fuerte: el número de triángulos tres-coloreados no sólo es distinto de cero, sino que es siempre impar. Para ello, consideremos el grafo dual de la triangulación, pero no tomamos todas sus aristas, sino sólo las que cruzan una arista que tiene extremos con los colores (distintos) 1 y 2. De esta forma, obtenemos un "grafo dual parcial" que tiene grado 1 en todos los vértices que corresponden a triángulos tres-coloreados, grado 2 en los que corresponden a triángulos en los que sólo aparecen los colores 1 y 2, Y grado O en los que corresponden a triángulos en los que falta alguno de los colores 1 y 2. Por tanto, sólo los triángulos tres-coloreados dan lugar a vértices de grado impar (de grado 1). Sin embargo, el vértice del grafo dual que corresponde al exterior de la triangulación tiene grado impar: en efecto, a lo largo de la arista completa que va de V1 a V2 hay un número impar de cambios entre 1 y 2. Pero entonces hay un número impar de aristas del grafo dual parcial que cruzan esta arista, mientras que en las otras aristas del triángulo grande no pueden aparecer los colores 1 y 2 a la vez. Como el número de vértices de grado impar en cualquier grafo finito es par (según la ecuación (4», hemos demostrado que el número de triángulos pequeños que tienen tres colores distintos (y que corresponden a los vértices interiores del grafo dual de grado impar) es impar. O Utilizando este lema es sencillo demostrar el teorema de Brouwer.

• Demostración del teorema del punto fijo de Brouwe:r n = 2). Sea 6. el triángulo de ]R3 con vértices el = (1, O, O), e2 = (0,1, O) Y e3 = (O, 0,1). Es suficiente demostrar que cualquier aplicación continua f: 6. - + 6. tiene un punto fjo, ya que 6. es homeomorfo a la bola de dimensión dos, B 2 . Sea 6(T) la longitud de la arista más larga en una triangulación T. Es sencillo construir una sucesión infinita de triangulaciones 'h, 72, ... de 6. tales que la sucesión 15(~) tiene límite O. Una sucesión así se puede construir explícitamente o utilizando inducción, tomando por ejemplo ~+l como la subdivisión baricéntrica de ~. Para cada una de estas triangulaciones, definimos una 3-coloración de sus vértices v haciendo A(V) := min{i : f(V)i < Vi}, es decir, A(V) es el menor

El principio del palomar y el doble recuento Suponiendo índice i tal que la i-ésima coordenada de f (v) - v es que f no tiene puntos fijos, esta coloración está bien definida. Para ver esto, obsérvese que todo v E ,0,. está en el plano Xl + X2 + X3 = 1 y, por tanto, ¿i Vi = 1. Entonces, si f (v) =1= v, al menos una de las coordenadas de f (v) - v debe ser negativa (y al menos una debe ser positiva). Veamos que esta coloración verifica las condiciones del lema de Spemer. En primer lugar, hay que asignar el color i al vértice ei, ya que la única componente de f (ei) - ei que puede ser negativa es la i-ésima. Además, si v está en la arista opuesta a ei, entonces Vi = O y, por tanto, la i-ésima componente de f (v) - v no puede ser negativa, de donde se deduce que a v no se le asigna el color i. El lema de Spemer dice ahora que en cada triangulación ~ hay un triángulo 3-coloreado, es decir, existe un triángulo {V k :l , V k :2 , v k :3 } para el que A( v k :i ) = i. La sucesión de puntos (v k :l h>l puede no ser convergente, pero del hecho que el símplice ,0,. es compacto podemos deduir que existe alguna subsucesión convergente. Tras reemplazar la sucesión de triangulaciones ~ por la subsucesión correspondiente (a la que, por simplicidad, también denotamos por ~) sabemos que que (V k :l h converge a un punto v E ,0,.. Ahora bien, la distancia de v k :2 y V k :3 a v k :l es menor o igual que el tamaño de la triangulación o(~), que tiende a O. Por tanto, las sucesiones (V k :2 ) y (v k :3 ) convergen al mismo punto v. ¿Qué sabemos de f( v)? La primera coordenada f( v k :l ) es menor que la de v k :l para todo k. Como f es continua, se deduce que la primera coordenada de f (v) es menor o igual que la de v. El mismo razonamiento es válido para la segunda y tercera coordenadas. Por tanto, ninguna de las coordenadas de f (v) - v es positiva - y ya hemos visto que esto entra en contradicción con D la suposición de que f (v) =1= v.

[1] L. E. J. BROUWER: Über Abbildungen von Mannigfaltigkeiten, Math. Annalen 71 (1912), 97-115. [2] W. G. BROWN: On graphs that do not contain a Thomsen graph, Canadian Math. Bull. 9 (1966), 281-285. [3] P. ERDÓS, A. RÉNYI & V. SÓS: On a problem ofgraph theory, Studia Sci. Math. Hungar. 1 (1966), 215-235. [4] P. ERDÓS & G. SZEKERES: A combinatorial problem in geometry, Compositio Math. (1935), 463-470. [5]

s. HO~TEN & W. D. MORRIS: The order dimension ofthe complete graph, Discrete Math. 201 (1999), 133-139.

[6] 1. REIMAN: Über ein Problem von K. Zarankiewicz, Acta Math. Acad. Sci. Hungar. 9 (1958), 269-273. [7] J. SPENCER: Minimal scrambling sets of simple orders, Acta Math. Acad. Sci. Hungar. 22 (1971), 349-353. [8] E. SPERNER: Neuer Beweis für die lnvarianz der Dimensionszahl und des Gebietes, Abh. Math. Sem. Hamburg 6 (1928), 265-272. [9] W. T. TROTTER: Combinatorics and Partially Ordered Sets: Dimension Theory, John Hopkins University Press, Baltimore and London 1992.

149

En este capítulo nos ocupamos de un tema básico de la combinatoria, en concreto de las propiedades y tamaños de familias especiales F de subconjuntos de un conjunto finito N = {l, 2, ... , n}. Comencemos con dos clásicos del área: los teoremas de Spemer y de Erdos-Ko-Rado. Estos resultados tienen en común que fueron demostrados de nuevo muchas veces, y cada uno de ellos dio origen a una nueva rama de la teoría de conjuntos combinatoria. Para ambos, la inducción parece ser el método natural, pero los argumentos que vamos a presentar son bastante distintos, y verdaderamente geniales. En al año 1928 Emanuel Spemer planteó y respondió la siguiente pregunta: supongamos que tenemos un conjunto N = {l, 2, ... , n}. Se dice que una familia F de subconjuntos de N es una anticadena si ningún conjunto de F contiene a otro conjunto de la familia F. ¿Cuál es el tamaño de la anticadena más grande? Claramente, la familia Fk de todos los conjuntos de cardinal k es una anticadena, y IFk I = G). Considerando el máximo de los coeficientes binomiales (véase la página 12) concluimos que existe una anticadena de tamaño (Ln/2j) = maXk (~). El teorema de Spemer asegura que no existen anticadenas más largas. Teorema 1. El tamaño de la anticadena más grande de un conjunto de n elementos es (Ln/2j)' • Demostración. Entre las muchas demostraciones existentes, la siguiente, debida a David Lubell, es probablemente la más corta y elegante. Sea F una anticadena arbitraria. Tenemos que demostrar que IFI :S (Ln/2j)' Para ello, la idea clave es considerar cadenas de subconjuntos 0 = G o e G 1 e ... e Gn = N, donde IGil = i para i = O, ... , n. ¿Cuántas cadenas hay? Es claro que obtenemos una cadena añadiendo uno a uno los elementos de N y, por tanto, existen tantas cadenas como permutaciones de N, es decir, nI. A continuación, dado un conjunto A E F nos preguntamos en cuántas de estas cadenas aparece. De nuevo, la respuesta es sencilla. Para ir desde 0 hasta A hay que añadir de uno en uno los elementos de A, y para ir desde A hasta N tenemos que añadir los elementos restantes. Por tanto, si A tiene k elementos, considerando todos estos pares de cadenas concatenadas vemos que hay k! (n - k)! cadenas que contienen a A. Obsérvese que ninguna cadena puede contener dos conjuntos distintos A y B de F, ya que F es una anticadena. Para terminar la demostración, sea mk el número de subconjuntos de k elementos en F. Entonces, IFI = I:~=o mk. De la discusión precedente, se deduce que el número de cadenas que contienen algún elemento de F es n

L k=O

mkk!(n-k)!,

Emanuel Spemer

Tres teoremas famosos sobre conjuntos finitos

152

y esta expresión no puede superar a ni, la cantidad total de cadenas. Por tanto, se concluye que

k!(n - k)! ~ .L.- mk n.I

n

<

1,

~mk

.L.k=O

k=O

Invitamos al lector a comprobar que la familia de todos los subconjuntos de ~ elementos, cuando n es par, y las dos familias de todos los subconjuntos de n;-l elementos y de todos los subconjuntos de n~l elementos, cuando n es impar, son las únicas anticadenas que alcanzan el tamaño máximo.

o

G)

<

1.

Reemplazando los denominadores por el coeficiente binomial mayor se obtiene es decir, y hemos terminado la demostración.

o

Nuestro segundo resultado es de naturaleza completamente distinta. De nuevo consideramos el conjunto N = {1, ... , n}. Decimos que una familia F de subconjuntos es unafamilia entrecruzada si dos conjuntos cualesquiera de F tienen al menos un elemento en común. Es casi inmediato que el tamaño de la mayor familia entrecruzada es 2n-l. Si A E F, el complementario AC = N\A tiene intersección vacía con A y, por tanto, no puede estar en F. De aquí se concluye que una familia entrecruzada contiene como mucho la mitad de los 2n subconjuntos de N, es decir, IFI :S: 2n-l. Por otra parte, si consideramos la familia de todos los conjuntos que contienen un elemento fijo, por ejemplo la familia Fl de todos los conjuntos que contienen all, entonces IFll = 2n- 1 , y el problema está resuelto. Pero ahora nos hacemos la siguiente pregunta: ¿De qué tamaño puede ser una familia entrecruzada F si todos los conjuntos de F tienen el mismo número de elementos, digamos k? Llamaremos a tales familias familias k-entrecruzadas. Para evitar situaciones triviales, suponemos que n ;::o: 2k, ya que en otro caso dos conjuntos de tamaño k cualesquiera tienen intersección no vacía, y no hay nada que demostrar. Recuperando la idea anterior, consideramos la familia Fl de todos los subconjuntos de k elementos que contienen al 1. Es evidente que los conjuntos de Fl se obtienen añadiendo al 1 todos los subconjuntos de (k - 1) elementos del conjunto {2, 3, ... ,n} y, por tanto, IFll = (~=i). ¿Se puede mejorar esto? No - y esta es la afirmación del teorema de Erdos-KoRado. punto

\

arista

I

Teorema 2. El mayor tamaño de una familia k-entrecruzada en un conjunto de n elementos es (~=i), cuando n ;::o: 2k. Paul Erdos, Chao Ko y Richard Rado demostraron este resultado en 1938, pero no fue publicado hasta 23 años después. Desde entonces se han encontrado muchas demostraciones y variantes pero el siguiente argumento, debido a Gyula Katona, es especialmente elegante .

Una circunferencia e para n = 6. Los segmentos en negrita forman un arco de longitud 3.

• Demostración. La idea clave de la demostración es el siguiente lema, que a primera vista no parece en absoluto relacionado con nuestro problema. Consideremos una circunferencia dividida por n puntos en n segmentos. Decimos que un arco de longitud k está formado por k + 1 puntos consecutivos y los k segmentos entre ellos.

e

Tres teoremas famosos sobre conjuntos finitos

Lema. Sea n :2:: 2k Y

, arcos distintos de cualesquiera tienen un segmento en común Entonces t

153 k tales que dos

"

:s; k,

Para demostrar el lema, obsérvese en primer lugar que cualquier punto de O es extremo de a 'lo más un arco, En efecto, si Ai y Aj tuvieran un extremo común v, entonces tendrían que comenzar en direcciones distintas (ya que son distintos). Pero entonces no podrían tener un segmento en común, ya que n :2:: 2k, Consideremos el arco Al, Como cualquier (i:2:: 2) tiene un es un punto interior de segmento en común con Al, uno de los extremos de Al. Pero acabamos de ver que estos extremos deben ser distintos, y como Al contiene k - 1 puntos interiores, se deduce que hay como mucho k - 1 arcos adicionales y, por tanto, como mucho k arcos en totaL D Vayamos ahora con la demostración del teorema de Erd6s-Ko-Rado, Sea F una familia k-entrecruzada, Consideramos una circunferencia O con n puntos y n segmentos en las condiciones del lema y una permutación cíclica 1f = (al, a2" .. , a n ), y escribimos los números ai en sentido horario alIado de los segmentos de O, ¿Cuántos conjuntos A E F aparecen como k números consecutivos en O? Como F es una familia entrecruzada, según el lema puede haber a lo sumo k conjuntos, Ahora bien, esto es cierto para cualquier permutación cíclica, y como hay (n -1)! permutaciones cíclicas, de esta forma generamos como mucho k(n - 1)! conjuntos de F que aparecen de forma consecutiva en alguna permutación cíclica. ¿Cuántas veces contamos cada conjunto A E F? Muy sencillo: A aparece en 1f si los k elementos de A aparecen de forma consecutiva en algún orden, Como hay k! formas de ordenar los elementos de A, y (n k)! formas de ordenar los restantes elementos, concluimos que un conjunto A aparece exactamente en k!(n - k)! permutaciones cíclicas, de donde se deduce que

IFI :s;

k (n - 1) 1 (n - 1)! (n - 1) k! (n _ k)! = (k - 1)! (n - 1 - (k - 1))! = k _ l '

D

De nuevo, podemos preguntarnos si las familias que contienen un elemento fijo son, las únicas familias k-entrecruzadas, Claramente, esto no es cierto para n = 2k. Por ejemplo, para n = 4 Y k = 2la familia {1, 2}, {1, 3}, {2, 3} también tiene tamaño (~) = 3, En general, para n = 2k obtenemos las familias k-entrecruzadas maximales, de tamaño H~) = incluyendo, para cada par de conjuntos formado por un conjunto A con k elementos y su complementario N\A, uno cualquiera de los dos, Pero para n > 2k las familias que contienen un elemento fijo son, de hecho, las únicas, Invitamos al lector a intentar demostrarlo,

G=D,

Finalmente nos ocupamos del tercer resultado, que puede ser presentado, con bastante fundamento, como el teorema básico más importante de la teoría de conjuntos finitos, el "teorema del matrimonio", demostrado por Philip Hall en 1935, Con él comienza lo que hoy se conoce como teoría de emparejamientos, con amplias aplicaciones, algunas de las cuales se mostrarán a continuación.

Una familia entrecruzada para n k=2

4,

154

Tres teoremas famosos sobre conjuntos finitos finito X y una familia Al, . .. , de Consideremos un tos de X (no necesariamente distintos). Diremos que una sucesión Xl, . .. ,X n es un sistema de representantes distintos de {Al,." ,An} si los Xi son elementos distintos de X, y si Xi E Ai para todo i. Por supuesto, tal sistema, que abreviaremos como SRD, puede no existir (por ejemplo, si uno de los conjuntos Ai es vacío). El teorema de Hall presenta condiciones necesarias y suficientes para que exista un SRD. Antes de presentar el resultado veamos la interpretación por la que es conocido como teorema del matrimonio: consideremos un conjunto {1, ... ,n} de chicas y un conjunto X de chicos. Siempre que X E la chica i y el chico X tienen tendencia a casarse y, por tanto, Ai es el conjunto de posibles parejas de la chica i. Un SRD es una boda múltiple en la que cada chica se casa con un chico que le gusta. De vuelta a los conjuntos, éste es el resultado.

"Una boda múltiple"

Teorema 3. Sea Al, ... , An una familia de subconjuntos de un conjunto finito X. Existe un sistema de representantes distintos si y sólo si la unión de cualesquiera m conjuntos Ai contiene al menos m elementos, para 1 ~ m ~ n. Es evidente que la condición es necesaria: si m conjuntos Ai tienen en total menos de m elementos, entonces estos m conjuntos no pueden ser representados por elementos distintos. Lo sorprendente es que esta condición es también suficiente (esta parte es la que origina multitud de aplicaciones). La demostración original de Hall es bastante complicada, y posteriormente se han encontrado muchas pruebas distintas, de entre las cuales la siguiente (debida a Easterfield y redescubierta por Halmos y Vaughan) parece la más natural. • Demostración. Utilizamos inducción sobre n. Para n = 1 no hay nada que demostrar. Sea n > 1, Y supongamos que {Al, ... , An} satisface la condición del teorema, que abreviamos como (H). Diremos que una familia de f! conjuntos Ai con 1 ~ f! < n es una familia crítica si su unión tiene f! elementos. Hay que distinguir dos casos.

c

Caso 1: No existe ninguna familia crítica.

{B, C, D} es una familia crítica

Escogemos un elemento X E An. Eliminamos X de X y consideramos la familia A~, ... ,A~_l' donde A~ = Ai \ {x}. Como no existe ninguna familia crítica, la unión de cualesquiera m conjuntos de los A~ contiene al menos m elementos. Por tanto, según la hipótesis de inducción existe un SRD Xl, ... , Xn-l de {A~, ... , A~_l} que, junto con x n = x, proporciona un SRD para la familia original.

E

Caso 2: Existe alguna familia crítica. Después de reordenar los conjuntos podemos suponer que {Al, ... , Ac} es una familia crítica. Entonces, U;=l Ai = X, con IXI = f!. Como f! < n, aplicando indu~ción vemos que existe un SRD para Al, ... ,Ac, es decir, los elementos de X se pueden etiquetar como Xl, ... , Xc, de forma que Xi E Ai para todo i ~ f!. Consideremos ahora los restantes conjuntos A C+I ," ., A n , y escojamos m cualesquiera de ellos. Como la unión de Al, ... ,Ac y estos m conjuntos

Tres teoremas famosos sobre conjuntos finitos

155

se deduce que los contiene al menos e+ m elementos según la condición m conjuntos tienen al menos m elementos que no pertenecen a X. En otras palabras, la familia satisface la condición (H). La inducción nos proporcio~a ahora un SRD de AH l, ... ,An formado por elementos que no están en X. Combinándolos con Xl, ... ,XC obtenemos un O SRD para todos los conjuntos Ai. Esto completa la demostración. Como hemos mencionado, el teorema de Hall fue el comienzo de la ahora ampliamente desarrollada teoría de emparejamientos [6]. Una de las muchas variantes nos permite enunciar un resultado particularmente atractivo, que el lector queda invitado a demostrar: Supongamos que los conjuntos Al, ... , An tienen todos tamaño k 2 1 Y supongamos además que ningún elemento está contenido en más de k conjuntos. Entonces existen k sistemas de representantes distintos tales que, para cualquier i, los k representantes de Ai son distintos y forman, por tanto, el conjunto Ai. Un hermoso resultado que debería abrir nuevos horizontes a las posibilidades de matrimonio.

[1] T. E. EASTERFIELD: A combinatorial algorithm, J. London Math. Soco 21 (1946), 219-226. [2] P. ERDÓS, C. Ko & R. RADO: Intersection theoremsfor systems offinite sets, Quart. J. Math. (Oxford), Ser. (2) 12 (1961), 313-320.

[3] P. HALL: On representatives of subsets, J. London Math. Soco 26-30.

10 (1935),

[4] P. R. HALMOS & H. E. VAUGHAN: The marriage problem, Amer. J. Math. 72 (1950),214-215. [5] G. KATONA: A simple proof of the Erdffs-Ko-Rado theorem, J. Combinatorial Theory, Ser. B 13 (1972), 183-184.

[6] L. LovÁsz & M. D. PLUMMER: Matching Theory, Akadémiai Kiadó, Budapest 1986. [7] D. LUBELL: A short proof of Sperner's theorem, J. Combinatorial Theory 1 (1966), 299.

[8] E. SPERNER: Ein Satz über Untermengen einer endlichen Menge, Math. Zeitschrift 27 (1928), 544-548.

¿ Cuántas veces ha de barajarse un mazo de de las cartas sea aleatorio?

para que el orden

Analizar procesos aleatorios es una tarea común, tanto en la vida cotidiana ("¿Cuánto se tarda en llegar al aeropuerto un viernes a las seis de la tarde?") como en las matemáticas. Sin embargo, no se puede esperar obtener respuestas sensatas sin antes formular una pregunta más precisa. En el caso de barajar un mazo de naipes, es necesario especificar:

* el tamaño del mazo (por ejemplo, n

*

=

52 cartas),

cómo se baraja (empezaremos analizando mezclas en las que se coloca la carta más alta en un sitio aleatorio, y después trataremos las más realistas y efectivas mezclas por imbricación (riffle shuffles, en inglés), y

• qué se entiende por "aleatorio" o "casi aleatorio". En este capítulo describiremos un análisis de la baraje por imbricación hecho por Edgar N. Gilbert y Claude Shannon (1955, sin publicar) y Jim Reeds (1981, sin publicar). Seguiremos los pasos del estadístico David Aldous y el antes mago y ahora matemático Persi Diaconis [1]. No llegaremos al resultado final y preciso de que al cabo de 7 mezclas por imbricación una baraja de n = 52 cartas es casi aleatoria, mientras que 6 no son suficientes - pero sí obtendremos una cota superior de 12, y de paso veremos unas ideas muy bellas: las "reglas de detención" y el "tiempo fuertemente uniforme", el lema que enuncia que el tiempo fuertemente uniforme es una cota para la distancia de variación, el lema de inversión de Reeds y, en consecuencia, la interpretación de un baraje como una "ordenación al revés". Al final, reduciremos todo a dos problemas combinatorios muy clásicos, la paradoja de los cumpleaños y el problema del coleccionista. ¡Empecemos pues con ellos!

La

los cumpleaños

Escogemos n personas al azar, por ejemplo los asistentes de una clase o de un seminario. ¿Cuál es la probabilidad de que todos cumplen años en días diferentes? Con las simplificaciones usuales (el año tiene 365 días, no hay variación estacional, no hay gemelos), esta probabilidad es

La tarjeta de visita de Persi Diaconis cuando era mago. En una entrevista posterior dijo: "Si dices que eres profesor en Stanford, la gente te trata con respeto. Si dices que te dedicas a inventar trucos de magia, no te quieren presentar a su hija."

158

Barajando el mazo lo cual es menor que ~ para n = 23 (ésta es precisamente la "paradoja de los cumpleaños"), menor que 9% para n = 42, Y exactamente O para n > 365 (según el principio del palomar; véase el capítulo 22). La formula es fácil de demostrar - escogiendo a las personas en un orden fijo: Si las primeras i personas cumplen años en días diferentes, la probabilidad de que la persona (i + 1) -ésima también lo haga es 1 - 3~5' ya que hay todavía 365 - i días disponibles. De manera similar, al meter n bolas en K cajas de manera independiente y aleatoria, la probabilidad de que ninguna caja reciba más de una bola es

rr (1- ~).

n-l

p(n,K)

=

.

i=l

El problema del coleccionista

I: x

1

S -

(1 -

X)S

=

s~l

I: s~l

s~O

s 1 X - S -

I:

XSS

Los niños coleccionan cromos de estrellas de música (o de fútbol), pero como se venden en sobres cerrados no saben de antemano cuál les tocará. Si hay n cromos diferentes, ¿cuál es el número esperado de sobres que tiene que comprar un niño hasta tener al menos un ejemplar de cada cromo? De manera equivalente, si se seleccionan bolas al azar de una urna que contiene n bolas etiquetadas del 1 al n, y cada vez se vuelven a meter en la urna y se mezclan bien, ¿cuántas bolas hay que tomar en promedio hasta que cada bola haya sido escogida por lo menos una vez? Si en un momento dado ya se han seleccionado k bolas diferentes, entonces la probabilidad de no escoger a continuación una bola nueva es ~. Por tanto, la probabilidad de tener que seleccionar exactamente s bolas hasta dar con una nueva es (~)S-l(l - ~). En consecuencia, el número esperado de veces que hay que seleccionar una bola hasta dar con una nueva es

s~l

L (-nk)S-l(1 - n-k) s

donde en el último paso se suma una serie geométrica (ver página 28).

--k'

1-n

s~l

S~O

1 1- x'

1

=

(véase el margen). Por tanto, el número esperado de bolas que hay que seleccionar para dar con cada una de las n bolas por lo menos una vez es

L

n-l

k=O

n

1 --k

1-n

=

-

n

n

n

n

+- + ... + -2 + -1 n-1

=

nHn

~ nlogn,

usando las cotas para los números armónicos obtenidas en la página 11. Por tanto, la respuesta al problema del coleccionista es que en promedio se habrán de seleccionar aproximadamente n log n bolas. A continuación necesitaremos estimar la probabilidad de que haya que seleccionar un número de bolas significativamente mayor que n log n. Si Vn denota el número de selecciones necesarias (Vn es la variable aleatoria cuyo valor esperado es E[Vnl ~ n log n) entonces, para n 2 1 Y e 2 O, la probabilidad de tener que seleccionar más de m := In lag n + en1bolas es

Barajando el mazo

159

si denota el suceso que en las nrimp.TCl m selecciones no se En escoge nunca la bola con el número i, entonces Se puede demostrar que (1 - ~) n es una función creciente en n que converge a l/e. Por tanto, (1 - ~r < ~ se cumple para todo n 2': 1.

Prob[UAi ] i

n(l- ~)m

< _ e -e .

<

Empecemos ahora con un mazo de n cartas. Las numeramos del 1 al n en el orden en el que están en el mazo, de manera que la carta con el número 1 está por encima de todas, y la "n" por debajo. Denotaremos además al conjunto de todas las permutaciones de 1, ... , n por <5 n . Barajar el mazo equivale a aplicar ciertas permutaciones aleatorias al orden de las cartas. En un caso ideal, esto podría significar que aplicamos permutaciones arbitrarias 7f E <5 n a nuestro orden inicial (1,2, ... , n), cada una con la misma probabilidad 10,. n. Por tanto, después de hacerlo una sola vez ya tendríamos el mazo en el orden 7f = (7f(1), 7f(2), ... , 7f( n)), y este orden sería perfectamente aleatorio. Pero eso no es lo que pasa en la realidad. Cuando barajamos un mazo solamente aplicamos "ciertas" permutaciones, a lo mejor ni siquiera todas con la misma probabilidad, y esto se repite un "cierto" número de veces. Después de esto, tenemos la esperanza de que el mazo esté en un orden por lo menos "casi aleatorio" .

Estrategia 1:

primera carta a un sitio aleatorio

Hacemos lo siguiente: se escoge la carta más alta del mazo, y se inserta en uno de los n posibles sitios, cada uno con probabilidad ;. Aplicamos pues una de las permutaciones siguientes i

JTi

=

(2,3, ... ,i,1,i+1, ...

,n),

para 1 :::; i :::; n. Después de barajar una vez, el mazo aún no será aleatorio, y de hecho habrá que barajar de esta forma muchas veces hasta que sí lo sea. Una sucesión típica de barajes según esta estrategia podría ser (para n = 5): 1 2

3

4 5

I~

I I I I

2

I I I I

3

4 1 5

I~ I I I I

3 2

4 1 5

1\ I I I I

I I I I

2

I~I

2

4

I I I I

4 1

1

5 3

I I I I

5 3

¿De qué manera podríamos expresar matemáticamente que el mazo es "casi aleatorio"? Un medida bastante severa del grado de aleatoridad con la que han dado los probabilistas ella "distancia de variación". Para definirla, empezamos fijándonos en la distribución de probabilidad de las n! ordenaciones diferentes del mazo, o de manera equivalente de las nl diferentes permutaciones (J E <5 n que dan lugar a estas ordenaciones.

La primera carta a un sitio aleatorio

1\1 I I I I

I I I I

4 1

5 3 2

II~ I I I

Barajando el mazo

160 Dos ejemplos son nuestra distribución de

E(id) E( 1T)

1, O

E, dada por

en caso contrario,

y la distribución unifonne U dada por U(1T) =

rb

para toda 1T E 6

n .

La distancia de variación entre dos distribuciones 01 y 02 se define como 1101 - 0211

:=

~

L

101(1T) - 02(1T)1·

1l"E6 n

Definiendo S := {1T E 6 n : 01 (1T) > 02 (1T)} Y utilizando que ¿7r 02(1T) = 1, esta expresión se puede escribir como

¿7r 01 (1T) =

donde Oi(S) := ¿7rES Oi(1T). Es claro que O ::; 1101 - 0211 ::; 1. En lo que sigue, interpretaremos "ser casi aleatorio" como "tener una distancia de variación pequeña a la distribución unifonne." En nuestro caso, la distancia de variación entre la distribución del inicio y la unifonne es casi 1: IIE - UII

=

1-~. n.

Después de barajar una vez la aleatoridad del mazo no ha mejorado mucho: IITop - UII Para los jugadores de cartas, la pregunta esencial no es "¿cómo de aleatorio será el mazo después de barajarlo un millón de veces? ", sino "¿ bastará con 7?" (Aldous & Diaconis [1])

d(k) 1+---......

=

1 - (n~l)!'

Llamaremos Top*k a la distribución de probabilidad en 6 n obtenida al insertar k veces la primera carta en un sitio aleatorio. ¿Cómo se comporta IITop*k - U11 cuando aumenta k, eso es, si barajamos más veces? ¿Y si usamos una estrategia diferente para barajar? La teoría general (en particular, cadenas de Markov en grupos finitos; véase por ejemplo Behrends [3]) implica que para k grande la distancia de variación d(k) := IITop*k - UII se aproxima a O a velocidad exponencial, pero no es capaz de predecir el cambio brusco observado en la práctica: Después de barajar un cierto número ka de veces, "de pronto" d(k) decrece muy deprisa (véase al margen).

Reglas de detención fuertemente uniformes ka

Nuestro análisis se basa en la idea brillante de las reglas de detención fuertemente unifonnes de Aldous y Diaconis. Imaginemos que el director de un casino vigila el proceso de barajar, analizando las pennutaciones que se aplican al mazo, y después de un número de pasos que depende de las pennutaciones que haya visto dice "¡Pare!". En esencia, tiene una regla de detención que finaliza el proceso de barajar y que únicamente depende de las pennutaciones (aleatorias) aplicadas hasta el momento. La regla de detención es fuertemente uniforme si se cumple para todo k ::::: O que:

Si el baraje se detiene tras k pasos, entonces las permutaciones resultantes del mazo se distribuyen (¡exactamente!) de manera uniforme.

Barajando el mazo

161

El número T de pasos que se dan hasta que el su de detención, diga "¡Pare!" es una variable aleatoria. De manera similar, la ordenación del mazo después de barajar k veces viene dada por una variable aleatoria X k (con valores en 6 n ). La regla de detención es fuertemente uniforme si para todos los valores de k se cumple que Prob [X k =

1

1T

I T = k] = -

n!

para todo 1T E 6

n.

Hay tres razones por las cuales estas reglas son interesantes y útiles: l. Efectivamente existen reglas de detención fuertemente uniformes. Es más, en muchos ejemplos son bastante sencillas. 2. Se pueden analizar, y al intentar determinar Prob[T > k] a menudo surgen interesantes problemas combinatorios.

La probabilidad condicionada Prob[AIBl

es la probabilidad del suceso A sabiendo que el suceso B ocurre. Es la probabilidad de que los dos sucesos ocurran, dividido entre la probabilidad de que ocurra el suceso B, esto es, Prob[A I Bl

3. Dan cotas superiores efectivas para las distancias de variación, como por ejemplo d(k) = IITop*k - UII. Por ejemplo, para la estrategia de insertar la primera carta en un sitio aleatorio, una regla de detención fuertemente uniforme es: "PARAR después de que la carta que al principio estuvo debajo del todo (con la etiqueta n) se haya insertado en el mazo por primera vez." En efecto, si seguimos a la carta n mientras barajamos, vemos que durante 1

3

2

2

3 4

T1 todo el proceso el orden de las cartas por debajo de ella es totalmente uniforme. Por tanto, después de que la carta n haya ascendido hasta arriba y se haya vuelto a insertar, el mazo está distribuido uniformemente; la única pega es que no sabemos exactamente cuándo pasa eso (pero el director del casino sí).

Sea ahora Ti la variable aleatoria que cuenta el número de veces que se baraja hasta que haya por primera vez i cartas por debajo de la carta n. Por tanto, tenemos que determinar la distribución de

T = T 1 + (T2 - Td + ... + (Tn _ 1 - T n- 2 ) + (T - Tn-d. Cada sumando corresponde a un problema del coleccionista: Ti - T i - 1 es el tiempo hasta que la carta de arriba se inserta en un posible lugar por debajo de la carta n. Por tanto, también es el tiempo que tarda el coleccionista desde que adquiere el cromo (n - i)-ésimo hasta el (n - i + 1)-ésimo. Sea Vi el numero de cromos comprados hasta que el coleccionista tenga i cromos diferentes. Entonces

4

Prob[A /\ Bl Prob[B]

162

Barajando el mazo Hemos visto que Prob[Ti - T i - 1 = j] = Prob[Vn -i+l - Vn - i = j] para todo i y j. Por ende, el coleccionista y la persona que baraja el mazo según esta estrategia llevan a cabo procesos aleatorios independientes, pero equivalentes; eso sí, en orden inverso (para el coleccionista, finalizar es lo más difícil). Por tanto, la probabilidad de que con esta regla de detención fuertemente uniforme se tarde más de k = In lag n + en l pasos es pequeña:

y esto significa a su vez que, después de barajar insertando la primera carta k = In lag n + en l veces, el mazo es "casi aleatorio" con

Esta última conclusión se sigue del siguiente lema, sencillo pero crucial. Lema. Sea Q : <5 n --------+ lR cualquier distribución de probabilidad que define un proceso de barajar Q*k con una regla de detenciónjuertemente uniforme cuyo tiempo de detención es T. Entonces, para todo k 2 0,

• Demostración. Si X es una variable aleatoria con valores en <5 n Y Q su distribución de probabilidad, podemos escribir Q(5) para la probabilidad de que X tome un valor en 5 ~ <5 n . Así, Q(5) = Prob[X E 5], Y en el caso Q = U obtenemos

U(5)

=

Prob[X E 5] =

~. n.

Para cualquier subconjunto 5 ~ <5n> la probabilidad de que al cabo de k pasos el mazo esté ordenado según una permutación en 5 es Q*k(5)

=

Prob[Xk E 5]

I:: Prob[Xk E 5 /\ T = j] + Prob[Xk E 5 /\ T > k] j9 I:: U(5) Prob[T = j] + Prob[Xk E 5 I T > k] . Prob[T > k] j~k

U(5) (1- Prob[T > k]) + Prob[Xk E 5 I T > k]· Prob[T > k] U(5) + (Prob[X k E 5 I T > k]- U(5)) . Prob[T > k]. Por tanto,

IQ*k(5) - U(5)1 :S Prob[T> k] ya que Prob[Xk E 5 I T > k] - U(5) es una diferencia de probabilidades, y su valor absoluto es como mucho l. Esto completa nuestro análisis de la estrategia de insertar la carta de arriba en un sitio aleatorio. Hemos demostrado la siguiente cota superior para el número de mezclas necesarias hasta que el mazo sea "casi aleatorio".

O

Barajando el mazo

163

de insertar Teorema 1. Sea e 2 OY k := In log n + en l. la primera carta k veces en un sitio aleatorio de un mazo con n cartas, la distancia de variación desde la distribución uniforme cumple

Asimismo, se podría verificar que la distancia de variación d(k) sigue siendo grande si barajamos un número significativamente menor de n log n veces con esta estrategia. La razón es que un número más pequeño no bastará para alterar el orden relativo en las cartas más bajas del mazo. Por supuesto, esta estrategia de barajar es muy ineficaz - usando la cota de nuestra teorema, tenemos que barajar aproximadamente n log n ~ 205 veces hasta mezclar bien un mazo de n = 52 cartas. Por tanto, ahora nos fijaremos en un modelo mucho más interesante y realista de barajar.

Mezclas por imbricación

shuffles)

Esto es lo que el crupier hace en un casino: Toma la baraja, corta en dos partes, y a continuación las entrelaza, por ejemplo dejando caer las partes inferiores de los dos medios mazos de alguna manera irregular. Como antes, esto produce cierta permutación en las cartas del mazo, que suponemos inicialmente etiquetadas del 1 al n, siendo la 1 la de arriba. Las mezclas por imbricación se corresponden exactamente con las permutaciones 7r E 6 n que verifican que la sucesión

(7r(1),7r(2), ... ,7r(n)) está formada por dos sucesiones crecientes entrelazadas (solamente en el caso de la permutación identidad hay una sola permutación), y hay exactamente 2n - n mezclas por imbricación distintas en un mazo de n cartas. O

1

1

O

2

I~

1 1 1

4

3

5

01 01

I~ 11 1 11 1 11

1 2

1 1

3

IX

4

01 11 11 01 11

1 3

4 2

5

5

En efecto, si se parte el mazo cogiendo las t cartas superiores con la mano derecha (O :::; t :::; n) y las n - t cartas restantes con la izquierda, entonces hay (~) maneras de entrelazar las dos manos, y todas ellas generan permutaciones distintas - excepto que para cada t hay una posibilidad de obtener la permutación identidad. No está claro qué distribución de probabilidad se debería asignar a las mezclas por imbricación - no hay una respuesta única, ya que los aficionados y los profesionales barajarán de manera diferente. Sin embargo, el modelo que expondremos a continuación, que fue desarrollado primero por Edgar N. Gilbert y Claude Shannon en 1955 (entonces en el mítico departamento de "Matemáticas de la Comunicación" de los laboratorios Bell), tiene algunas ventajas:

Una mezcla por imbricación

Barajando el mazo

164

es elegante, sencillo y parece e modeliza con fidelidad la manera de barajar de un no profesional y lo podemos analizar. He aquí tres descripciones - todas ellas de la misma distribución de probabilidad Bric en €'in: 1. Bric: €'in ----+ JR; se define mediante n+l

2""

~~

Bric(7I"):= {

si n = id, si n consiste de dos sucesiones crecientes, en caso contrario.

2. Se toman t cartas del mazo en la mano derecha, con probabilidad 2~ (~), y el resto del mazo en la mano izquierda. Ahora, si se tienen r cartas en la mano derecha y 12 en la mano izquierda, se deja caer la carta más baja de la mano derecha con probabilidad r~R' y de la mano izquierda con probabilidad

IJI

Las mezclas por imbricación inversas se corresponden con las permutaciones 71" = (71"(1), ... ,7I"(n)) crecientes, con excepción de a lo sumo un "descenso". (Solamente la permutación identidad no tiene ningún descenso.)

r!R'

A continuación se repite el proceso.

3. En una mezcla inversa, se quitaría un conjunto de cartas del mazo, y se las colocaría encima del resto - respetando el orden relativo en las dos partes del mazo. Tal proceso viene determinado por el subconjunto de cartas que se quitan, eligiéndose todos los subconjuntos con la misma probabilidad. De manera equivalente, se asigna una etiqueta "O" ó "1" a cada carta, aleatoria e independientemente con probabilidad ~, y se mueven las cartas con la etiqueta "O" arriba. Es fácil ver que estas reglas describen la misma distribución de probabilidad. Para (1) ~ (3) obsérvese que obtenemos la permutación identidad justo en el caso en que todas las cartas "O" están por encima de todas las cartas ''1''. Ya hemos definido el modelo. Pero, ¿cómo analizarlo? ¿Cuántas mezclas por imbricación hacen falta para tener un mazo casi aleatorio? No obtendremos la respuesta más precisa posible, pero sí una bastante buena, siguiendo estos tres pasos: (1) Analizar mezclas por imbricación inversas, (2) describir una regla de detención fuertemente uniforme para ellas, (3) y demostrar que la clave para su análisis es ¡la paradoja del cumpleaños!

Teorema 2. Después de k mezclas por imbricación en un mazo de n cartas, la distancia de variación desde una distribución uniforme cumple IIBric*k - UII

~

1- TI (1-

2ik ) '

• Demostración. (1) Analizaremos mezclas por imbricación inversas para ver con qué rapidez nos llevan desde la distribución inicial hacia (o cerca de) la distribución uniforme. Estas mezclas por imbricación inversas se corresponden con la distribución de probabilidad dada por Bric(n) := Bric( n- 1 ).

165

Barajando el mazo

Del hecho que toda permutación U(1T- 1 ), se obtenemos

una inversa

-.-*k

IIBric*k - UII

11

Bric

y de que U(1T)

- UII·

(Esto es el lema de inversión de Reeds.) En cada mezcla por imbricación inversa, a cada carta se le asocia un dígitoOó1:

o1

O:=1==1====:1 1 1 1 1 01:=: : : 4====:1 ~ O1 4 1 :=1==2====: 112 I~ I 1~:=1==3====: 11 3 1 1 2 I~I 4 11 5 1 11 5 :=1=5====: 3 1 . l.

L-......."-----'

1

Si recordamos estos dígitos - por ejemplo, escribiéndolos en las cartas - entonces, después de k mezclas por imbricación inversas, en cada carta aparece una cadena ordenada de k dígitos. Nuestra regla de detención es: "PARAR cuando todas las cartas tengan asignadas cadenas distintas." Cuando esto suceda, las cartas del mazo habrán sido ordenadas según los números binarios bk bk-l ... b2 bl. donde bí es el bit que la carta ha adquirido en la i-ésima mezcla por imbricación inversa. Como estos bits son totalmente aleatorios e independientes, esta regla de detención es fuertemente uniforme. En el siguiente ejemplo para n = 5 cartas, necesitamos T = 3 mezclas inversas hasta parar:

0001 4 0011 2 0101 1 1011 5 1111 3

1 001 4 01 1 1 011 2 1 01 4 1 1 2 -
(3) El tiempo esperado T hasta parar usando esta regla de detención se distribuye como en la paradoja del cumpleaños, para K = 2k: ponemos dos cartas en la misma caja si tienen la misma etiqueta bk bk- 1 ... b2 h E {O,1}k. Por tanto, hay K = 2k cajas, y la probabilidad de que una caja contenga más de una carta es Prob[T> k]

=

1-

TI

(1- 2ik ) ,

lo cual, como hemos visto, acota la distancia de variación 11 Bric*k - U 11 --*k 11

Bric

- UII.

O

¿Cuántas veces tenemos que barajar? Para n grande son aproximadamente k = 2Iog 2 (n) veces: poniendo k := 210g 2 (cn) para algún e 2: 1 hallamos (usando técnicas del análisis) que P[T > k] R::i 1 - e~ R::i 2~2.

Barajando el mazo

166

k

d(k)

1 1.000 2 1.000 3 1.000 4 1.000 5 0.952 6 0.614 7 0.334 8 0.167 9 0.085 10 0.043 La distancia de variación después de k mezclas por imbricación, según [2]

d(k)

Por ejemplo, para n = 52 cartas, las cotas superiores dadas por el teorema 2 son d(10) ~ 0.73, d(12) ~ 0.28, d(14) ~ 0.08 - con lo cual, k = 12 tendría que ser "suficientemente aleatorio" para fines prácticos. Pero en la práctica no barajamos 12 veces - ni hace falta, como muestra un análisis más detallado (véase al margen). El análisis de las mezclas por imbricación es parte de un debate actual y muy vivo acerca del significado de "suficientemente . aleatorio". Diaconis [4] puede servir de guía de los últimos acontecimientos. ¿Es importante este análisis? En efecto, lo es: aún después de tres buenas mezclas por imbricación de una baraja de 52 cartas, el mazo parece bastante aleatorio ... pero no lo es. Martín Gardner [5, capítulo 7] describe algunos impresionantes trucos de cartas basados en el orden escondido en tal mazo.

[1] D. ALDOUS & P. DIACONIS: Shuffling cards and stopping times, Amer. Math.

Monthly 93 (1986), 333-348. [2] D. BAYER & P. DIACONIS: Trailing the dovetail shuffle to its lair, Annals Applied Probability 2 (1992),294-313. 1

7

10

[3] E. BEHRENDS: Introduction to Markov Chains, Vieweg, Braunschweig/ Wiesbaden 2000. [4] P. DIACONIS: Mathematical developments from the analysis oi riffle shuffling, in: "Groups, Combinatorics and Geometry. Durham 2001" (A. A. Ivanov, M. W. Liebeck and J. Saxl, eds.), World Scientific, Singapore 2003, pp. 73-97. [5] M. GARDNER: Mathematical Magic Show, Knopf, New York/Allen & Unwin, London 1977. [6] E. N. GILBERT: Theory oi Shuffling, Technical Memorandum, Bell Laboratories, Murray Hill NJ, 1955.

¿ Suficentemente aleatorio?

Lo esencial de las matemáticas es demostrar teoremas - y por tanto, a ello se dedican los matemáticos: demuestran teoremas. Pero, a decir verdad, lo que realmente quieren demostrar, por lo menos una vez en su vida, es un lema: como el de Fatou en análisis, el lema de Gauss en la teoría de números o el lema de Bumside-Frobenius en combinatoria. Ahora, ¿qué convierte una afirmación matemática en un verdadero lema? En primer lugar, debería ser aplicable a una gran variedad de circunstancias, incluso a problemas sin conexión aparente. En segundo lugar, la afirmación debería ser completamente obvia - una vez vista. Al lector hasta le podría dar una leve envidia: ¿por qué yo no he observado esto antes? Y por último, en un nivel estético, ¡tanto el lema como su demostración deberían ser bellos! Aquí veremos un ejemplo de razonamiento matemático de estas características, un lema de recuento que apareció por primera vez en 1972, en un artículo de Bemt Lindstrbm. Aunque en ese entonces pasó desapercibido, en 1985 se convirtió de golpe en un clásico, cuando Ira Gessel y Gerard Viennot lo redescubrieron y demostraron en un artículo maravilloso cómo puede aplicarse a una gran diversidad de difíciles problemas de enumeración combinatoria. Partimos de la representación del determinante de una matriz mediante permutaciones. Sea M = (mij) una matriz n x n con elementos reales. Entonces det M

=

L

sign (J"

mlo-(l) m2o-(2) ... mnu(n) ,

(1)

o-

donde (J" recorre todas las permutaciones de {1, 2, ... , n}, y la signatura de (J" es 1 ó -1, dependiendo de si (J" es el producto de un número par o impar de transposiciones. Ahora construimos un grafo, más exactamente un grafo bipartito dirigido con pesos. Este grafo tendrá vértices Al, ... ,An representando las filas de M, Y vértices El, ... ,En para las columnas. Para cada par (i, j) dibujamos una flecha de Ai a E j , Y le damos el peso mij (véase la figura). En términos de este grafo, la fórmula (1) tiene la siguiente interpretación: €II

€II

El primer miembro es el determinante de la matriz de caminos M, cuya entrada (i, j) es el peso del (único) camino dirigido de Ai a Ej. El segundo miembro es la suma ponderada (con signo) sobre todas las familias de caminos disjuntos en vértices desde A = {Al, ... , An} hasta B = {El, ... , En}. Tal familia Po- viene dada por los caminos

m1l

m nn

retículas y determinantes

168

y el peso de la familia de caminos Pu es el Prc)ducto de los pesos de los caminos individuales:

Mediante esta interpretación, podemos escribir (1) como detM =

Un grafo dirigido acíclico

L

signCTw(Pu )'

y ¿cuál es el resultado de Gessel y Viennot? Es la generalización natural de (1) de grafos bipartitos a grafos arbitrarios. Es exactamente este paso el que permite aplicar el lema en tantos contextos distintos - y su demostración es sumamente sencilla y elegante. Empecemos revisando los conceptos necesarios. El objeto básico es un grafo finito dirigido acíclico G = (V, E), lo cual quiere decir que en G no hay ciclos dirigidos. En particular, entre dos vértices cualesquiera A y B sólo hay un número finito de caminos dirigidos, donde también consideramos los caminos triviales A -+ A de longitud O. Cada arista e tiene el peso w(e). Si P es un camino dirigido de A a B, que escribiremos P : A -+ B, se define el peso de P como w(P) := w(e). eEP

Si P es un camino de longitud O, se define que w(P) = 1. Denotamos ahora por A = {Al, ... , An} YB = {Bl, ... , Bn} dos conjuntos de n vértices, donde A y B no son necesariamente disjuntos. Asociamos a A y B la matriz de caminos M = (mij) con

L

w(P).

P:Ai--+Bj

Una familia de caminos P de A a B está formado por una permutación CT junto con n caminos Pi : Ai -+ Bu(i), para i = 1, ... , n; además, escribiremos sign P = sign CT . El peso de P es el producto de los pesos de los caminos,

rr n

w(P)

=

w(Pi ),

(2)

i=l

es decir, el producto de los pesos de todas las aristas de la familia de caminos. Finalmente, diremos que la familia de caminos P = (Pi, ... ,Pn ) es disjunta en vértices si, para cada par de caminos en P, sus conjuntos de vértices son disjuntos.

Lema. Sea G = (V, E) un grafo finito dirigido acíclico y ponderado, y sean A = {Al, ... , An} y B = {B l , ... , Bn} dos conjuntos de n vértices y M la matriz de caminos de A a B. Entonces signP w(P).

detM P familia de caminos disjuntos en vértices

(3)

um",u'~,

retículas y determinantes

169

_Demostración. Unsumando lo cual se puede escribir como

dedet(M) es sign(J

mlo-(l)'" mno-(n),

Sumando sobre (J podemos deducir de (2) que

det M

L sign P w(P),

=

P

donde P recorre todos las familias de caminos de A a E, sean disjuntos en vértices o no. Por tanto, para llegar a (3), sólo hace falta demostrar que

L

signP w(P) =

(4)

O,

PEN

donde N es el conjunto de todos las familias de carninos no disjuntos en vértices, y ello lo lograremos mediante un argumento de singular belleza. Daremos una involución 1T : N ----; N (sin puntos fijos) tal que para P y 1TP

W(1TP)

=

w(P)

sign 1TP

y

=

-sign P .

Claramente, esto implicará (4), y por tanto la fórmula (3) del lema. La involución 1T se define de manera muy natural. Sea P E N con caminos Pi :Ai ----; Bo-(i)' Por definición, algunos pares de caminos se intersecarán. @

@!

@!

Sea io el mínimo índice tal que otro camino.

Pio

tiene un vértice en común con algún

Sea X el primero de tales vértices en el camino

P io '

Sea jo el mínimo índice (jo> i o) tal que Pjo tiene el vértice X en común con Pio'

Construimos la nueva familia 1TP = (Pi, . , . ,P~) de la manera siguiente: @!

@

Sea P~

=

Pk para todo k =1- io, jo.

El nuevo camino Pio va de Aio a X pasando por P io ' Y a continuación sigue a Bo-(jo) a lo largo de P jo . De manera similar, Pjo va desde Ajo hasta X a lo largo de P jo y sigue hasta Bo-(io) a lo largo de Pio'

Claramente 1T(1TP) = P, ya que el índice i o, el vértice X, y el índice jo son los mismos que antes. En otras palabras, al aplicar 1T dos veces volvemos a los caminos Pi de antes. Ahora, ya que 1TP y P usan exactamente las mismas aristas, tenemos ciertamente que W(1TP) = w(P). Y por último, puesto que la nueva permutación (JI se obtiene componiendo (J con la transposición (io, jo), deducimos que sign 1TP = -sign P , y hemos terminado la demostración. D Se puede usar el lema de Gessel-Viennot para deducir todas las propiedades básicas de los determinantes, simplemente estudiando los grafos apropiados. Consideremos a continuación un ejemplo especialmente llamativo, la fórmula de Binet-Cauchy, que proporciona una generalización muy útil de la regla del producto para determinantes.

170

nw"m,l<'

retículas y determinantes

Teorema. Sean r ::; s, P una matriz r x s y Q una matriz s x det(PQ)

=

entonces

T,

~)detPz)(detQz),

z donde Pz es la submatriz (r x r) de P cuyas columnas están indexadas por el conjunto Z, y Q z la submatriz (r x r) deQ cuyas filas están indexadas por Z.

Pik

Pil

• Demostración. Como antes, haremos corresponder a la matriz P el grafo bipartito en A y B, Y de manera similar a Q el grafo bipartito en B y C. Consideramos ahora el grafo concatenado de la figura de la izquierda. Podemos observar que la entrada mij de la matriz M de caminos desde A hasta C es precisamente mij = I: k Pik qkj ; por tanto, M = PQ. Las familias de caminos disjuntos en vértices desde A hasta C en el grafo concatenado se corresponden con pares de familias desde A hasta Z, y desde Z hasta C. Por tanto, el resultado se sigue de manera inmediata del lema, observando que sign (en) = (sign a") (sign T). O El lema de Gessel-Viennot da lugar a muchos resultados que relacionan los determinantes con propiedades enumerativas. La receta es siempre la misma: hay que interpretar a la matriz M como una matriz de caminos, e intentar calcular el segundo miembro de (3). Como ilustración, he aquí el problema original estudiado por Gessel y Viennot, que les llevó a su lema: Sean al < az < ... < a n y bt < b2 < ... < bn dos sucesiones de números naturales. Se pide calcular el determinante de la matriz M = (mij), donde mij es el coeficiente binomial (~i). J

1 1 1 1 1 1 1 1

1 2 3 4

5

6 7

Dicho de otro modo, Gessel y Viennot consideraron los determinantes de todas las submatrices cuadradas del triángulo de Pascal, por ejemplo de la matriz 1

(i) @ (~)

3

1 6 4 1 10 10 5 1 15 20 15 6 21 35 35 21

a=3

b=4

det 1 7

1

(

(i) (~) (!) (~)

(~)

(~)

)

1 4 20

~

15

)

,

definida por las entradas en negrita del triángulo de Pascal del margen. Como primer paso para resolver este problema recordaremos un resultado conocido que relaciona los coeficientes binomiales con los caminos en una retícula. Consideramos una retícula a x b como en el margen. Entonces, el número de caminos desde la esquina inferior izquierda hasta la esquina superior derecha, donde los únicos pasos permitidos son hacia arriba (norte) y hacia la derecha (este), es (a!b). La demostración de este hecho es fácil: cada camino está formado por una sucesión arbitraria de b pasos hacia el "este" y a pasos hacia el "norte", y por tanto se puede representar por una sucesión de la forma NENEEEN, que está formado por a + b letras, de las cuales haya letras N y b letras E. El número de tales cadenas es el número de maneras de elegir a posiciones de letras N de un total de a + b posiciones, lo cual es (a!b) = (at b).

-'u,w.","' ....

retículas y determinantes

171

Ahora consideramos la de la uv'.vvuu, en la cual está en el (O, -ai) Y Ej en el punto (b j , -bj ). El número de caminos de Ai hasta Bj en esta retícula que usan solamente pasos al norte y 'al este es, como hemos visto, (bj+(~~-bj)) = (~i). Dicho de J. J otra manera, la matriz de coeficientes binomiales M es exactamente la matriz de caminos de A a B en el grafo reticular dirigido en el cual todas las aristas tienen peso 1, y están dirigidas al norte o al este. Por tanto, podemos aplicar el lema de Gessel-Viennot para calcular det M. Una breve reflexión muestra que toda familia de caminos disjunto en vértices P de A a B está necesariamente compuesta de caminos Pi : Ai ---+ Ei para todo i. En consecuencia, la única permutación posible es la identidad, que tiene signatura 1. Hemos obtenido el bello resultado de que det (

(~;))

=

#

familias de caminos disjuntos en vértices de A a B.

Al

Ai

~

Bn ~

~

~

~

lO

lO

An

En particular, de esto se sigue el hecho no trivial que det M es siempre no negativo, ya que el segundo miembro de la igualdad cuenta algo. Además, el lema de Gessel-Viennot implica que det M = O si Y sólo si ai < bi para algún i. En n~estro ejemplo de antes tenemos

m (i) (i) (!) mmm (D G)

det (

)

~~

#

familias de caminos disjuntos en vértices en

3

4

~3 ~4

~

6

,)

"Caminos en retículas"

~

~

172

Lu:rrunu,,'.

retículas y detenninantes

[1] l. M. GESSEL & G. VIENNOT: Binomial determinants, paths, and hook length formulae, Advances in Math. 58 (1985), 300-321. [2] B. LINDSTRÓM: On the vector representation ofinduced matroids, Bulletin London Math. Soco 5 (1973), 85-90.

Una de las fórmulas más bellas de toda la combinatoria enumerativa es la del número de árboles etiquetados. Consideramos el conjunto N = {1, 2, ... ,n}. ¿Cuántos árboles diferentes podemos construir usando estos vértices? Sea T n su número. La enumeración "a mano" nos da T 1 = 1, T 2 = 1, T 3 = 3 Y T4 = 16, Y mostramos estos árboles a continuación: 1

• 1

2

3

1

3 212

3 1

2

1

2

1

2

3

4

3

434

1

2

3

434

343

4

3

4

3

4

3

4

1

2

1

2

1

212

1

2

3

4

343

4

3

4

3

4

3

4

1

1

2

2

Nótese que consideramos árboles etiquetados. Por tanto, aunque solamente hay un árbol con tres vértices en el sentido de isomorfismo de grafos, al marcar el vértice interior con 1, 2 ó 3 obtenemos tres árboles etiquetados distintos. Para n = 5 hay tres árboles no isomorfos (sin etiquetar):

5 Para el primer árbol es claro que hay 5 etiquetados diferentes, y para el segundo y tercero hay %l = 60 etiquetados - con lo cual = 125. Esto ya tendría que ser suficiente para conjeturar que T n = nn-2, y este es precisamente el resultado de Cayley.

n

Teorema. Hay nn-2 árboles etiquetados diferentes con n vértices. Esta fórmula tan bella da lugar a demostraciones igualmente bellas, que usan gran variedad de técnicas algebraicas y combinatorias. Esbozaremos tres de ellas antes de presentar la demostración que hasta la fecha sigue siendo la más bonita de todas . • Primera demostración (Biyección). El método más clásico y directo es encontrar una biyección del conjunto de todos los árboles con n vértices con otro

Arthur Cayley

La fórmula de Cayley para el número de árboles

174

conjunto del cual se sabe que tiene nn-2 elementos. De manera podemos pensar en el conjunto de todas las sucesiones ordenadas (al, ... , a n -2) con 1 ::; ai ::; n. Por tanto, queremos codificar unívocamente a cada árbol T por una sucesión (al . .. ,an -2). Tal codificación fue hallada por Prüfer, y aparece en la mayoría de los libros sobre teoría de grafos. AquÍ queremos presentar otra demostracÍón por biyección, encontrada por Joyal, que es menos conocida pero de igual elegancia y sencillez. Para ello, no consideramos solamente árboles t con vértices en N = {l, ... , n}, sino tales árboles junto con dos vértices distinguidos, el extremo izquierdo O y el extremo derecho O, que pueden coincidir. Sea In = {(t; O, O)} este nuevo conjunto. Entonces, claramente, IInI = n 2 T n .

Los cuatro árboles de T2

Nuestra meta es por tanto probar que IIn I = n n. Ahora, hay un conjunto cuyo tamaño sabemos que es nn, el conjunto NN de todas las aplicaciones de N en N. Podemos pues probar nuestra fórmula si encontramos una biyección entre NN y 4,. Sea 1 : N ------+ N cualquier aplicación. Dibujando flechas de i a l(i), podemos representar 1 como un grafo dirigido J. Por ejemplo, representamos la aplicación

a

4

7

1-------tl---~lO

e-___-----. 6

2

9

~

1= (

~

2

3

5

5

4 9

8 8

7 5

6 2

5 1

9 4

l~

)

por el grafo dirigido que aparece al margen. Fijémonos en una componente conexa de OJ. Ya que hay exactamente una arista que sale de cada vértice, la componente contiene el mismo número de vértices y aristas, y por tanto exactamente un ciclo. Sea NI ~ N la unión de los conjuntos de vértices de dichos ciclos. Un momento de reflexión muestra que M es el único subconjunto maximal de N tal que la restricción de 1 a M es una biyección en M. Escribimos

11M

=

(l(a)

ltb)

l(z) ),

de manera que los números a, b, ... , z en la primera fila aperecen en su orden natural. Esto proporciona una ordenación l(a), l(b), ... , l(z) del conjunto M = {a, b, ... ,z} de acuerdo con la segunda fila, en la cual el extremo izquierdo es 1(a) y el extremo derecho 1(z). Podemos construir el árbol t correspondiente a la aplicacion 1 como sigue: Dibujamos 1(a), ... , 1(z) en este orden como camino desde 1(a) hasta 1(z), y rellenamos los demás vértices como indica OJ (suprimiendo las flechas). En nuestro ejemplo anterior obtenemos M = {l, 4, 5, 7, 8, 9}, 5

1

6

7 5

8 8

y por tanto el árbol t del margen. Es inmediato cómo invertir esta correspondencia: Dado un árbol t, nos fijamos en el único camino P del extremo izquierdo al extremo derecho. Esto nos da el conjunto M y la aplicación 11M. Las demás correspondencias i -+ 1(i) se O determinan de acuerdo con los caminos únicos entre i y P.

Lafórmula de Cayley para el número de árboles

175

Segunda demostración Podemos pensar en como el número de árboles generadores del grafo completo Kn. Ahora nos fijamos en un grafo arbitrario conexo y simple G en V = {1, 2, ... , n}, y denotamos por t(G) el número de árboles generadores; de esta manera, T n = t(Kn ). El resultado siguiente es el célebre teorema matricial de los árboles de Kirchhoff (véase [1]). Consideramos la matriz de incidencia B = (b ie ) de G, cuyas filas y columnas están etiquetadas, respectivamente, por V y E. Ponemos bie = 1 Ó Osegún i E e o i ti- e. Nótese que IEI 2: n -1, ya que G es conexo. En cada columna reemplazamos de forma arbitraria alguno de los dos '1' por' -1' (en otras palabras, orientamos G de forma arbitraria), y llamamos C a la nueva matriz. Entonces M = C C T es una matriz simétrica (n x n) que contiene los grados dI, ... , d n en su diagonal principal. Proposición. Se cumple que t( G) = det M ii para todo i = 1, ... , n, donde M ii se obtiene de M suprimiendo la fila i-ésima y la columna i-ésima . • Demostración. La clave de la demostración es el teorema de Binet-Cauchy que demostramos en el capítulo anterior: Si P es una matriz (r x 8) y Q una matriz (8 x r), con r :::; 8, entonces det(PQ) es igual a la suma de los productos de los determinantes de todas las submatrices correspondientes de tamaño (r x r), donde "correspondiente" quiere decir que escogemos los mismos índices para las r columnas de P y las r filas de Q. Para M ii , esto quiere decir que det M ii

=

L

det N . det N T

N

=

L

N

(det N)2 ,

donde N recorre todas las submatrices (n - 1) x (n - 1) de C\ {fila i}. Las n - 1 columnas de N corresponden a un subgrafo de G con n - 1 aristas y n vértices, y nos queda por demostrar que

det N

=

{±01

si estas aristas forman un árbol en otro caso.

Supongamos que las n - 1 aristas no forman un árbol. Entonces existe una componente que no contiene a i. Ya que las filas que le corresponden suman O, sabemos que son linealmente dependientes, y por tanto det N = O. Supongamos ahora que las columnas de N engendran un árbol. Entonces existe un vértice JI =1 i de grado 1; sea el la arista incidente. Al suprimir jI, el obtenemos un árbol con n - 2 aristas. Otra vez, hay un vértice 12 =1 i de grado 1 con arista incidente e2. Continuamos de esta manera hasta que hayamos determinado jI, j2, ... ,jn-l Y el, e2, ... , en-l con ji E ei. Ahora permutamos filas y columnas para llevar j k a la fila k-ésima, y ek a la columna k-ésima. Puesto que por construcción jk ~ ee para k < R, vemos que la nueva matriz N' es triangular inferior, y que todos los elementos de la diagonal principal son ±l. Por tanto, det N = ±det N' = ±1, y hemos terminado. Para el caso especial G = Kn es claro que M

ii

= (

n

~/ n ~\ -1

-1

y un cálculo fácil muestra que det M ii

= n n- 2 .

-1 .

)

,

n~1 D

"Un método no estándar para contar árboles: Coloque un gato en cada árbol, pasee su perro, y cuente cuántas veces ladra."

176

Lafónnula de Cayley para el número de árboles

• Tercera demostración Otro método clásico en combinatoria enumerativa es establecer una relación de recurrencia, que después se resuelve por inducción. La siguiente idea se debe esencialmente a Riordan y Rényi. Para encontrar la recursión apropiada, consideramos un problema más general (que ya aperece en el artículo de Cayley). Sea A un subconjunto arbitrario de los vértices con k elementos. Denotamos por Tn,k el número de bosques (etiquetados) con vértices {l, ... ,n} que están formados por k árboles, yen los cuales los vértices de A aparecen en árboles diferentes. Es claro que sólo importa el cardinal del conjunto A, no sus elementos. Nótese que T n ,l = T n .

1

Por ejemplo, T4,2

1 2 3

~

= 8 para A = {l, 2}

k



2

1

2

1

2

1

2

KL:~II 4 3 4 3 4 3 4

3

3

4

3

4

3

4

Consideremos un tal bosque B con A = {1, 2, ... ,k}, y supongamos que 1 es adyacente con í vértices, tal y como se ilustra en el margen. Suprimiendo ell, los í vecinos, junto con 2, ... , k, dan lugar a un vértice cada uno en las componentes de un bosque de k - 1 + í árboles. Ya que podemos (re)construir B fijando primero í, después eligiendo los í vecinos de 1, y a continuación el bosque F\l, tenemos que·

Tn,k

L

n-k (

=

n

~ k ) T n - 1,k-1+i

(1)

.=0 para todo n 2: k 2: 1, donde definimos To,o = 1 y Tn,o Nótese que To,o = 1 es necesario para asegurar Tn,n = 1.

o para n >

O.

Proposición. Se verifica

y por tanto, en particular,

T n,k = k n n-k-1

(2)

• Demostración. Por (1), y usando inducción, encontramos que

Tn,k =

8

n-k (

n~

k) (k -

nn-k _ (n _ k)

1 + í)(n - 1)n-1-k-i

(í--;n-k-í)

~ (n ~ ~ ~ k}n _ 1)i-1

nn-k _ (n _ k) n%r (n -

~-

nn-k _ (n - k)nn-1-k =

kn n- 1- k .

k) (n _ l)i

o

La fórmula de Cayley para el número de árboles

177

• Cuada demostraci6n Obtenemos la fórmula de y su generalización (2), a partir de una idea genial de Jim Pitman sin inducción o biyección - sólo contando astutamente de dos maneras. Un bosque con raíz con vértices en {1, ... ,n} es un bosque junto con una elección de raíz en cada árbol. Sea :Fn,k el conjunto de todos los bosques con raíz que están formados por k árboles con raíz. Por tanto, :Fn,l es el conjunto de todos los árboles con raíz. Nótese que l:Fn,ll = nTn , ya que en cada árbol hay n elecciones para la raíz. Ahora pensamos en Fn,k E :Fn,k como un grafo dirigido con todas las aristas "alejándose" de la raíz. Diremos que un bosque F contiene a otro bosque F' si F contiene a F' como grafo dirigido. Claramente, si F contiene a F' propiamente, entonces F tiene menos componentes que F'. La figura muestra dos bosques de este tipo, con las raÍCes en la parte de arriba. He aquí la idea crucial. Decimos que una sucesión F 1 , ... , F k de bosques una sucesión refinadora si Fi E :Fn,i y Fi contiene a Fi+l para todo i. Sea ahora Fk un bosque fijo en :Fn,k, y denotamos G

por N(Fk ) el número de árboles con raíz que contienen a Fk, y

G

por N* (Fk ) el número de sucesiones refinadoras que acaban en Fk.

2

9

F2 contiene a F3

8

1:

2

Contamos N* (Fk ) de dos maneras distintas, primero empezando en un árbol, yen segundo lugar empezando en Fk. Supongamos que Fl E :Fn,l contiene a Fk. Ya que podemos borrar las k - 1 aristas de Fl \Fk en cualquier orden posible para obtener una sucesión refinadora de Fl a Fk, vemos que

7

4

F3

9

1 10

(3)

Empecemos ahora por el otro lado. Para llegar a un Fk-l desde F k , tenemos que añadir una arista dirigida desde cualquier vértice a hasta cualquiera de las k - 1 raíces de los árboles que no contienen a a (véase la figura a la derecha, donde pasamos de F3 a F 2 añadiendo la arista 3~... ~7). Por tanto, tenemos n( k - 1) elecciones. De manera similar, para Fk-l podemos añadir una arista dirigida desde cualquier vértice b a cualquiera de las k - 2 raíces de los árboles que no contienen a b. Para ello tenemos n(k - 2) posibilidades de elección. Continuando de esta manera, llegamos a

(4) y con ello obtenemos, usando (3), la relación tan inesperadamente sencilla para cualquier Fk E :Fn,k' Para k = n, el bosque Fn está formado de n vértices aislados. Por tanto, N(Fn ) cuenta el número de todos los árboles con raíz, y hemos obtenido el resultado l:Fn,ll = nn-l, y por tanto la fórmula de Cayley. O Pero podemos sacar aún más partido de esta demostración. Del caso k la fórmula (4) resulta que

# {sucesiones refinadoras (F1 , F 2 , ... , F n) }

= n de (5)

-]lo>-- _

,/ 4

8

2

/\l

F3

3

----t

F2

1:

7

9

1 10

178

Lafónnula de Cayley para el número de árboles

Para Fk E J"n,b sea N** (Fk) el número de sucesiones refinadoras , ... , Fn cuyo término k-ésimo es Fk. Claramente este número es N* (Fk) multiplicado por el número de maneras de elegir (Fk + 1 , ... ,Fn ). Pero este último número es (n - k)!, ya que podemos borrar las n-k aristas de Fk en cualquier orden. Por tanto,

Puesto que este número no depende de la elección de F k , el resultado de la división de (5) entre (6) proporciona el número de bosques con raíz con k árboles:

Ya que podemos elegir las k raíces de (~) maneras distintas, hemos vuelto a demostrar la fórmula Tn,k = knn-k-l sin necesidad de inducción. Acabaremos con una nota histórica. Carl W. Borchardt publicó un artículo en 1860 anticipándose a Cayley, que publicaría su trabajo en 1889; este hecho fue reconocido por el propio Cayley. Un resultado equivalente apareció aún antes, en un trabajo de James J. Sylvester (1857), véase [2, capítulo 3]. La novedad en el artículo de Cayley fue el uso de la terminología de la teoría de grafos, y el teorema lleva su nombre desde entonces.

[1] M. AIGNER: Combinatorial Theory, Springer-Verlag, Berlin Heidelberg New York 1979; Reprint 1997. [2] N. L. BIGGs, E. K. LLOYD & R. J. WILSON: Graph Theory 1736-1936, Clarendon Press, Oxford 1976. [3] A. CAYLEY: A theorem on trees, Quart. J. Pure Appl. Math. 23 (1889), 376-378; Collected Mathematical Papers Vol. 13, Cambridge University Press 1897, 26-28. [4] A. J OYAL: Une théorie combinatoire des séries formelles, Advances in Math. 42 (1981),1-82. [5] J. PITMAN: Coalescent random forests, J. Combinatorial Theory, Ser. A 85 (1999),165-193. [6] H. PRÜFER: Neuer Beweis eines Satzes über Permutationen, Archiv der Math. u. Physik (3) 27 (1918), 142-144. [7] A. RÉNYI: Some remarks on the theory oftrees. MTA Mat. Kut. Inst. Kozl. (Publ. math. Inst. Hungar. Acad. Sci.) 4 (1959), 73-85; Selected Papers Vol. 2, Akadémiai Kiadó, Budapest 1976, 363-374. [8] J. RIORDAN: Forests of labeled trees, J. Combinatorial Theory 5 (1968), 90-103.

Entre los objetos combinatorios más antiguos se encuentran los Cuadrados latinos, que aparentemente se estudian desde tiempos inmemoriales. Para obtener un cuadrado latino, se han de rellenar las n 2 casillas de un cuadrado (n x n) con los niimeros 1,2, ... ,n de manera que cada número aparezca exactamente una vez en cada fila y cada columna. En otras palabras, cada una de las filas y columnas representan permutaciones del conjunto {1, ... ,n}. Nos referiremos a n como el orden del cuadrado latino. He aquí el problema que nos interesa discutir: Alguien comienza a rellenar las celdas con los números {1, 2, ... ,n}. En algún momento se detiene y nos pide continuar hasta obtener un cuadrado latino. ¿En qué condiciones será posible hacerlo? Para que no sea imposible, supondremos que al comenzar nuestra tarea cada elemento aparece a lo sumo una vez en cada fila y en cada columna. Demos un nombre a esta situación: Hablaremos de un cuadrado latino parcial de orden n si algunas celdas de un cuadrado (n x n) están rellenas con números del conjunto {1, ... , n}, de tal manera que cada número aparece como máximo una vez en cada fila y en cada columna. Hecho esto, nuestro problema es el siguiente: ¿ En qué condiciones puede completarse un cuadrado latino parcial para obtener un cuadrado latino del mismo orden?

Veamos unos cuantos ejemplos. Supongamos las n-1 primeras filas rellenas y la última vacía. En esta situación podemos completar la última fila fácilmente: Cada elemento aparece n 1 veces en el cuadrado latino parcial, y de aquí que esté ausente exactamente de una columna. Basta por tanto escribir cada elemento bajo dicha columna y habremos completado el cuadrado. En cambio, si sólo está rellena la primera fila, es fácil completar el cuadrado rotando los elementos cíclicamente en las filas siguientes. De este modo, mientras que en el primero de los ejemplos existe una única manera de completar el cuadrado, para el segundo existen muchas posibilidades. En general, cuantas menos celdas estén rellenas de partida, más libertad deberíamos tener a la hora de completar el cuadrado. Sin embargo, en el margen se muestra un ejemplo de cuadrado parcial en el que sólo aparecen rellenas n celdas y que no puede ser completado, puesto que no hay manera de rellenar la esquina superior derecha sin violar la condición impuesta a la fila o a la columna.

Si el número de filas que aparecen rellenas en una malla (n x n) es menor que n, ¿puede siempre completarse para obtener un cuadrado latino?

1

2

3

4

2

1

4

3

4

3

1

2

3

4

2

1

Un cuadrado latino de orden 4

1

4

2

5

3

4

2

5

3

1

2

5

3

1

4

5

3

1

4

2

3

1

4

2

5

Un cuadrado latino cíclico

1

2

...

n-1 n

Un cuadrado latino parcial que no puede ser completado

Completando cuadrados latinos

180

1

3

2

2

1

3

3

2

1

F: 1 1 1 2 2 2 3 3 3 1 23 E: 1 3 2 2 1 3 3 2 1

c: 1 23 1 23

Si permutamos cíclicamente las líneas del ejemplo anterior, F ---> C ---> E ---> F, entonces obtenemos el cuadrado latino y la disposición siguientes: 1

2

3

3

1

2

2

3

1

F: 1 3 2 2 1 3 3 2 1 C: 1 1 1 2 2 2 3 3 3 E: 1 23 1 2 3 1 2 3

Esta pregunta fue por Trevor Evans in 1960, y la de que es posible se difundió rápidamente como la "conjetura de Evans." Por supuesto, uno trataría de demostrarlo por inducción, y así es como finalmente fue resuelto el problema por Bohdan Smetaniuk en 1981. Sin embargo, su trabajo ilustra cuánta sutileza puede llegar a precisarse en una demostración por inducción. Más aún, su prueba es constructiva, y permite completar explícitamente el cuadrado a partir de cualquier configuración parcial. Antes de comenzar con la demostración, exploraremos los cuadrados latinos en general con un poco de detalle. De manera alternativa, podemos referimos a un cuadrado latino utilizando una disposición de tamaño (3 x n 2 ), que en adelante llamaremos disposición en lineas del cuadrado latino. El margen muestra un cuadrado latino de orden 3 y su disposición en líneas asociada, donde F, e y E denotan, respectivamente, filas, columnas y elementos. La condición de cuadrado latino es equivalente a decir que en dos líneas cualesquiera de esta disposición aparecen todos los n 2 pares ordenados (y por tanto que cada par aparece exactamente una vez). Por tanto, podemos permutar los símbolos de cada línea de manera arbitraria (lo cual corresponde a permutar filas, columnas o elementos) y obtener de nuevo un cuadrado latino. Pero la condición nos dice más: los elementos no juegan ningún papel especial. Podemos permutar las líneas (como un todo), preservando las condiciones de la disposición en líneas, y por tanto del cuadrado latino. Llamamos conjugados a los cuadrados latinos conectados por tales permutaciones. La siguiente observación será muy útil: A todo cuadrado latino parcial le corresponde una disposición parcial en líneas (cada par aparece a lo sumo una vez en dos líneas cualesquiera), y todo conjugado de un cuadrado latino parcial es, de nuevo, un cuadrado latino parcial. En particular, un cuadrado latino parcial puede completarse si y sólo si puede serlo cualquier conjugado (basta completar el conjugado e invertir la permutación de las tres líneas). Necesitamos dos resultados, debidos a Herbert J. Ryser ya Charles C. Lindner, y que eran conocidos con anterioridad al teorema de Smetaniuk. Si en un cuadrado latino las primeras r filas aparecen completas y el resto de las celdas están vacías, hablamos de un rectángulo latino de dimensión (r x n). Lema 1. Cualquier rectángulo latino de dimensiones (r x n), r < n, puede extenderse a un rectángulo latino (( r + 1) x n), y por tanto puede completarse para obtener un cuadrado latino . • Demostración.. Aplicamos el teorema de Hall (véase capítulo 23). Sea Aj el conjunto de números que no aparecen en la columna j. Para que una fila sea admisible como (r + l)-ésima ha de corresponder a un sistema de representantes distintos para la colección Al, ... , An. Para demostrar el lema, por tanto, hemos de verificar la condición de Hall (H). Cualquier conjunto Aj tiene tamaño n - r, y cada elemento está precisamente en n - r conjuntos Aj (ya que aparece r veces en el rectángulo). Cualesquiera m de los conjuntos Aj contienen en total m( n - r) elementos, y por tanto al menos m diferentes, lo cual es precisamente la condición (H). O Lema 2. Sea P un cuadrado latino parcial de orden n con, a lo sumo, n - 1 casillas rellenas y como máximo ~ elementos distintos. Entonces P puede completarse para obtener un cuadrado latino de orden n.

181

Completando cuadrados latinos • Demostración. En transfonnamos el en otro más conveniente. Según el principio de congujación que discutimos anteriormente, podemos reemplazar la condición "a lo sumo ~ elementos distintos" por la condición de que las entradas aparezcan en, a lo sumo, ~ filas, y suponer incluso que estas filas son las superiores. Por tanto, supongamos que las filas que tienen sus celdas ocupadas son las celdas 1, 2, ... , r, con fi casillas rellenas en la fila i, siendo r ::::: ~ y L~=l fi ::::: n - 1. Pennutando las filas, podemos asumir que h 2': 12 2': '" 2': fr. A continuación completamos las filas 1, ... , r paso a paso hasta obtener un rectángulo de dimensiones (r x n), el cual puede completarse hasta obtener un cuadrado latino por el lema l. Supongamos ya rellenas las filas 1,2, ... ,f! - 1. En la fila f! hay fe casillas rellenas que podemos suponer que son las inferiores. Esta situación se muestra en la figura del margen, ella que se han sombreado las casillas rellenas. Se consigue completar la fila f! mediante otra aplicación del teorema de Hall, aunque esta vez la aplicación es más sutil. Sea X el conjunto de elementos que no aparecen en la fila f!, por tanto IXI = n-fe. Para j = 1, ... , n - h, sea Aj el conjunto de aquellos elementos de X que no aparecen en la columna j (ni por encima ni por debajo de la fila f!). De aquí, para completar la fila f! debemos verificar la condición (H) para la colección Al, ... , An- fg' En primer lugar afinnamos que (1)

n-fe-f!+l > f!-1+fH1+···+fr· El caso f! = 1 es claro. En otro caso, de L~=l fi < n, 1 < f! ::::: r se deduce que

h >

> fr y

r

n > ¿fi 2': (f!-1)fe-1+fe+···+fr' i=l

Ahora, o bien h-1 2': 2 (en cuyo caso se verifica (1)) o fe-1 = 1. En el último caso, (1) se reduce a n > 2(f! - 1) + r - f! + 1 = r + f! - 1, lo cual es cierto porque!! ::::: r ::::: ~. Tomemos ahora m conjuntos Aj, 1::::: m ::::: n- fe, y sea B su unión. Debemos demostrar que IBI 2': m. Consideremos el número e de casillas en las m columnas que corresponden a los Aj que contienen elementos de X. Existen a lo sumo (f! - l)m celdas de este tipo por encima de la fila f! y a lo sumo fH1 + ... + fr por debajo. De ahí que e ::::: (f!-1)m+fH1+"'+fr. Por otro lado, cada elemento x E X\B aparece en cada una de las m columnas, y de aquí que 2': m(IXI - IBI), y por tanto (con IXI = n - h),

IBI 2': Se sigue que

IXI-~c 2': n-h-(f!-1)-~(fH1+.·.+fr)'

IBI 2': m si

n-h-(f!-1)-~(fH1+ ... +fr)

esto es, si

> m-1,

m(n-fe-f!+2-m) > fH1+"'+fr.

La desigualdad (2) es cierta para m

(2)

= 1 Y para m = n - h - f! + 1 por (l).

Una situación para n = 8, con f! = 3, fl = h = h = 2, f4 = 1. Las celdas más oscuras representan las que aparecían rellenas previamente; las más claras muestran las que han sido rellenadas en el proceso.

Completando cuadrados latinos

182

e

Por tanto, la desigualdad es cierta para todo m entre 1 y n-iR - + 1, ya que la mitad del primer miembro es una función cuadrática en m con coeficiente principal -1. El caso que falta es m > n-iR - e + 1. Puesto que cualquier elemento x de X está contenido en, a lo sumo, e - 1 + JC+l + ... + Jr filas, también puede aparecer en, a lo sumo, el mismo número de columnas. De nuevo por (1), deducimos que x está en algún conjunto Aj, de modo que en este caso B = X, IBI = n-iR .:::: m, y la demostración queda completa. O Por último, demostraremos el teorema de Smetaniuk. Teorema. Cualquier cuadrado latino parcial de orden n con a lo sumo n - 1 casillas rellenas puede completarse a un cuadrado latino del mismo orden.

2

• Demostración. Utilizamos inducción sobre n, siendo trivial el caso de base n ::; 2. Partimos pues de un cuadrado latino parcial de orden n .:::: 3 con a lo sumo n - 1 casillas rellenas. Utilizando la notación anterior, estas celdas

7 5

4

están situadas en r ::; n - 1 filas diferentes que numeramos SI, . .. ,Sr> Y que contienen ah, ... ,ir > O casillas rellenas, donde ¿~=1 Ji ::; n - 1. Según el lema 2, podemos suponer que existen más de ~ elementos diferentes. Por tanto, existe un elemento que aparece una sola vez; es más, después de permutar las filas (si es necesario), podemos suponer que el elemento n aparece una sola vez, y que esto ocurre en la fila SI. En el paso siguiente queremos permutar las filas y columnas del cuadrado latino parcial de tal manera que, después de llevar a cabo las permutaciones, todas las casillas rellenas queden por debajo de la diagonal- excepto para la casilla con n, que acabará en ella. (La diagonal está formada por las casillas (k, k) con 1 ::; k ::; n.) Veamos cómo se puede conseguir esto. En primer lugar permutamos la fila SI hasta la posición h. Permutando las columnas movemos todas las casillas rellenas hacia la izquierda, de manera que n aparezca como el último elemento de su fila sobre la diagonal. A continuación movemos la fila S2 hasta la posición 1 + h + 12, y las casillas rellenas tantas posiciones a la izquierda como sea posible.



En general, movemos la fila Si hasta la posición 1 + h + 12 + ... + Ji, para 1 < i ::; r, y las casillas rellenas tantas posiciones a la izquierda como sea posible. El dibujo de la izquierda muestra un ejemplo, con n = 7: las filas SI = 2, S2 = 3, S3 = 5 Y S4 = 7 con h = 12 = 2 Y h = J4 = 1 se mueven hasta las filas numeradas como 2, 5, 6 Y 7, Y las columnas se permutan "hacia la izquierda" de manera que, al final, todas las entradas excepto la 7 están situadas por debajo de la diagonal, que se ha señalado mediante "",".

5

4

" 2

7



• 4

5



5



4

2

3

4

1

6

5

5

6

1

4

2

3

1

2

3

6

5

4

6

4

5

2

3

1

3

1

6

5

4

2

4

5

2

3

1

6

Para poder aplicar inducción, quitamos la entrada n de la diagonal e ignoramos la primera fila y la última columna (que no tienen ninguna casilla rellena). Por tanto, estamos frente a un cuadrado latino parcial de orden n - 1 que tiene a lo sumo n - 2 casillas rellenas, el cual puede completarse por inducción hasta obtener un cuadrado latino de orden n -1. Una de las muchas posibilidades de hacerlo en nuestro ejemplo se muestra en la figura del margen. Las entradas originales se han marcado en negrita. Éstas son ya entradas finales, al igual que los elementos en casillas sombreadas. Del resto de las entradas, algunas cambiarán a continuación para poder completar el cuadrado latino de orden n. En el paso siguiente queremos mover los elementos de la diagonal del cuadrado hasta la última columna y reemplazarlos por entradas n. Sin embargo,

Completando cuadrados latinos

183

no hacerlo en ya que los elementos de la no tienen porqué ser distintos. Por tanto, procedemos con más cuidado y efectuamos, para k = 2,3, ... ,n - 1 (en este orden), la operación siguiente: Colocamos el valor n en la casilla (k, n). Esto conduce a un cuadrado latino parcial correcto. A continuación intercambiamos el valor Xk en la casilla diagonal (k, k) con el valor n en la casilla (k, n) de la última columna. Si el valor Xk no aparecía anteriormente en la última columna, entonces nuestro trabajo para el valor k ha concluido. Después de hacer esto, los elementos que aparecen en la columna k-ésima no se cambiarán más. En nuestro ejemplo, este método funciona sin problemas para k = 2, 3 Y 4, Y los elementos correspondientes en la diagonal se mueven a la última columna. Los siguientes diagramas muestran las operaciones correspondientes. --

r-

.-------

-------

---

2

3" 4

1

6

5""- C>-7

2

7

4

5

6

1

4

2

3

5

6

1

5 1 --- -- JL -- ---o 4 2 3

1

2

3

6

5

4

1

2

3

6

5

6

4

5

2

3

1

6

4

5

2

3

1

6

5

4

2

3

1

6

4

5

2

3

1

6

4

5

2

3

2

7

4

1

6

7

5

6

7

4

.-2.. -

4

1

2

3

3

1

6

4

5

5

4

2

3

1

3

1

6

4

5

Ahora hemos de tratar el caso en que ya existe un elemento Xk en la última columna. En este caso procederemos de la manera siguiente: Si ya existe un elemento Xk en una casilla (j, n) con 2 :::; j < k, entonces intercambiamos en la fila j el elemento Xk de la n-ésima columna con el elemento x~ en la k-ésima columna. Si el elemento x~ también aparece en una casilla (jI, n), entonces: intercambiamos también en la fila j' los elementos de la columna n-ésima y k-ésima, y así sucesivamente. Si continuamos de esta manera no obtendremos nunca dos entradas iguales en una fila. Nuestro proceso de intercambio asegura que nunca coincidirán dos elementos iguales en una columna. Por tanto, sólo tenemos que verificar que el proceso de intercambio entre las columnas k-ésima y n-ésima no lleva a un bucle infinito. Esto puede verse a partir del siguiente grafo bipartito G k : Sus vértices corresponden a las casillas (i, k) y (j, n) con 2 :::; i, j :::; k, cuyos elementos pueden intercambiarse. Existe una arista entre (i, k) y (j, n) si estas dos casillas están en la misma fila (esto es, para i = j), o si las casillas contienen el mismo elemento antes del intercambio (lo cual implica i i= j). En nuestro esbozo, las aristas para i = j aparecen punteadas, las otras no. Todos los vértices en G k tienen grado 1 ó 2. La casilla (k, n) corresponde a un vértice de grado l. Este vértice es el comienzo de un camino que lleva a la columna k sobre una arista horizontal, luego posiblemente de vuelta otra vez a la columna n sobre una arista inclinada, luego de vuelta horizontalmente hasta la columna k y así sucesivamente. El camino acaba en la columna k en un valor que no aparece en la columna n. Así pues, las operaciones de intercambio acabarán con un paso en el cual llevamos un elemento nuevo a la

5

3

.......

3

1

6? 5

4

7

2

3

1

6

5

4

2

2

3

1

6

k

n

x~

Xk

x"k

x~ j'

Xk

n

J

k

Completando cuadrados latinos

184

última columna. Así tennina el con la colmlli1a k, y los elementos de las celdas (i, k) para i 2: 2 no variarán en adelante. En nuestro ejemplo, estos intercambios se dan para k = 5: El elemento X5 = 3 ya aparece en la última columna, de modo que esa entrada ha de ser devuelta a la columna k = 5. Pero el elemento intercambiable x~ = 6 tampoco es nuevo, así que se intercambia con x~ = 5, Y esté sí es nuevo . . -------.

5

3

2

7

4

1

3

5

6

3

1

5

6

7

4

2

3

1

.-------.

4

6

1

2

3

7

6

4

5

3

1

7

6

4

5

2

7

1

3

5

4

2

3

1

6

5

4

2

3

1

6

4

5

2

3

1

6

2

7

4

1

6

5

6

7

4

2

1

2

3

7

5

6

4

5

2

3

1

6

4

5

2

.-

-.

Por último, el intercambio para k = 6 = n - 1 no es ningún problema, y después de esto el cuadrado latino se completa de manera única:

7

3

1

6

4

2

4

2

7

4

1

3

5

6

2

7

4

1

3

5

6

2

7

4

1

3

5

6

5

6

7

4

2

3

1

5

6

7

4

2

3

1

5

6

7

4

2

3

1

1

2

3

7

6

4

5

1

2

3

7

6

4

5

1

2

3

7

6

4

5

6

4

5

2

7

1Íl".. ..j;3

6

4

5

2

7

1

3

6

4

5

2

7

1

3

3

1

6

5

4

2 7

3

1

6

5

4

7

2

3

1

6

5

4

7

2

4

5

2

3

1

6

4

5

2

3

1

6

4

5

2

3

1

6

7

... y lo mismo ocurre en general: Colocamos un elemento n en la celda (n, n), y después de hacerlo la primera fila puede completarse con los elementos que faltan de las respectivas columnas (ver lema 1), terminándose así la demostración. Para completar de manera explícita el cuadrado latino parcial original de orden n, únicamente hemos de invertir las permutaciones de elementos, filas y columnas en los primeros dos pasos de la demostración. O

[1] T. EVANS: Embedding incomplete Latin squares, Amer. Math. Monthly 67 (1960),958-961. [2] C. C. LINDNER: On completing Latin rectangles, Canadian Math. Bulletin 13 (1970),65-68. [3] H. J. RYSER: A combinatorial theorem with an application to Latin rectangles, Proc. Amer. Math. Soco 2 (1951), 550-552. [4] B. SMETANIUK: A new construction on Latín squares 1: A proof of the Evans

conjecture, Ars Combinatoria 11 (1981), 155-172.

El problema de los cuatro colores dio un impulso decisivo para que la teoría de grafos se desarrollara tal y como la conocemos hoy en día. En general, los problemas de coloreado están todavía entre los más interesantes para quienes se dedican a la teoría de grafos. Uno de estos problemas, sencillo en aparencia, fue planteado por Jeff Dinitz en 1978, y sin embargo se resistió a todos los intentos de demostración hasta que quince años después Fred Galvin dio con una solución sorprendentemente sencilla.

J

1

C(i,j)

2

Se consideran n celdas ordenadas en un cuadrado (n x n), y se escribe (í, j) para la celda en lafila i y columna j. Supóngase que cada celda (í,j) tiene asignado un conjunto C(í,j) de n colores. siempre posible colorear la matriz completa eligiendo para cada celda (i, j) un color del conjunto C( i, j), de manera que los colores que aparecen en cada fila y columna sean distintos? Para comenzar, consideremos el caso en el que todos los conjuntos de colores C( i, j) son iguales, por ejemplo {l, 2, ... ,n}. Entonces el problema de Dinitz se reduce a rellenar el cuadrado (n x n) con los números 1, 2, ... , n de manera que en cada fila y columna no haya dos números iguales. En otras palabras, cualquier coloración corresponde a un cuadrado latino, tal y como se discutió en el capítulo anterior. Así pues, en este caso la respuesta al problema es "sí". Este caso era sencillo, de manera que vayamos al caso general, en el cual el conjunto C := Ui,j C(i, j) contiene más de n colores. La dificultad ahora deriva del hecho de que no todos los colores de C son válidos para cada celda. Por ejemplo, mientras que en el caso del cuadrado latino podemos elegir arbitrariamente una permutación de colores para la primera fila, esto ya no es posible en el caso general. El caso de n = 2 ya ilustra esta dificultad. Supongamos dados los conjuntos de colores que se indican en la figura. Si elegimos los colores 1 y 2 para la primera fila, ya tenemos un problema, puesto que tendríamos que elegir el color 3 para ambas celdas en la segunda fila. Antes de abordar el problema de Dinitz, traduzcamos la situación al lenguaje de la teoría de grafos. Como es habitual, consideramos grafos G = (V, E) sin bucles ni aristas múltiples. Sea x( G) el número cromático del grafo, esto es, el menor número de colores que pueden asignarse a sus vértices de manera que vértices adyacentes reciban colores distintos. En otras palabras, colorear el grafo requiere una partición de V en clases (coloreadas con el mismo color) de manera que no haya aristas entre vértices de una clase. Si llamamos independiente a un conjunto A <;;; V en una partición de este tipo, vemos que el número cromático es el menor número de conjuntos independientes que da lugar a una partición del conjunto de vértices V.

~ +--

{l, 2} {2, 3} {l, 3} {2, 3}

El problema de Dinitz

186

y Y tres años más tarde En 1976 estudiaron la siguiente variante, que nos conduce directamente al problema de Dinitz: Supóngase que en el grafo G = (V, E) tenemos asignado un conjunto C (v) de colores para cada vértice v. Una coloración por listas es una coloración e : V --+ UvEV C( v) donde c( v) E C( v) para cada v E V. La definición del número cromático por listas Xi! (G) debería estar ahora clara: es el menor número k de modo que para cualquier lista de conjuntos de colores C (v) con IC(v)1 = k para todo v E existe siempre una coloración por listas. Por supuesto, Xi! (G) :::: IVI (nunca se nos acaban los colores). Ya que cualquier coloración ordinmia es el caso especial de una coloración por listas cuando todos los conjuntos C (v) son iguales, obtenemos pm-a cualquier grafo G X(G) :::: Xi!(G). Volviendo al problema de Dinitz, considérese el grafo Sn, que tiene como conjunto de vértices las n 2 celdas de nuestra matriz (n x n), y dos celdas son adyacentes si y sólo si están en la misma fila o columna. Puesto que cualesquiera n celdas en una fila son adyacentes dos a dos, son necesarios al menos n colores. Más aún, cualquier coloración con n colores corresponde a un cuadrado latino en el que las celdas ocupadas por un mismo número de colores dan lugar a una clase de color. Como los cuadrados latinos, tal y como hemos visto, existen, podemos inferir que X(Sn) = n, y el problema de Dinitz puede enunciarse de manera sucinta así:

El grafo S3

¿Xi!(Sn)

{1,3} {1,2} {1,4} {2,3} {3,4} {2,4}

=

n?

Uno podría pensar que tal vez se verifica X( G) = Xi! (G) para cualquier grafo, pero nada más lejos de la verdad. Considérese el grafo G = K 2 ,4. Su número cromático es 2, ya que podemos usar un color para los dos vértices de la izquierda y un segundo color para los vértices de la derecha. Pero supongamos que nos dan los conjuntos de colores indicados en la figura. Para colorear los vértices de la izquierda tenemos las cuatro posibilidades 113, 114, 213 Y 214, pero cualquiera de estos pares aparece como un conjunto de colores en la parte de la derecha, de modo que no es posible una coloración con lista. De aquí que Xc (G) ~ 3, Y el lector puede encontrar divertido comprobar que Xc (G) = 3 - ¡no hay necesidad de probar todas las combinaciones! Generalizando este ejemplo, no es difícil encontrar grafos G en los cuales X( G) = 2, pero Xc (G) es arbitrariamente grande. Así pues, el problema de la coloración por listas no es tan fácil como parece a primera vista_ Volvamos al problema de Dinitz_ Un paso importante hacia la solución fue dado por Jeanette Janssen en 1992, cuando demostró que Xc (Sn) :::: n + 1, Y Fred Galvin dio el golpe de gracia combinando ingeniosamente dos resultados que ya se conocían desde hacía mucho. Discutiremos a continuación ambos resultados y veremos que implican la igualdad Xc (Sn) = n. Nos hace falta un poco de notación. Si v es un vértice del grafo G, entonces denotamos por d (v) el grado de v. En nuestro grafo cuadrado Sn cada vértice tiene grado 2n - 2, ya que hay otros n - 1 vértices en la misma fila y en la misma columna. Para un subconjunto A c:;: V denotamos por G A el sub grafo que tiene a A como conjunto de vértices y que contiene todas las aristas de G entre los vér-

El problema de Dinitz

187

tices de A. Llamamos a G A el inducido por y decimos que H es un subgrafo inducido de G si H = G A para algún A. Nuestro primer resultado trata de grafos dirigidos = (V, E), es decir, grafos en los que cada arista e tiene una orientacion. La notación e = (u, v) significa que existe un arco e, denotado también u --+ v, cuyos vértices inicial y final son, respectivamente, u y v. Tiene sentido por tanto hablar del grado de salida d+ (v) y grado de entrada d~ (v ), donde d+ (v) cuenta el número de aristas con v como vértice inicial, y análogamente para d~ (v); aún más, d+(v) + d~(v) = d(v). Cuando escribimos G, nos referimos al grafo sin las orientationes. El siguiente concepto surgió del análisis de juegos y tendrá un papel clave en la discusión que nos ocupa.

e

e

e

Definición 1. Sea = (V, E) un grafo dirigido. Un núcleo K C;;; V es un subconjunto de los vértices tal que

a

(i) K es independiente en G, y (ii) para cada u

ti- K

existe un vértice v E K con una arista u

--+

v.

f

Observemos el ejemplo de la figura. El conjunto {b, e, f} constituye un núcleo, pero el sub grafo inducido por {a, e, e} no tiene ningún núcleo, ya que las tres aristas constituyen un cíclo entre los vértices. Ahora ya estamos listos para enunciar el primer resultado.

e

Lema 1. Sea = (V, E) un grafo dirigido, y supongamos que para cada vértice v E V tenemos un conjunto de colores (v) con más elementos que su grado de salida, le (v) I 2:: d+ (v) + 1. Si cada subgrafo inducido de tiene un núcleo, entonces existe una coloración por listas de G con un color de e(v) para cada v.

e

e

11 Demostración. Procederemos por inducción sobre IVI. Si IVI = 1 no hay nada que probar. Elegimos un color c E e = UvEV e(v) y un conjunto

A(c)

:=

{v

E

V: e

E

e(v)}.

Por hipótesis, el sub grafo inducido G A( e) tiene un núcleo K (e). Ahora coloreamos todos los v E K (e) con el color e (esto es posible, ya que K (c) es independiente), y eliminamos K(c) de G y e de e. Sea G I el de G subgrafo inducido por V\K (e) con el (v) = e (v) \ e como la nueva lista de colores. Nótese que para cada v E A(e)\K(e), el grado exterior d+(v) se reduce al menos en 1 (por la condición (ii) de ser núcleo). Así que d+ (v) + 1 :::; Iel (v) I se verifica aún en La misma condición también se verifica para los vértices que no pertenecen a A (e), ya que en este caso el conjunto de colores v) no varía. El nuevo grafo G I contiene menos vértices que G, y el resultado se obtiene por inducción. O

el.

e(

El método para resolver el problema de Dinitz resulta ahora obvio: Hemos de encontrar una orientación del grafo Sn con grados exteriores d+ (v) :::; n - 1 para todo v y que asegure la existencia de un núcleo para todos los sub grafos inducidos. Esto se logra mediante nuestro segundo resultado.

d

El problema de

188

x

y

Un grafo bipartito G un emparejamiento.

=

(X U Y, E) con

De nuevo necesitamos algunos Recuérdese 9) que un grafo bipartito G = (X U Y, E) es un grafo con la siguiente propiedad: El conjunto de vértices V se puede dividir en dos partes, X e Y, tales que cada arista tiene un extremo en X y el otro en Y. En otras palabras, los grafos bipartitos son precisamente los que pueden colorearse con dos colores (uno para X y otro para Y). Ahora veamos otro concepto importante, el de los "emparejamientos estables", que tiene una sencilla interpretación. Un emparejamiento M en un grafo bipartito G = (X U Y, E) es un conjunto de aristas que no contiene dos aristas con extremos comunes. En el grafo del dibujo las aristas en negrita forman un emparejamiento. Supongamos que X es un conjunto de hombres e Y un conjunto de mujeres, e interpretemos uv E E como la posibilidad de que u y v se casen. Un emparejamiento sería entonces una boda multitudinaria en la que ninguna persona es bígama. Para nuestro propósito, necesitamos una versión más refinada (¿y más realista?) de los emparejamientos, que sugirieron David Gale y Lloyd S. Shapley. Es evidente que en la vida real cada persona tiene sus preferencias, y esto es lo que hemos de tener en cuenta. En G = (X U Y, E) suponemos que para cada v E X U Y existe una valoración del conjunto N (v) de vértices adyacentes a v, N ( v) = {Zl > Z2 > ... > Zd( v)}. Así, Zl es la mejor elección para v, después Z2, Y así sucesivamente. Definición 2. Un emparejamiento M de G = (X U Y, E) se llama estable si se verifica la siguiente condición: Siempre que uv E E\M, u E X, v E Y entonces, o bien, uy E M con y> ven N(u), o bien xv E M con x> u en N (v), o se verifican ambas. En nuestra interpretación, un conjunto de matrimonios es estable si nunca sucede que u y v no están casados pero u preferiría tener como pareja a v antes que a la suya propia (si es que tiene) y v preferiría a u en lugar de la suya (si es que tiene), lo cual crearía evidentemente una situción de inestabilidad. Antes de probar nuestro segundo resultado, observemos el ejemplo siguiente:

Las aristas en negrita constituyen un emparejamiento estable. En cada lista de prioridades, la elección que conduce a un emparejamiento estable está impresa en negrita.

{A >C}

a

A

{e> d> a}

{C >D > B}

b

B

{b}

{A >D}

e

C

{a> b}

{A}

d

D

{e> b}

En este ejemplo existe un único emparejamiento máximo M con cuatro aristas, M = {aC, bB, eD, dA}, pero M no es estable (considérese eA). Lema 2. Siempre existe un emparejamiento estable . • Demostración. Consideremos el siguiente algoritmo. En el primer paso, todos los hombres u E X se declaran a su primera elección. Si una mujer recibe más de una proposición, elige a quien más le gusta y apunta su nombre, y si recibe una única, apunta el nombre de aquél pretendiente. El resto de los hombres son rechazados y pasan a formar parte de la reserva R. En el

189

El problema de Dinitz

paso, todos los hombres hacen su Las comparan las proposiciones (junto con la que ya tienen apuntada, si es que tienen alguna), eligen a su favorito y se lo apuntan. El resto son rechazados y forman el nuevo conjunto R. Ahora, los hombres de R se declaran a su siguiente elección, y así sucesivamente. Un hombre que se haya declarado a su última elección y sea rechazado deja de ser tenido en cuenta (incluso deja de fo.~mar parte de la reserva). Es evidente que en algún momento la reserva R queda vacía, y en este momento se detiene el algoritmo. ¡mma!cum. Cuando el algoritmo se detiene, los hombres apuntados, junto con las mujeres correspondientes, forman un emparejamiento estable.

Nótese en primer lugar que el orden en el cual una mujer concreta apunta a sus hombres está de acuerdo con sus preferencias, ya que en cada paso ella compara al nuevo pretendiente con su pareja actual y elige a su favorito. Por ello, si uv E E pero uv ti- M, entonces o bien u nunca se declara a v, (en cuyo caso él encontró una pareja mejor antes de cortejar a v, lo cual implica uy E M con y > ven N(u)), o u se declaró a v pero fue rechazado (lo cual implica xv E M con x > u en N (v)). Pero esta es precisamente la condición que caracteriza los emparejamientos estables. O Poniendo en común los lemas 1 y 2, obtenemos ahora la solución de Galvin al problema de Dinitz.

Teorema. Se tiene Xe(Sn)

=

n para todo n .

• Demostración. Como antes, se denotan los vértices de Sn por (i,j), con 1 :::; i,j :::; n. Así, (i,j) y (r,s) son adyacentes si y sólo si i = r ó j = s. Tomamos cualquier cuadrado latino L con letras de{ 1, 2, ... , n} y denotamos mediante L(i,j) la entrada en la casilla (i,j). A continuación convertimos Sn en un grafo dirigido Sn dando a las las aristas horizontales la orientación (i,j) ------+ (i,j') si L(i,j) < L(i,j'), Y a las verticales (i,j) ------+ (i',]') si L(i,j) > L(i',j). De este modo, orientamos horizontalmente desde el elemento más pequeño al mayor, y al revés en el caso vertical. (En el margen aparece un ejemplo para n = 3.) Nótese que obtenemos d+(i,j) = n - 1 para todo (í,j). De hecho, si L(i,j) = k, entonces n-k casillas en la fila i contienen una entrada mayor que k, y k - 1 casillas en la columna j tienen una entrada menor que k. Según el lema 1 falta probar que cualquier subgrafo inducido de Sn tiene un núcleo. Considérese un subconjunto A ~ V, y sean X el conjunto de filas de L, e Y el conjunto de sus columnas. Asociamos a A el grafo bipartito G = (X U Y, A), donde cualquier (i, j) E A se representa mediante la arista ij con í E X, j E Y. En el ejemplo del margen se han sombreado las casillas de A. La orientación de Sn induce de manera natural una valoración en el entorno N(í) = {j E XUY : (í, j) E A} de cada vértice i del grafo G = (X U Y, A): valoramos j' > j en N (í) si (í, j) ------+ (í, j') en Sn, respectivamente í' > í en

1

2

3

3

1

2

2

3

1

1

234

J-----t---t----

1--+-+---+--11

~~~

3

3

4

4

El problema de

190

N(j) si (i, j) ---+ (i', j). Por el lema 2, G = (X U A) tiene un emparejamiento estable NI. Este NI, visto como un subconjunto de A, es el núcleo que buscamos. Para ver el porqué, nótese en primer lugar que M es independiente en A, ya que sus elementos, vistos como aristas del grafo G = (X U Y, A), no comparten ningún extremo i o j. En segundo lugar, si (i, j) E A \M, entonces por la definición de emparejamiento estable, o bien existen (i, j') E M con j' > j, o bien (i', j) E M con i' > i. Este último hecho significa para Sn que (i,j) ---+ (i,j') E M, o (i,j) ---+ (i',j) E M, Y la demostración está O terminada. Para finalizar, vayamos aún un poquito más lejos. El lector puede haberse dado cuenta de que el grafo Sn surge de un grafo bipartito mediante una sencilla construcción. Tómese el grafo bipartito completo denotado por Kn,n, con IXI = IYI = n, y todas las aristas entre X e Y. Si consideramos las aristas de Kn,n como vértices de un nuevo grafo y conectamos dos de esos vértices si y sólo si tienen un extremo común como aristas de Kn,n, entonces obtenemos el grafo cuadrado Sn. Decimos que Sn es el grafo de aristas de Kn,n. Esta misma construcción puede llevarse a cabo en cualquier grafo G, llamando al grafo obtenido el grafo de aristas L( G) de G. En general, H se llama un grafo de aristas si H = L( G) para algún grafo G. Por supuesto, no cualquier grafo es un un grafo de aristas: por ejemplo el grafo K 2 ,4 que habíamos considerado antes no lo es, y para este grafo hemos visto que X(K2,4) < XR(K2,4). Pero, ¿qué pasa si H es un grafo de aristas? Adaptando la demostración de nuestro teorema, puede demostrarse fácilmente que se verifica X(H) = XR (H) siempre que H sea el grafo de aristas de un grafo bipartito, y el método podría arrojar alguna luz sobre la que es la conjetura más importante en este campo:

l:b7 d

G:

L(G):

e

a

e

Construcción de un grafo de aristas

¿Se verifica que X(H) = XR(H) para todo grafo de aristas H? Se sabe muy poco sobre esta conjetura y parece difícil, pero después de todo, también lo parecía el problema de Dinitz hace veinte años.

[1] P. ERDOS, A. L. RUBIN & H. TAYLOR: Choosability in graphs, Proc. West Coast Conference on Combinatorics, Graph Theory and Computing, Congressus Numerantium 26 (1979), 125-157. [2] D. GALE & L. S. SHAPLEY: College admissions and the stability ofmarriage, Amer. Math. Monthly 69 (1962),9-15. [3] F. GALVIN: The list chromatic index of a bipartite multigraph, J. Combinatorial Theory, Ser. B 63 (1995), 153-158. [4] J. C. M. JANSSEN: The Dinitz problem solved for rectangles, Bulletin Amer. Math. Soco 29 (1993), 243-249. [5] V. G. VIZING: Coloring the vertices ofa graph in prescribed colours (in Russian), Metody Diskret. Analiz. 101 (1976), 3-10.

Consideremos el producto infinito (1 + x) (1 + x2) (1 + x 3) (1 + x 4 ) . .. y expresémoslo de la forma usual en una serie Ln>o anx n , agrupando aquellos productos que tienen la misma potencia x n. Para los primeros términos de la serie podemos observar que

Por ejemplo, tenemos a6 = 4, a7 = 5, Y sospechamos (de manera acertada) que a n tiende a infinito cuando n - - ¡ . oo. Si observamos el producto (1 - x) (1 - x2) (1- x 3) (1- x 4 ) . .. encontraremos que sucede algo inesperado. Al desarrollarlo obtenemos:

rr

(1- xk)

=

1- x - x2

+ x5 + x7 -

X12 - X15

+ x22 + x 26 -

.... (2)

k2:1

Parece que todos los coeficientes son iguales a 1, -1 ó O, pero ¿es esto cierto? y si es así, ¿cuál es el patrón? Las sumas y productos infinitos y su convergencia han desempañado un papel fundamental en el análisis desde la invención del cálculo diferencial, y algunos de los más grandes matemáticos han hecho importantes contribuciones para su estudio, desde Leonhard Euler a Srinivasa Ramanujan. Al explicar identidades como (1) y (2), sin embargo, dejaremos de lado todas las cuestiones de convergencia y simplemente manipularemos los coeficientes. En la jerga matemática, se habla de series y productos de potencias "formales". En este marco, mostraremos cómo se utilizan argumentos combinatorios para demostrar de manera elegante identidades aparentemente difíciles. La noción básica es la de una partición de un número natural. Llamamos partición de n a una suma

Además, llamamos P(n) al conjunto de todas las particiones de n, y usamos lanotaciónp(n):= IP(n)l,dondedefinimosp(O) = 1. ¿Qué tienen que ver las particiones con nuestro problema? Consideremos el siguiente producto infinito de series:

5=5 5=4+1 5=3+2 5=3+1+1 5=2+2+1 5=2+1+1+1 5=1+1+1+1+1. Las particiones contadas por p(5)

donde el k-ésimo factor es (1 + xk + x2k + x 3k + ... ). ¿Cuál es el coeficiente de xn cuando desarrollamos este producto en una serie de la forma

=7

Identidades y biyecciones

192

reflexión observar que es Ln>O anx n ? Tras una mente el número de maneras de escribir n como una suma n

nI . 1

I-''''V'''U-

+ n2 . 2 + n3 . 3 + ...

1+ ... +1 + 2+ ... +2 + 3+ ... +3 + '--v----"'

~

'--v----"'

nI

n2

n3

De modo que el coeficiente no es otra cosa que el número p( n) de particiones de n. Puesto que la suma de la serie geométrica 1 + xk + x2k + ... es l_lxk' hemos probado la primera de nuestras identidades:

rr ~

k2::I

1-x

=

'"""' p(n)

L.

n

(4)

xn .

2::0

Aún más, podemos ver a partir de nuestro análisis que el factor I!x k corresponde a la contribución de k a una partición de n. Así pues, si dejamos de tener en cuenta I!x k en el producto del primer miembro de (4), entonces k no aparece en ninguna partición en el segundo miembro. Como ejemplo, obtenemos inmediatamente 6=5+1 6=3+3 6=3+1+1+1 6 = 1+ 1+ 1+ 1+ 1+ 1 Particiones de 6 en partes impares: Pi(6) = 4

(5)

donde Pi (n) es el número de particiones de n cuyos sumandos son todos impares, y un resultado análogo es cierto cuando todos los sumandos son pares. Ahora ya debería quedar claro cuál será el coeficiente n-ésimo en el producto infinito I1k> 1 (1 + xk). Puesto que tomamos o bien 1, o bien xk , de cualquiera de los factores de (3), esto significa que consideramos únicamente aquellas particiones en las que cualquier sumando k aparece a lo sumo una vez. En otras palabras, el producto original (1) queda expresado como (6)

7=7 7=5+1+1 7=3+3+1 7=3+1+1+1+1 7=1+1+1+1+1+1+1 7=7 7=6+1 7=5+2 7=4+3 7=4+2+1. Las particiones de 7 en partes impares y en partes distintas: Pa(7) = Pd(7) = 5.

donde Pd(n) es el número de particiones de n en sumandos distintos. Ahora es cuando el método de series formales muestra su máxima potencia. Puesto que 1 - X2 = (1 - x)(1 + x), podemos escribir 1 k 2:: 1

1-

x2k-I '

ya que se simplifican todos los factores 1 - x2i con exponente par. De este modo, los productos infinitos de (5) y (6) son iguales, y de aquí que también lo sean las series. Hemos obtenido el bonito resultado para todo n 2':

Q.

(7)

Una igualdad tan impactante como ésta requiere una sencilla demostración mediante biyección - al menos éste es el punto de vista de cualquiera que se . dedique a la combinatoria.

Identidades y biyecciones

193

Problema. Sean Pi (n) y P d (n) las de n en sumandos y sumandos distintos, respectivamente. Hállese una biyecGÍón de (n) a Pd(n). Se conocen algunas de estas biyecciones, aunque probablemente la más bonita sea una debida a J. W. L. Glaisher (1907). Sea A una partición de n en partés impares. Agrupamos sumandos iguales y obtenemos

n

Al + ... + Al + A2 + ... + A2 + ~~

Por ejemplo, cj; lleva

n1 n2 n1 . Al + n2 . A2 + ... + nt . At.

Ahora escribimos n1 = 2m1 + 2m2 + ... + 2mr en binario y hacemos lo mismo para el resto de los ni. La nueva partición A' de n es entonces Al: n = 2m1 Al + 2m2 Al + ... + 2mr Al + 2k1 A2 + ....

Tenemos que comprobar que A' está en Pd(n), y que cjJ : A f-----+ A' es una biyección. Ambas afirmaciones son fáciles de comprobar: Si 2a Ai = 2b Aj, entonces 2a = 2 b ya que Ai y Aj son impares, y por tanto Ai = Aj. De aquí que Al está en Pd(n). Recíprocamente, si n = /L1 + /L2 + ... + /Ls es una partición en sumandos distintos, entonces invertimos la biyección agrupando todos los /Li que contienen la misma potencia más grande de 2, y anotamos las partes impares con la multiplicidad correspondiente. En el margen se muestra un ejemplo. Así, la manipulación de productos formales nos ha conducido a la ecuación Po( n) = Pd( n) para particiones que hemos verificado mediante una biyección. Ahora procedemos al revés: damos una demostración para las particiones utilizando una biyección y deducimos una identidad. Esta vez nuestro objetivo es identificar cuál es el patrón en el desarrollo (2). Fijémonos en 1 - x - x2 + x 5 + x 7 _ x12 _ x 15 + x22 + X26 _ X35 _ x 40 + ....

A : 25 = 5+5+5+3+3+1+1+1+1 a

A': 25= (2+1)5 + (2)3 + (4)1 =10+ 5 +6+4 =10 + 6 + 5 +4.

Escribimos A': 30 = 12 + 6 + 5 + 4 + 3 como 30=4(3+1) + 2(3) + 1(5+3) = (1)5 + (4+2+1)3 + (4)1 Yobtenemos como cj;-l (A') la partición

A:30=5+3+3+3+3+3+3+ 3+1+1+1+1 en sumandos impares.

3

Parece que los exponentes (sin tener en cuenta O) aparecen emparejados, y si tomamos los exponentes de la primera potencia de cada par se obtiene la J. = 1 sucesión 1 5 12 22 35 51 70 que fue bien conocida para Euler. Se trata de los números pentagonales f(j), cuyo calificativo viene sugerido por la figura del margen. Calculamos de manera sencilla f(j) = 3j~-j Y J(j) = 3j~+j para el segundo número de cada pareja. En resumen, conjeturamos, al igual que lo hizo Euler, que debe verificarse la siguiente fórmula:

Teorema. 1+

2:) -1)j (x 3j~-j + j21

(8)

Números pentagonales

Identidades y biyecciones

194

Euler demostró este teorema utilizando series formales, pero aquí daremos una demostración por biyecciones tomada de El Libro. En primer lugar, nótese por (4) que el producto TIk>l (1- xk) es precisamente la inversa de nuestra conocida serie de particiones-Ln>ü p( n )xn. De aquí, definiendo la sucesión c(n) mediante TIk2:l (1 - xk) =: I=n2"ü c(n)x n , encontramos

Comparando coeficientes, vemos que c(n) es la única sucesión con c(O) = 1 Y n

(9) para todo n 2: 1. ~ c(k)p(n - k) = O k=ü 3j2+j 00 . Escribiendo el segundo miembro de (8) como L (-1)J x - 2 - , hemos de j=-oo demostrar que

para k = 3j~+j ,cuando j E ;Z es par, para k = 3j~+j ,cuando j E ;Z es impar,

c(k)

en caso contrario j2

proporciona esta única sucesión. Haciendo b(j) = 3 2+j para j E ;Z Y substituyendo estos valores en (9), nuestra conjetura se formula de manera simple así: para todo n, ~p(n - b(j)) = ~ p(n - b(j)) j par

jimpar

donde por supuesto sólo consideramos j con b(j) :s: n. De modo que la situación es la siguiente: Hemos de encontrar una biyección

rjJ:

U P(n -

b(j))

----+

j par

U

P(n - b(j)).

j impar

De nuevo, se han sugerido algunas biyecciones, aunque la siguiente, propuesta por David Bressoud y Doron Zeilberger, es sorprendentemente sencilla. Simplemente damos la definición de rjJ (que de hecho es una involución) e invitamos al lector a verificar los detalles más fáciles. Para A : Al Como ejemplo, consideremos n = 15 Y j = 2, de modo que b(2) = 7. La partición 3 + 2 + 2 + 1 del conjunto P(15 - b(2)) = peS) se transforma en 9+2+1+1, que está en P(15-b(1)) =

P(13).

+ ... + At

E

P( n - b(j)) sea

(t + 3j - 1) + (Al - 1) + ... rjJ(A)

:=

{ (A2

+ (At

- 1)

+ 1) + ... + (At + 1) + ~ )'1

-t-3j-l

donde omitimos los ceros que surjan. Encontramos que en el primer caso rjJ(A) está en P(n - b(j - 1)), Y en el segundo en P(n - b(j + 1)).

y si hasta aquí ha resultado bonito, aún podemos sacar más partido de ello. Sabemos que

Identidades y biyecciones

195

Como de series ~V'.lH;'U\C;), nos damos cuenta de que la introducción de la nueva variable y conduce a

k::O:l

n::O:O

donde Pd,m(n) cuenta el número de particiones de n en precisamente m sumandos distintos. Con y = -1 esto lleva a Como ejemplo para n

(lO) donde Ed (n) es el liúmero de particiones de n en un número par de partes distintas, y Od(n) es el número de particiones en un número impar. Y aquí está la gracia. Comparando (lO) con el desarrollo de Euler en (8) deducimos el bonito resultado: para n = 3j~±j cuando j 2: O es par , para n = 3j~±i cuando j 2: 1 es impar, en otro caso.

Y

10 = 10 = 10 = 10 = 10 ==

10 7+ 2+ 1

6+ 3+ 1 5 +4+ 1 5 + 3 + 2,

por tanto Ed(10)

= Od(10) = 5.

Esto es, por supuesto, sólo el principio de una historia más larga que aún no ha concluido. La teoría de productos infinitos está repleta de identidades inesperadas con sus biyecciones correspondientes. Los ejemplos más famosos son las llamadas identidades de Rogers-Ramanujan, denominadas así en honor a Leonard Rogers y Srinivasa Ramanujan, en las cuales el número 5 juega un papel misterioso:

1

Srinivasa Ramanujan

Invitamos al lector a traducirlas a la siguientes identidades de particiones, sobre las cuales llamó por primera vez la atención Percy MacMahon: e Sea f (n) el número de particiones de n de manera que todos sus sumandos son de la forma 5k + 1 Ó 5k + 4, Y g(n) el número de particiones cuyos sumandos se diferencian al menos en 2. Entonces f(n) = g(n). @

Sea r(n) el número de particiones de n cuyos sumandos son todos de la forma 5k + 2 Ó 5k + 3, Y s(n) el número de particiones cuyas partes se diferencian al menos en 2 y que no contienen al l. Entonces r (n) = s (n).

Todas las demostraciones mediante series formales conocidas hasta hoy de las identidades de Rogers-Ramanujan son bastante engorrosas, y por otra parte las demostraciones por biyecciones de f(n) = g(n) y de r(n) = s(n) se mostraron escurridizas durante mucho tiempo. Este tipo de demostraciones fueron

= 10:

10=9+1 10 = 8 + 2 10 = 7 + 3 10 = 6 +4 10 = 4+ 3 + 2 + 1

196

Identidades y biyecciones

finalmente dadas en 1981 por Adriano Garsia y Stephen Milne. Sus ciones, sin embargo, son muy complicadas y no haya la vista, de momento, demostraciones de El Libro.

[1] G. E. ANDREWS: The Theory ofPartitions, Encyclopedia ofMathematics and its Applications, Vol. 2, Addison-Wesley, Reading MA 1976. [2] D. BRESSOUD & D. ZEILBERGER: Bijecting Euler's partitions-recurrence, Amer. Math. Monthly 92 (1985), 54-55. [3] A. GARSIA & S. MILNE: A Rogers-Ramanujan bijection, J. Combinatorial Theory, Ser. A 31 (1981), 289-339. [4] S. RAMANUJAN: Proo! of certain identities in combinatory analysis, Proc. Cambridge Phil. Soco 19 (1919), 214-216. [5] L. J. ROGERS: Second memoiron the expansion ofcertain injinite products, Proc. London Math. Soco 25 (1894),318-343.

30 Cinco-coloración de grafos planos 199

31 Cómo vigilar un museo 203

32 El teorema de Turán 207

33 .,

Comunicar sin errores 213

34 Sobre amigos y políticos 223

35 La probabilidad nos lo pone fácil Ca veces) 227

"El geógrafo de los cuatro colores"

Los grafos planos y sus coloraciones han sido objeto de intensa investigación desde los comienzos de la teoría de grafos, debido a su conexión con el problema de los cuatro colores. Tal y como fue planteado originalmente, la pregunta es si siempre es posible colorear las regiones de un mapa plano con cuatro colores, de forma que a las regiones que tienen frontera común (y no sólo un punto) se les asignen colores distintos. La figura de la derecha muestra que colorear las regiones de un mapa es equivalente a colorear los vértices de un grafo plano. Igual que en el capítulo 11 (página 65) ponemos un vértice en el interior de cada región (incluyendo la región exterior) y conectamos dos vértices correspondientes a regiones adyacentes por medio de una arista a través de la frontera común. El grafo resultante G, que es el grafo dual del mapa NI, resulta ser un grafo plano, y colorear los vértices de G en el sentido usual es equivalente a colorear las regiones de M. Debido a esto podemos concentramos en colorear los vértices de grafos planos, tal y como haremos a partir de ahora. Podemos suponer que G no tiene bucles ni aristas múltiples, ya que estos tipos de aristas son irrelevantes para la coloración.

El grafo dual de un mapa

En la larga y ardua historia de la búsqueda de una demostración para el teorema de los cuatro colores, muchos intentos se quedaron cerca, pero lo que finalmente tuvo éxito tanto en la demostración de Appel-Haken de 1976 y también en la más reciente de Robertson, Sanders, Seymour y Thomas de 1997 fue una combinación de viejas ideas (que se remontan al siglo XIX) con la potencia de cálculo de los ordenadores modernos. Veinticinco años después de la demostración original, la situación sigue siendo esencialmente la misma, y no haya la vista demostración de El Libro a la vista. Seamos más modestos y preguntémonos si existe una demostración elegante de que cualquier grafo plano es 5-coloreable. El teorema de los cinco colores fue demostrado por Heawood a finales del siglo XIX. La herramienta básica de su demostración (al igual que para el teorema de los cuatro colores) fue la fórmula de Euler (véase capítulo 11). Evidentemente, cuando coloreamos un grafo G podemos suponer que es conexo, ya que las diferentes componentes conexas se podrían colorear independientemente. Un grafo plano divide al plano en un conjunto R de regiones (entre las que se incluye la region exterior). La fórmula de Euler dice que si G = (V, E) es un grafo plano conexo, siempre se verifica que

IVI - IEI + IRI

= 2.

Como entrenamiento, veamos cómo se puede utilizar la fórmula de Euler para demostrar que cualquier grafo plano G es 6-coloreable. Razonamos por inducción sobre el número de vértices, n. Para valores pequeños de n (en concreto,

Este grafo plano tiene 8 vértices, 13 aristas y 7 regiones.

200

Cinco-coloración de grafos planos si n :S 6) esto es evidente. Según la (A) de la proposición de la página 67 sabemos que G tiene un vértice v de grado menor o igual que 5. Eliminamos v y todas las aristas incidentes a v. El grafo resultante G' = G\ v es un grafo plano de n - 1 vértices. Según la hipótesis de inducción, lo podemos 6-colorear. Como v tiene como mucho 5 vecinos en G, para ellos se utilizan a lo sumo 5 colores en la coloración de G'. Por tanto, podemos extender cualquier 6-coloración de G' a una 6-coloración de G asignando a v un color que no haya sigo asignado en la coloración de G' a ninguno de sus vecinos. Por tanto, G es 6-coloreable. Estudiemos ahora el número cromático con listas, que presentamos en el capítulo anterior sobre el problema de Dinitz. Evidentemente, nuestro método de 6-colorear también funciona para listas de colores (de nuevo tenemos suficientes colores) y, por tanto, Xc (G) :S 6 para cualquier grafo plano G. Erdos, Rubin y Taylor conjeturaron en 1979 que cualquier grafo plano tiene número cromático con listas menor o igual que 5, y que existen grafos planos G con Xc (G) > 4. Estaban en lo cierto en ambos casos. Margit Voigt fue la primera en construir un ejemplo de un grafo plano G con Xc (G) = 5 (su ejemplo tenía 238 vértices) y más o menos al mismo tiempo Carsten Thomassen dio una demostración verdaderamente asombrosa de la conjetura de la 5-coloración con listas. Su demostración es un magnífico ejemplo de lo que se puede llegar a conseguir cuando se encuentra la hipótesis de inducción adecuada. i Y no utiliza en absoluto la fórmula de Euler!

Teorema.

Cualquier grafo plano G es coloreable con 5-listas:

• Demost.ración. En primer lugar, observemos que al añadir aristas el número cromático sólo puede aumentar. En otras palabras, si H es un sub grafo de G, entonces Xe(H) :S Xc (G). Por tanto, podemos suponer que G es conexo y que en una inmersión dada las fronteras de las caras acotadas son triángulos. Diremos que un grafo así está casi-triangulado. Si el teorema es cierto para los grafos casi-triangulados, será cierto para cualquier grafo plano. La idea de la demostración es verificar el siguiente resultado, más fuerte (y que nos permite utilizar inducción):

Sea G = (V, E) un grafo casi-triangulado y sea B el ciclo que acota la región exterior. Hacemos las siguientes suposiciones sobre los conjuntos de colores G( v), v E V: Un grafo plano casi-triangulado

(1) Dos vértices adyacentes x, y de B ya han sido coloreados

con colores a y f3 (distintos J.

IG(v)1 2: 3 para el resto de los vértices v de B. (3) IG (v) I 2: 5 para todos los vértices v en el interior. (2)

Entonces, la coloración de x, y se puede extender a una coloración propia de G eligiendo colores de las listas. En particular, Xc (G) :S 5.

Cinco-coloración de grafos planos

Para IVI = 3 esto es ya que para el único vértice v sin colorear se tiene le (v) I : : : 3 y, por tanto, hay un color disponible. Ahora procedemos por inducción. Caso 1: Supongamos que B tiene una cuerda, es decir, una arista que no está en B y que conecta dos vértices u, v E B. El sub grafo G I que está acotado por BI U {uv} y que contiene x, y, u y v está casi-triangulado y, por tanto, tiene una coloración con S-listas, según la hipótesis de inducción. Supongamos que en esta coloración los vértices u y v reciben los colores r y ¿j. Veamos qué ocurre en la parte inferior de G 2 , acotada por B 2 y uv. Considerando u, v como vértices precoloreados, vemos que G 2 también satisface la hipótesis de inducción. Por tanto, G 2 puede ser coloreado con 5-listas con los colores disponibles, y lo mismo es cierto para G.

201

BI

x

GI U

V

G2

B2

Vo

Caso 2: Supongamos que B no tiene cuerdas. Sea Vo el otro vértice adyacente en B al vértice x que ha recibido el color a, y sean x, VI, ... , Vt, W los vecinos de Vo. Como G está casi-triangulado, se tiene la situación de la figura.

Ahora construimos el grafo casi-triangulado G' = G\ Vo eliminando de G el vértice Vo y todas las aristas adyacentes a Vo. El grafo G' tiene como frontera exterior B' = (B\ vo) U {VI, ... , Vt}. Como le (vo) I : : : 3 según la suposición (2), existen dos colores r, ¿j en e (vo) distintos de a. Ahora cambiamos los conjuntos de colores e (Vi) por los e (Vi) \ {r, ¿j}, manteniendo los conjuntos de colores originales para el resto de los vértices de G'. Entonces, G' verifica todas las suposiciones y es, por inducción, coloreable con 5-listas. Eligiendo r o ¿j para vo, distinto del color de w, podemos extender la coloración con listas de G' a todo G. O

B

Por tanto, hemos demostrado el teorema de los 5 colores con listas, pero la historia no termina aquí. Una conjetura más fuerte afirma que el número cromático con listas de un grafo plano G es, como mucho, uno más que el número cromático usual: ¿ Es Xc (G) :S X( G)

+1

para cualquier grafo plano G ?

Como X( G) :S 4 según el teorema de los cuatro colores, existen tres casos: Caso 1:

X(G)

=

2

=?

Xc(G) :S 3

Caso II:

X(G)

=

3

=?

Xc(G) :S 4

Caso III:

X( G)

=

4

=?

Xc (G) :S 5.

El resultado de Thomassen resuelve el caso III, y el caso 1 fue demostrado mediante un argumento ingenioso (y más sofisticado) por Alon y Tarsi. Además, existen grafos planos G tales que X( G) = 2 Y Xc (G) = 3, por ejemplo el grafo K 2 ,4 que consideramos en el capítulo sobre el problema de Dinitz. ¿Pero qué ocurre con el caso II? La conjetura no es cierta, como fue demostrado en primer lugar por Margit Voigt utilizando un grafo construido anteriormente por Shai Gutner. Su grafo, de 130 vértices, se puede obtener de la siguiente forma. Primero consideramos el "doble octaedro" (véase la figura), que es claramente 3-coloreable. Sean a E {5, 6, 7, 8} y (3 E {9, 10, 11, 12} Y consideremos las listas dadas en la figura. Invitamos al lector a comprobar que con estas listas no se puede colorear el grafo. Ahora tomamos 16 copias

{a,1,3,4}

#

{a,(3,1,2}

{a,2,3,4}

~

a, (3,1, 2}

202

Cinco-coloración de grafos planos del doble octaedro e identificamos todos los vértices de arriba y todos los vértices de abajo, lo que nos da un grafo con 16 . 8 + 2 = 130 vértices que sigue siendo plano y 3-coloreable. Asignamos {5, 6, 7, 8} al vértice superior y {9, 10, 11, 12} al vértice inferior, mientras que las listas de los vértices interiores son los 16 pares (a, (3), a E {5, 6,7, 8}, (3 E {9, 10, 11, 12}. Para cualquier elección de a y (3 obtenemos un sub grafo como el de la figura y, por tanto, es imposible colorear con listas el grafo total. Modificando otro de los ejemplos de Gutner, Voigt y Wirth construyeron un grafo aún más pequeño, de 75 vértices, y tal que X = 3 Y XR- = 5, que además utiliza sólo el número mínimo de 5 colores en las listas combinadas. El récord actual es de 63 vértices.

[1] N. ALON & M. TARSI: Colorings and orientations of graphs, Combinatorica 12 (1992), 125-134. [2] P. ERDOS, A. L. RUBIN & H. TAYLOR: Choosability in graphs, Prac. West Coast Conference on Combinatorics, Graph Theory and Computing, Congressus Numerantium 26 (1979),125-157. [3] S. GUTNER: The complexity of planar graph choosability, Discrete Math. 159 (1996), 119-130. [4] N. ROBERTSON, D. P. SANDERS, P. SEYMOUR & R. THOMAS: Thefour-colour theorem, J. Combinatoria1 Theory, Ser. B 70 (1997), 2-44. [5] C. THOMASSEN: Every planar graph is 5-choosable, J. Combinatorial Theory, Ser. B 62 (1994),180-181. [6] M. VOIGT: List colorings of planar graphs, Discrete Math. 120 (1993), 215-219. [7] M. VOIGT & B. WIRTH: On 3-colorable non-4-choosable planar graphs, J. Graph Theory 24 (1997), 233-235.

1

En el año 1973, Victor Klee propuso un bonito problema. Supongamos que el director de un museo quiere asegurarse de que cada rincón de la galería esté vigilado en todo momento por un guardia. Los guardias permanecen en lugares fijos, pero pueden vigilar cualquier punto a su alrededor. ¿Cuántos guardias son necesarios para garantizar la seguridad del museo? Imaginemos que las paredes del edificio forman un polígono de n lados. Si el polígono es convexo, está claro que basta con un solo guardia, que además puede estar situado en cualquier punto del museo. Pero, en general, las paredes pueden formar cualquier polígono cerrado. Consideremos un museo en forma de peine con n = 3m paredes, como puede verse en el dibujo del margen. Es fácil ver que son necesarios por lo menos m = ~ guardias: Nótese que hay n paredes, y que el punto 1 sólo puede ser observado por un guardia situado en el triángulo sombreado que contiene a este punto, y lo mismo para el resto de los puntos 2,3, ... ,m. Puesto que todos estos triángulos son disjuntos, podemos concluir que se necesitan al menos m guardias. Pero este número de vigilantes es también suficiente, ya que pueden situarse en las aristas superiores de los triángulos. Eliminando una o dos paredes del final, concluimos que para todo n hay un museo con n paredes que necesita l ~ J guardias.

Una sala de exposiciones convexa

1

2

3

Una galería de arte "de verdad" ...

m

Cómo vigilar un museo

204

El resultado siguiente demuestra que este caso es el peor que puede darse.

Teorema. Cualquier museo con n sumo l JJguardias.

con a lo

se

Este "teorema de la galería de arte" fue probado por primera vez por Vasek Chvátal mediante un ingenioso argumento, pero la demostración realmente bella que aquí presentaremos es de Steve Fisk. Un museo con n

= 12 paredes

• Demostración. Empezarnos uniendo las esquinas de la galería mediante

n - 3 diagonales que no se intersecan entre sí, de modo que el interior quede triangulado. Por ejemplo, podernos triangular el museo que se muestra en el margen usando 9 diagonales. Para la demostración no importa cuál sea la triangulación elegida. Ahora imaginemos la figura triangulada corno un grafo plano, identificando las esquinas con sus nodos, y las paredes con las aristas.

nr¡rna:curn. Este grafo se puede colorear con 3 colores.

Una triangulación del museo

Para n = 3 no hay nada que demostrar. Para n > 3, elegirnos cualquier par de vértices u y v, conectados por una diagonal. Esta diagonal divide el grafo en otros dos más pequeños, que contienen a la arista uv y están a su vez triángulados. Por inducción, podernos colorear cada uno de estos dos grafos con 3 colores, y además elegir en cada coloración el color 1 para u y el color 2 para v. Combinando estas dos coloraciones obtenemos una coloración de todo el grafo mediante 3 colores. El resto es fácil. Puesto que hay n vértices, existe por lo menos un color - por ejemplo ell - que se utiliza como mucho para l J vértices. En estos vértices colocaremos a los guardias. Como cada triángulo contiene un vértice de color 1, sabemos que cada triángulo está vigilado, y por lo tanto lo está todo el museo. D

J

e'

Poliedro de SchOnhardt: Los ángulos diédros interiores en las aristas AB', BC' y CA' son mayores que 180 0



Es posible que algún lector astuto haya encontrado una sutileza en nuestro razonamiento. ¿Siempre existe una triangulación? Con toda probabilidad, la reacción inmediata de cualquiera es: ¡por supuesto que sí! El caso es que realmente existe, pero esto no es completamente obvio. De hecho, la generalización natural a tres dimensiones (subdividir en tetraedros) no es cierta, como se puede comprobar mediante el poliedro de Schonhardt, a la izquierda. Se obtiene a partir de un prisma triangular girando el triángulo superior, de modo que cada una de las caras cuadrangulares da lugar a dos triángulos con una arista no convexa. Al intentar triangular este poliedro, uno se da cuenta de que cualquier tetraedro que contenga el triangulo inferior también debe contener uno de los tres vértices superiores. Sin embargo, el tetraedro resultante se saldría del poliedro de Schonhardt. Concluimos entonces que cualquier triangulación usa necesariamente algún vértice adicional. Para probar que existe una triangulación de cualquier polígono en el plano, convexo o no, procederemos por inducción sobre el número n de vértices.

Cómo vigilar un museo

205

y no Para n = 3, el polígono es un nada que demostrar. Así pues, consideremos n 2:: 4. Para utilizar inducción, lo que tenemos que hacer es considerar una diagonal que separe el polígono P en dos partes más pequeñas, de manera que pueda construirse una triangulación del polígono ensamblando triangulaciones de cada una de estas partes. Llamaremos a un vértice A convexo si el ángulo interior en A es menor que 180 0 • Ya que la suma de los ángulos interiores de P es (n - 2) 180 tiene que existir un vértice convexo A. De hecho, tiene que haber por lo menos tres de estos vértices; en esencia, se trata de una aplicación del principio del palomar. Otra manera de verlo consiste en considerar el cierre convexo del polígono y observar que todos sus vértices son también convexos para el polígono original. Ahora nos fijaremos en los vértices adyacentes a A, a los cuales llamaremos By C. Si todo del segmento BC está contenido en P, entonces BC será nuestra diagonal. Si no es así, el triángulo ABC ha de contener a más vértices de P. Deslizamos entonces el segmento BC hacia A hasta alcanzar el último vértice, Z, de ABC. De este modo, AZ estará contenido en P y habremos encontrado nuestra diagonal. 0

,

Hay muchas variantes del teorema de la galería de arte. Por ejemplo, nos podría interesar vigilar solamente las paredes (al fin y al cabo es allí donde se cuelgan las pinturas), o podríamos colocar a todos los guardias en los vértices del polígono. Una variante especialmente bonita del problema (aún sin resolver) es la siguiente: Supongamos que cada guardia está situado en una única pared del museo, de manera que caminando a lo largo de dicha pared puede observar todo aquello que sea visible desde cualquier punto de esta pared. ¿Cuántos "guardias de pared" hacen falta para vigilar el museo?

Godfried Toussaint construyó como ejemplo el museo que aparece dibujado a la izquierda, el cual prueba que pueden ser necesarios L~ J guardias. Este polígono tiene 28 lados (yen general, 4m), e invitamos al lector a comprobar que se necesitan m guardias de pared. Hay una conjetura que afirma que, excepto para algunos valores de n, este número es también suficiente, pero todavía no se ha dado una demostración, y menos aún una demostración merecedora de estar en El Libro.

[1] V. CHVÁTAL: A combinatorial theorem in plane geometry, J. Combinatorial Theory, Ser. B 18 (1975), 39-41. [2] S. FISK: A short proof of Chvátal's watchman theorem, J. Combinatorial Theory, Ser. B 24 (1978), 374. [3] J. O'ROURKE: Art Gallery Theorems and Algorithms, Oxford University Press 1987. [4] E. SCHÓNHARDT: Überdie Zerlegung vonDreieckspolyedern in Tetraeder, Math. Annalen 98 (1928), 309-312.

A

206

"Los vigilantes del museo" (Versión tridimensional del problema de la galería de arte)

Cómo vigilar un museo

Uno de los resultados fundamentales de la teoría de grafos es el teorema de Turán, de 1941, que dio origen a la teoría extremal de grafos. El teorema de Turán ha sido redescubierto en muchas ocasiones y se han encontrado demostraciones distintas. Presentaremos cinco de ellas y dejaremos al lector la decisión sobre cuál de ellas pertenece a El Libro. Empezamos introduciendo algo de notación. Sea G un grafo simple con vértices V = {VI, ... , Vn } y aristas E. Si Vi Y Vj son adyacentes, escribimos que ViVj E E. Un p-clan l de G es un sub grafo completo de G con p vértices, denotado por Kp. Paul Turán hizo la siguiente pregunta: Supongamos que G es un grafo simple que no contiene un p-clan. ¿ Cuál es el mayor número de aristas que puede tener G? Es sencillo obtener ejemplos de grafos sin un p-c1an dividiendo V en p - 1 subconjuntos disjuntos dos a dos V = VI U ... U Vp - I , con IViI = ni, n = nI + ... + np-I, Y conectando dos vértices si y sólo si están en subconjuntos distintos Vi, Vj. El grafo resultante, que denotamos Kn1, ... ,np_1' tiene ¿i<j ninj aristas. Para un n fijo, el mayor número de aristas para tales grafos se obtiene si los tamaños de los distintos subconjuntos son tan parecidos entre sí como sea posible, es decir, si Ini - nj I ~ 1 para todo i, j. En efecto, supongamos que nI 2: n2 + 2. Si cambiamos un vértice de VI a V2, obtenemos Knl-l,n2+1, ... ,np_l que tiene (nI - 1)(n2 + 1) - nIn2 = nI - n2 - 1 2: 1 aristas más que K n1 ,n2, ... ,n p _l' Los grafos Kn1, ... ,np_l con Ini - njl ~ 1 se conocen como grafos de Turán. En particular, si p - 1 divide a n, podemos elegir ni = p":l para todo i, de donde se obtienen (

1) (p-1 n ) 2

p -

1) n _1 2

2

2

(

=

1- p

aristas. El teorema de Turán afirma que este número es una cota superior del número de aristas de cualquier grafo de n vértices que no contenga un p-c1an.

Teorema. Si un grafo G = (V, E) de n vértices no contiene un clan de n vértices, p 2: 2, entonces

IEI

1) - -n . (1 p-1 2 2

~

(1)

1NdT. No existe consenso sobre cómo traducir el término inglés cUque, que se utiliza para referirse a un conjunto de vértices de un grafo G que inducen un sub grafo completo (o al propio subgrafo). En este texto hemos optado por el término clan, que es uno de los utilizados por la comunidad matemática de habla hispana y que recoge el significado del término original.

Paul Turán

El grafo K 2 ,2,3

El teorema de Turán

208

Para p = 2 el resultado es tlivial. En el primer caso interesante, p = 3, el teorema afirma que un grafo con n vértices que no contiene ningún triángulo 2 tiene como mucho ~ aristas. Se conocían demostraciones de este caso especial previas al resultado de Turán. Dos elegantes demostraciones que utilizan desigualdades se han presentado en el capítulo 17. Vayamos al caso general. Las dos primeras demostraciones utilizan inducción y se deben a Turán y a Erd6s, respectivamente .

• Primera demostración. Hacemos inducción sobre n. Es sencillo verificar que (1) es cierto si n < p. Sea G un grafo con vértices V = {VI, ... , V n } que no contiene un p-clan, con n 2: p, y con el mayor número de aristas posible. Es evidente que G contiene clanes de p - 1 vértices, pues en caso contrario podríamos añadirle aristas. Sea A un (p - 1) -clan y consideremos B := V\ A. El grafo A contiene (P; I) aristas. A continuación, acotamos e B, el número de aristas de B, y eA,B, el número de aristas entre A y B. Por hipótesis de inducción, eB :::; ~ (1- P~I )(n-p+ 1)2. Como G no tiene p-clanes, cualquier vértice Vj E B es adyacente, como mucho, a p - 2 vértices de A, de donde se sigue que eA,B :::; (p - 2)(n - p + 1). De aquí se deduce que

IEI :::;

(

p -

2

1) + -1( 2

1)

1 - - - (n - p + 1)2 p-1

que es exactamente (1- P~l r~2

G

H

.

+ (p -

2)(n

p+ 1),

o

• Segunda demostración. Esta demostración utiliza la estructura de los grafos de Turán. Sea v m E V un vértice de grado máximo d m = maxI::;j::;n dj. Denotemos por S el conjunto de vecinos de V m , ISI = dm , y consideremos T := V\S. Como G no contiene ningún clan de p vértices y V m es adyacente a todos los vértices de S, podemos asegurar que S no contiene ningún clan de p - 1 vértices. Ahora construimos el siguiente grafo H sobre V (véase la figura). H es igual a G en S y contiene todas las aristas entre S y T, pero ninguna entre vértices de T. En otras palabras, T es un conjunto independiente de vértices en H, de donde se deduce que tampoco H contiene p-clanes. Sea dj el grado de Vj en H. Si Vj E S, es claro que dj 2: dj por construcción de H, en tanto que para Vj E T se tiene que dj = ISI = dm 2: dj debido a la elección de V m. Por tanto, IE(H)I 2: IEI, de donde se deduce que, entre todos los grafos con número de aristas máximo, debe haber uno con la estructura de H. Por hipótesis de inducción, el grafo inducido por S tiene como mucho tantas aristas como cierto grafo de la forma K n1 ,... ,np_2 definido en S. Por tanto, IEI :::; IE(H)I :::; E(Kn1, ... ,np_J con np-I = ITI, de donde se deduce (1). O Las dos demostraciones siguientes son de naturaleza completamente distinta, pues utilizan un argumento de optimización e ideas de la teoría de la probabilidad. Son debidas a Motzkin y Straus y a Alon y Spencer, respectivamente.

209

El teorema de Turán • Tercera demostración. Consideremos una distribución de = (WI, ... , w n ) definida en los vértices, es decir, una asignación de pesos Wi ~ O a los vértices tal que L~=I Wi = 1. Nuestro objetivo es maximizar la función

w

f(w)

L

=

WiWj.

VivjEE

Supongamos que w es cualquier distribución, y sean Vi y Vj un par de vértices no adyacentes con pesos positivos Wi Y Wj. Sea Si la suma de los pesos de todos los vértices adyacentes a Vi y definamos Sj de forma análoga para Vj. Sin pérdida de generalidad, podemos suponer que Si ~ S j. Ahora trasladamos el peso de Vj a Vi, es decir, el nuevo peso de Vi es Wi + Wj, en tanto que el peso de Vj se hace O. Para la nueva distribución w ' se tiene que

f(w /) = f(w)

+ WjSi

- WjSj

~ f(w).

"Moviendo pesos"

Repetimos este proceso (reduciendo en cada etapa el número de vértices con peso positivo en uno) hasta que no existan vértices no adyacentes con peso positivo. Por tanto, concluimos que existe una distribución óptima tal que los pesos positivos están concentrados en un clan, digamos un clan con k vértices. Ahora bien, si, por ejemplo, WI > W2 > O, podemos escoger un valor de e tal que O < e < WI - W2 Y cambiamos WI a WI - e Y W2 a W2 + c. La nueva distribución w ' satisface f(w /) = f(w) + c(WI - W2) - c 2 > f(w), de donde se deduce que el valor máximo de f (w) se alcanza para Wi = ~ en un clan con k vértices y Wi = O para el resto de los vértices. Como un clan con k b /. . k(k~I). vertlces tIene - 2 - anstas, o tenemos

f(w)

=

k(k -1) 2

~ k2

=

~ (1 _ ~). k

2

Como esta expresión es creciente en k, el óptimo se alcanza para k = p - 1 (ya que G no tiene p-clanes). Por tanto,

f(w) :S ~

2

(1 __ 1_) p-1

para cualquier distribución w. En particular, esta desigualdad se cumple para la distribución uniforme dada por Wi = ~ para todo i. De aquí se deduce que

o

que es exactamente (1) .

• Cuarta demostraci6n. En esta ocasión utilizamos conceptos de la teona de la probabilidad. Sea G un grafo arbitrario y sea V = {VI, ... , v n } el conjunto de sus vértices. Denotamos por di el grado del vértice Vi y por w (G) el número de vértices del mayor clan, que se conoce como número de clan deG. n 1 nnlW¡~Wjn. Se tiene que w(G) ~ n-d.'

L

i=1

"

El teorema de Turán

210

Elegimos una pelmutación aleatoria 1T = VI V2 ... V n del conjunto de vértices de forma que cada permutación aparezca con igual probabilidad, ,h, y consideramos el siguiente conjunto C Tr • El vértice Vi está en C Tr si y sólo si Vi es adyacente a todos los vértices Vj (j < i) que preceden a Vi. Por definición, Gn es un clan de G. Sea X = IGnlla variable aleatoria correspondiente. Obsérvese que X = ¿~=1 Xi, donde Xi es la variable aleatoria indicatriz correspondiente al vértice Vi, es decir, Xi = 1 si Vi E Gn , en tanto que Xi = O si Vi 7!- Gn . Ahora bien, Vi está en Gn cuando se elige la permutación VI V2 ... V n si y sólo si Vi aparece antes que los n - 1 - di vértices que no son adyacentes a Vi, es decir, si Vi es el primero de entre Vi y los n -1- di vértices no adyacentes. La probabilidad de que esto ocurra es n~di y, por tanto, EXi = n~di' Como la esperanza es lineal (véase la página 84) se obtiene que n

E(IGnl)

=

EX

=

n

¿ E Xi i=1

=

1

¿n-d' i=1

"

Por tanto, debe haber un clan con, al menos, ese tamaño, como habíamos afirmado. Para deducir el teorema de Turán a partir de la afirmación utilizamos la desigualdad de Cauchy-Schwarz presentada en el capítulo 17,

Consideramos ai

= yn -

di,

bi

=

vn~di y, por tanto, aibi

= 1. Por tanto,

Utilizando ahora la hipótesis del teorema, que afirma que w( G) :::; p - 1, Y la identidad ¿~=1 di = 21EI del capítulo dedicado al doble recuento, la desigualdad (2) se transforma en

n2

:::;

(p - 1)(n2

-

2I E I),

que es equivalente a la desigualdad de Turán.

o

Ya estamos en condiciones de presentar la última demostración, que quizá sea la más elegante de todas. Su origen no está claro; nos la contó Stephan Brandt, quien la escuchó en Oberwolfach. Quizá se pueda considerarfolklore en teoría de grafos. Demuestra, a la vez, que el grafo de Turán es el único ejemplo con un número máximo de aristas. Se puede observar que este resultado es también consecuencia de las demostraciones 1 y 2 . • Quinta demostración. Sea G un grafo con n vértices y con el mayor número de aristas de entre los que no contienen un p-clan. Afirmación. G no contiene tres vértices u, V, w tales que vw E E, pero uv 7!- E, uw 7!- E.

Supongamos que la afirmación es falsa y consideremos los siguientes casos.

Caso 1: d(u) < d(v) o d(u) < d(w). Podemos suponer que d( u) < d( v). Duplicamos el vértice v, es decir, creamos

El teorema de Turán

21

w

un nuevo vértice v' que tiene exactamente los mismos vecinos que v (vv' no es una arista), eliminamos u y dejamos el resto del grafo sin cambios. El nuevo grafo G' sigue sin tener un clan con p vértices y su número de aristas es

IE(G')I

IE(G)I

=

+ d(v)

- d(u) > IE(G)I,

lo que contradice el carácter maximal de G.

Caso 2: d(u) 2: d(v) y d(u) 2: d(w). En este caso duplicamos u dos veces y eliminamos v y w (como se ve en la figura). De nuevo, el grafo G' obtenido no tiene ningún p-clan y para su número de aristas obtenemos la relación

IE(G')I

=

IE(G)I

+ 2d(u)

- (d(v)

+ d(w)

- 1) > IE(G)I,

donde el -1 corresponde a la arista vw. De nuevo hemos obtenido una contradicción. Un momento de reflexión nos convence de que la afirmación demostrada es equivalente a que la relación U

rv

V

:~

" w U

u'

e

uv tj. E( G)

sea una relación de equivalencia. Por tanto, G es un grafo multipartito completo, G = Kn1, ... ,np_l' Y hemos terminado la demostración. D

[1] M. AIGNER: Turán's graph theorem, Amer. Math. Month1y 102 (1995),

808-816. [2] N. ALON & J. SPENCER: The Probabilistic Method, Wiley Interscience 1992. [3] P. ERDOS: On the graph theorem ofTurán (in Hungarian), Math. Fiz. Lapok 21 (1970),249-251. [4] T. S. MOTZKIN & E. G. STRAUS: Maxima for graphs and a new proof of a theorem ofTurán, Canad. J. Math. 17 (1965), 533-540. [5] P. TURÁN: On an extremal problem in graph theory, Math. Fiz. Lapok 48 (1941), 436-452.

"Moviendo pesos más grandes"

u"

En 1956, Claude Shannon, el fundador de la teoría de la información, propuso una interesante pregunta:

Supóngase que queremos transmitir a un rCF·Dnr"". a través de un canal (que puede distorsionar algunas señales). ¿ Cuál es la tasa máxima de transmisión para que el receptor recuperar el mensaje sin errores?

Veamos a qué se refiere Shannon con "canal" y "tasa de transmisión." Dado un conjunto V de símbolos, un mensaje es simplemente una cadena de símbolos de V. Modelamos el canal como un grafo G = (V, E), donde V es el conjunto de símbolos y E el conjunto de aristas entre pares de símbolos que pueden confundirse durante la transmisión. Por ejemplo, al comunicarnos por teléfono en lenguaje cotidiano, conectamos los símbolos By P mediante una arista, ya que el receptor puede no ser capaz de distinguirlos. Llamaremos a G el grafo de confusión. El ciclo C5 de longitud 5 jugará un papel importante en nuestra discusión. En este ejemplo, puede que 1 y 2 se confundan, pero no 1 y 3, etc. De manera ideal, nos gustaría utilizar los cinco símbolos para la transmisión. Pero dado que queremos comunicarnos sin errores podemos utilizar únicamente un símbolo de cada uno de los pares que pueden confundirse (suponiendo que se envíen símbolos de uno en uno independientemente). Así pues, para el ciclo C 5 sólo podemos utilizar dos símbolos diferentes (cualesquiera que no estén conectadas por una arista). En el lenguaje de la teoría de la información, esto significa que para el ciclo de longitud 5 logramos una tasa de información de 10g2 2 = 1 (en lugar de la máxima 10g2 5 :::::; 2.32). Es claro que según este modelo, para un grafo arbitrario G = (\1, E), lo mejor que podemos hacer es transmitir símbolos de un conjunto independiente máximo. De este modo, la tasa de información, siempre que enviemos símbolos independientes, es log2 a( G), donde a( G) es el número de independencia de G. Veamos si podemos incrementar la tasa de información utilizando cadenas más largas en lugar de símbolos independientes. Supongamos que queremos transmitir cadenas de longitud 2. Las cadenas Ul U2 YVl V2 sólo pueden confundirse si se da alguno de los tres casos siguientes: Ul = Vl

Y U2 puede confundirse con V2,

o

U2

= V2 Y Ul puede confundirse con

o

Ul

i=-

Vl

pueden confundirse y U2

Vl,

o

i=- V2 pueden confundirse.

Claude Shannon

1 5

2

214

Comunicar sin errores En ténninos de la teoría de grafos, esto lleva a considerar GI x G2 de dos grafos G I = (VI, El) Y G 2 = (112, E 2 ). El grafo G I x G 2 tiene como conjunto de vértices VI x 112 = {( UI, U2) : UI E VI, U2 E V 2 }, donde ( UI, U2) =1= (VI, V2) están conectados mediante una arista si y sólo si Ui = Vi Ó UiVi E Ei para i = 1,2. El grafo de confusión para las cadenas de longitud 2 es por tanto G 2 = G x G, el producto del grafo de confusión G para símbolos independientes consigo mismo. La tasa de información de cadenas de longitud 2 por símbolo viene entonces dada por 2 10g20:(G )

2

_

-

1 cpmG2) og2yO:,U-j.

Por supuesto, podemos utilizar cadenas de cualquier longitud n. El n-ésimo grafo de confusión Gn = G x G x ... x G tiene como conjunto de vértices vn = {(UI, ... ,Un ): ui E V}con(Ul, ... ,Un ) =1= (VI, ... V n ) conectados mediante una arista si Ui = Vi Ó UiVi E E para todo i. La tasa de infonnación por símbolo determinada por cadenas de longitud n es

¿Qué podemos decir sobre 0:( Gn)? En primer lugar observamos lo siguiente: sea U ~ V uno de los conjuntos independientes máximos de G, de manera que IUI = 0:. Los vértices o:n de Gn de la fonna (UI, ... , un), Ui E U para todo i, fonnan claramente un conjunto independiente en Gn. De aquí

y por tanto

\/o:(Gn)

2':

o:(G),

lo cual significa que la tasa de infonnación nunca decrece utilizando cadenas largas en lugar de símbolos independientes. Esta, por cierto, es una idea básica en la teoría de códigos: Codificando símbolos en cadenas más largas podemos hacer que la comunicación sin errores sea más eficaz. Si dejamos de tener en cuenta el logaritmo llegamos a la definición fundamental de Shannon: la capacidad de error cero de un grafo G viene dada por

8(G) := sup \/o:(Gn) , n?:l

y el problema de Shannon era calcular 8 (G), Y en particular 8 ( 0 5 ). Echemos un vistazo a 0 5 . Hasta donde sabemos, 0:(05 ) = 2 ::; 8(05 ). Mirando el 5-ciclo tal y como se dibujó antes, o al producto 0 5 x 0 5 como se muestra al margen, vemos que el conjunto {(1, 1), (2,3), (3,5), (4,2), (5, 4)} es independiente en 0 52 . Por tanto, tenemos 0:(052 ) 2': 5. Puesto que un conjunto independiente puede contener sólo dos vértices de dos filas consecutivas, vemos que 0:(052 ) = 5. En consecuencia, utilizando cadenas de longitud 2 hemos incrementado la cota inferior para la capacidad hasta 8 (05 ) 2': /5. Hasta aquí no tenemos cotas superiores para la capacidad. Para obtener tales cotas seguiremos de nuevo las ideas originales de Shannon. En primer lugar

Comunicar sin errores

215

necesitamos la definición dual de un Un e <:: Ves un subgrafo completo o clan! si dos vértices cualesquiera de e están unidos mediante una arista. Por ejemplo, los vértices son clanes triviales de tamaño 1, las aristas son los subgrafos completos de tamaño 2, los triángulos son de tamaño 3, y así sucesivamente. Sea C el conjunto de clanes en G. Consideramos una distribución de probabilidad arbitraria x = (xv : v E en el conjunto de esto es, Xv 2: O Y ¿vEV Xv = 1. Para cada distribución x asociamos el "valor máximo de un clan"

:\(x) = max L X v , CEe

vEC

y finalmente hacemos

:\(G) = min:\(x) = minmax ~ x

CEe

x

L-,

Xv.

vEC

Para ser precisos deberíamos utilizar ínfimo en lugar de mínimo, pero de hecho el mínimo existe, porque :\(x) es continua en el conjunto compacto de todas las distribuciones. Consideramos ahora un conjunto independiente U <:: V de tamaño máximo 0;( G) = 0;. Asociada a U definimos la distribución Xu = (xv : v E V) haciendo Xv = ~ si v E U Y Xv = O en otro caso. Puesto que cualquier clan contiene a lo sumo un vértice de U, inferimos que :\(xu) = ~, yen consecuencia, por la definición de :\ (G), que 1

ó

:\(G) ::::; o;(G)

Lo que observó Shannon es que :\( G) -1 es, de hecho, una cota superior para todo \lo; (Gn), y de aquí que también lo sea para 8 (G). Para demostrarlo es suficiente demostrar que para cualquier par de grafos G, H se verifica

:\(G x H)

=

:\(G):\(H) ,

(1)

ya que esto implicará :\ (Gn) = :\ ( G) n y de aquí

:\(G n )-1

=

:\(G)-n

:\(G)-I.

Para demostrar (1) usamos el teorema de dualidad de la programación lineal (véase [1]) y obtenemos

:\(G) = minmax ~ x

CEe

L-,

vEC

Xv =

maxmin ~ Yc, y

vEV L-, C3v

(2)

donde la parte de la derecha recorre todas las distribuciones de probabilidad y = (Yc : e E C) en C. Consideremos G x H, y sean x y x' distribuciones que alcanzan el mínimo, :\(x) = :\(G), :\(x ' ) = :\(H). En el conjunto 1NdT.

Véase la nota al pie de la página 207.

Comunicar sin errores

216

de vértices de G x H asignamos el valor z(u,v) = xux~ al vértice (u, v). Puesto que I:(u,v) Z(u,v) = I:u Xu I:v x~ = 1, obtenemos una distribución. A continuación observamos que los clanes maximales en G x H son de la forma e x D = {(u, v) : u E e, v E D}, donde e y D son clanes en G y H respectivamente. De aquí obtenemos

A(G x H) ::; A(Z)

max

CxD

Z(u,v) (u,v)ECxD

max ~

CxD¿ uEC

Xu

~ x~ = A(G)A(H) ,

¿ vED

por la definición de A(G x H). De la misma manera la desigualdad en sentido contrario '\(G x H) 2: A(G)A(H) se demuestra utilizando la expresión dual para A( G) en (2). Resumiendo, podemos concluir que para cualquier grafo G,

Apliquemos nuestros descubrimientos al S-ciclo y, de manera más general, al m-ciclo m . Utilizando la distribución uniforme (~, ... , ~) en los vértices, obtenemos A(em ) ::; ~, ya que cualquier clan contiene a lo sumo dos vértices. De manera similar, escogiendo ~ para las aristas y para los vértices, tenemos ,\( em) 2: ~ por la expresión dual en (2). Concluimos que A( Cm) = ~ y por tanto

e

°

8(Cm

m

) ::;

2

para todo m. Ahora, si m es par, entonces es claro que a(Cm ) = 'q-, y por tanto también 8(Cm ) = 'q-. Para m impar, sin embargo, obtenemos que a(Cm ) = m 2I. Para m = 3, el ciclo C3 es un grafo completo, y también lo es cualquier producto 0"3' lo cual implica que a(C3 ) = 8(e3 ) = 1. Así, el primer caso interesante es el S-ciclo, para el cual sabemos hasta ahora que (3)

o El paraguas de Lovász

Utilizando este enfoque de la programación lineal (y algunas otras ideas) Shannon fue capaz de calcular la capacidad de muchos grafos y, en particular, para todos los grafos con cinco o un número menor de vértices - con la única excepción de C 5 , para el que no pudo ir más allá de las cotas que se indicaron en (3). Llegado a este punto, se detuvieron las cosas durante más de 20 años, hasta que László Lovász consigió demostrar, utilizando un argumento sorprendentemente sencillo, que 8 (C 5 ) = V5. Un problema combinatorio en aparencia muy difícil fue resuelto con una solución elegante e inesperada. La idea fundamental de Lovász fue representar a cada vértice v del grafo mediante un vector real de longitud 1, de manera que cualesquiera dos vectores que pertenecen a vértices no adyacentes en G sean ortogonales. Llamemos a este conjunto de vectores una representación ortonormal de G. Claramente, tal representación siempre existe: basta considerar los m = IVI vectores unitarios (1,0, ... , O)T, (0,1,0, ... ,O)T, ... , (0,0, ... , l)T de dimensión m. Para el grafo C 5 podemos obtener una representación ortonormal en lR?3 al considerar un "paraguas de" con cinco varillas VI, .. . , V5 de longitud una

Comunicar sin errores

217

unidad. Ahora colocamos la del paraguas en el y lo abrimos hasta el momento en que los ángulos entre varillas alternadas son de 90° . A continuación Lovász demostró que la altura h del paraguas, esto es, la distancia entre O y S; proporciona la cota

(4) Un cálculo sencillo conduce a h 2

)g; véase el recuadro a continuación. De

=

aquí se sigue que 8(05 ) ~ vÍ5,yportanto 8(05 ) = vÍ5.

b u,,'~"""vu,

se considera que un es estéticamente si, después de cortar un cuadrado de lado a, el rectángulo que queda a, b de los lados de tiene la misma forma que el Las a dicho deben verificar É.a = --a b . Definiendo la razón T := 2., a 1 O. Al resolver la ecuación cuadrática obtenemos T = oT2

a

se obtiene el número áureo T = Consideramos ahora un pentágono de lado a, y sea d la T, Y de sus diagonales. Desde Euclides XIll,8) se sabe que ~ que el punto de intersección de dos diagonales divide a las diagonales según la razón áurea. La demostración de Euclides es la Puesto que la suma total de los ángulos del pentágono es 31f, el ángulo en cualquiera de los vértices %, ya que ABE es un De aquí se sigue que <J.ABE es isósceles. Esto a su vez que <J.AM B = Y podemos concluir que los triángulos ABO y AJvI B son semejantes. El cuadrilátero OM E D es un rombo, ya que sus lados opuestos son paralelos (véanse ay = d - a. Por la semejanza los ángulos), y por tanto IMe¡ de ABO y AM B concluimos que LVL'iSH"
3;.

b-a

A


3;,

IABI IAMI

d a

a

=~=

IMOI IMAI

e =T.

Aún hay más. Para la distancia 3 de un vértice al centro S del pentágono, se invita al1ector demostrar la relación 8 2 (nótese que BS corta a la diagonal AO en un ángulo recto y la por la mitad). Para finalizar nuestra excursión por la geometría, consideramos ahora el paraguas con el pentágono regular en la superior. Puesto que las varillas alternadas (de 1) forman un ángulo recto, el teorema 32 = ,!2 = de Pitágoras nos permite obtener d = ,,12, y de v'5~5. Así, utilizando de nuevo Pitágoras, encontramos el resultado que ¡OSI: prometimos para la altura h h2

= 1_

32

= 1+

vÍ5 vÍ5+5

E

D

Comunicar sin errores

218

Veamos cómo demostró Lovász la desigualdad (4). sus resultados fueron mucho más generales), Consideramos el producto interno usual = XlYl

y = (Yl,"" Ys) en ]Rs. En esta situación, es el cuadrado de la longitud Ixl de x, yel ángulo I entre x e y viene dado por de dos vectores x

Ixl2 =

(x, x) =

=

+ .. , + XsYs

(Xl, ... , X s ),

xi + ... + x;

(x, y) COS

Ixllyl'

I =

Así (x, y) = O si y sólo si x y y son ortogonales. Nuestro siguiente objetivo es obtener la cota superior 8(G) :::; O"yl para la capacidad de Shannon de un grafo cualquiera G que tenga una representación ortonormal especialmente "agradable". Para ello, sea T = {v(1), ... ,v(m)} una representación ortonormal del grafo G en ]Rs, donde V(i) corresponde al vértice Vi. Asumimos además que todos los vectores v(i) forman el mismo ángulo (distinto de 90°) con el vector u := ~(V(l) + ... + v(m»), o de manera equivalente, que el producto interno =

O"T

tiene el mismo valor O" T -1 O para todo i. Llamemos a este valor O"T la constante de la representación T. Para el paraguas de Lovász gue representa al ciclo 0 5 , la condición (v("), u) = O"T se verifica para u = OS. Ahora continuamos con los tres pasos siguientes: (A) Consideramos una distribución de probabilidad x = y denotamos

(Xl, ... ,X m )

en V,

y

Sea U el conjunto independiente más grande en G, con IUI = a, y definimos Xu = (Xl,"" X m ) con Xi = si Vi E U, Y Xi = O en otro caso. Puesto que todos los vectores v(i) tienen longitud unitaria y (v(i) , v(j») = Opara dos vértices cualesquiera no adyacentes en G, podemos inferir que

± m

MT(G) :::; M(Xu)

=

2

II:XiV(i)1 i=l

Así, tenemos MT (G) :::; a -1, Y por tanto 1

a(G) :::; MT(G)" CH) Ahora calcularemos MT (G) mediante la desigualdad de Cauchy-Schwarz

(a, b)2 :::; para vectores a, b E ]Rs. Aplicada a a desigualdad conduce a

lal 2 =

Xl v(l)

+ ... + xmv(m) y b = u, la (5)

Comunicar sin errores Por la hipótesis (v (i) , U)

219 =

a T para todo i, tenemos

para cualquier distribucion x. En particular, esto ha de verificarse para la distribución uniforme (~, ... , ~), lo cual implica lul 2 = aTo De aquí (5) se reduce el ó Por otra parte, para x

= (~, ... , ~)

obtenemos

y por tanto hemos demostrado que (6)

En resumen, hemos establecido la desigualdad 1

a(G) :::; aT

(7)

para cualquier representación ortonormal T con constante a T. (C) Para extender esta desigualdad a 8( G) procedemos como antes. Consideramos de nuevo el producto de dos grafos G x H. Supongamos que G y H tienen representaciones ortonormales R y S en llF y lIts respectivamente, con constantes a R y a s . Sea v = (VI, ... , V r ) un vector en R y W = (WI, ... , w s ) un vector en S. Al vértice en G x H correspondiente al par (v, w) le asociamos el vector

Se comprueba inmediatamente que R x S := {vw T : v E R, W E S} es una representación ortonormal de G x H con constante aRaS. De aquí, por (6), obtenemos ¡'¿RXS(G x H) = ¡'¿R(G)¡'¿s(H). Para Gn

=

G x ... x G y la representación T con constante aTesto significa

y por (7) obtenemos n < aT'

Tomando en consideración todos estos pasos hemos completado el argumento de Lovász.

Teorema. Siempre que T = {v(1), ... , v(m)} sea una representación ortonormal de G con constante a T' se tiene que

8(G) :::;

1

(8) "Paraguas con cinco varillas"

220

Comunicar sin errores

tenemos u = (O, O, h= k)T Y de

Mirando al paraguas de

que

(V(i), = h = )g, lo que conduce a 8(C5 ) :::: -j5. Así pues el (J" = problema de Shannon queda resuelto. Llevemos nuestra discusión un poco más allá. Vemos por (8) que cuanto mayor sea la constante (J"T para una representación de G, mejor cota obtendremos para 8 (G). El siguiente método nos proporciona una representación ortonormal para cualquier grafo G. A G = (V, E) le asociamos la matriz de adyacencia A = (aij), que se define así: sea V = {VI, ... , V m }, entonces hacemos 2

A=

1 O 1 O O

O 1 O 1 O

O O 1 O 1

o D

La matriz de incidencia para el ciclo de longitud 5

si ViVj E E en otro caso.

e5

A es una matriz real simétrica con ceros en la diagonal principal. Ahora necesitamos dos resultados de álgebra lineal. En primer lugar, como toda matriz simétrica, A tiene m autovalores reales Al 2 A2 2 ... 2 Am (algunos de los cuales pueden ser iguales), y la suma de los autovalores es igual a la suma de las entradas de la diagonal principal de A, es decir, O. De aquí que el autovalor más pequeño tenga que ser negativo (excepto en el caso trivial en el que G no tiene aristas.) Sea p = IAm I = - Am el valor absoluto del menor autovalor y consideremos la matriz

M

:=

1

+

1

-A, p

donde 1 denota la matriz identidad (m x m). Esta M tiene como valores 1 + A= = O. El segundo resultado que Propios 1 + Al p > - 1 + A2 p > - ... > p utilizaremos es el conocido teorema de la diagonalización del álgebra lineal: Si M = (mij) es una matriz real simétrica con todos los autovalores 2 O, entonces existen vectores v(l), ... ,v(m) E JR;.s, donde s = rango(M), tales que (1:::: i,j :::: m). En particular, para M = 1 + ~ A obtenemos (V(i), V(i)) =

mii =

1

para todo i

y para i Puesto que

aij

v(l), ... , v(m)

i- j.

= O siempre que ViVj tf. E, vemos que, de hecho, los vectores forman una representación ortonormal de G.

Finalmente, apliquemos esta construcción a los m-ciclos Cm para m 2 5 impar. Aquí podemos calcular facilmente p = IAmínl = 2 cos ~ (véase el recuadro en la página opuesta). Cada fila de la matriz de adyacencia contiene dos unos, lo cual implica que cada colunma de la matriz M suma 1 + ~. Para la representación {v(l), ... ,v(m)} esto significa que (v(i), V(l)

+ ... +

v(m)) =

2

1+ -

p

1

1+--7r:-' cos -m

Comunicar sin errores

221

y de (V(i) ,

=

1 (1 m

-

+ (cos -'m-'- ) -1)

=

a

para todo i. En consecuencia, podemos aplicar nuestro resultado principal (8) y concluir que (para m 2: 5 impar).

(9)

Puesto que cos';;;:; < 1, la cota (9) es mejor que la cota 8( Cm) :S !J} que encontramos antes. Nótese también que cos ~ = ~, donde razón áurea. De aquí, para m = 5 obtenemos de nuevo =

5(vÍ5 + 1) 5 + vÍ5

=

T =

~+1 es la

V5.

Examinemos la matriz de adyacencia A del ciclo Cm' Para encontrar los autovalores (y autovectores) utilizamos las raíces m-ésimas de la unidad. Tales raíces vienen dadas por 1, (, (2, ... , (m-l para ( = - véase el recuadro en la página 25. Entonces, afirmamos que Sea ,\ (h una de esas raíces. (1,'\,,\2, ... ,,\m-l)T es un autovector de A para el autovalor ,\ +,\-1. De hecho, según la construcción de A encontramos

1

A

,\ ,\2

,\m-1

,\m-l

1

1

,\ ,\2

,\ ,\2

+ +

,\3

+

,\

1

+

,\m-2

=(,\+,\-1)

,\m-l

Puesto que los vectores (1, '\, ... , ,\ m-1) son independientes (forman lo que se conoce como una matriz de Vandermonde), concluimos que para m impar (h

+ eh

[(cos(2k1r /m) =

+ i sen(2k1r /m)]

+ [cos(2k1r/m) - isen(2k1r/m)] 2cos(2k1r/m) (O:S k:S m 2 1)

son todos los autovalores de A. Además, puesto que el coseno es una función decreciente, -2cos es el menor de los autovalores de A.

7f

m

222

Por ejemplo, para m sabemos es 4r<=

Comunicar sin errores

=

7 todo lo que 7

v 108 :S 8( C 7 ) :S 1 + (cos'71r) - l ' que es 3.2237:S 8( C 7 ) :S 3.3177.

La representación ortogonal que resulta de esta construcción es, por exactamente el paraguas de Lovász. y ¿qué ocurre con G7 , Gg , Y el resto de los ciclos impares? Considerando a(G~), a(G;;J y otras potencias pequeñas, la cota inferior m;-l ::; 8(Gm ) puede ser incrementada, pero para todos los números impares m 2: 7 las mejores cotas inferiores conocidas son distintas de la cota superior dada por (8). Así, veinte años después de la fantástica demostración de Lovász de que 8( G5 ) = y5, estos problemas continúan abiertos y son considerados como muy difíciles - pero, después de todo, así estabamos al principio.

[1] V. CHVÁTAL: Linear Programming, Freeman, New York 1983. [2] W. HAEMERS: Eigenvalue methods, in: "Paeking and Covering in Combinatories" (A. Sehrijver, ed.), Math. Centre Traets 106 (1979), 15-38. [3] L. LovÁsz: On the Shannon capacity oJa graph, IEEE Trans. Information Theory 25 (1979), 1-7. [4] C. E. SHANNON: The zera-error capacity of a noisy channel, IRE Trans. Information Theory 3 (1956), 3-15.

No está claro quién dio al siguiente problema su toque humano, ni quién lo propuso por primera vez:

Imagine que en un grupo de gente se da la situación de que r:u,'1w'uu~r par de personas tiene precisamente un amigo en común. Entonces, hay siempre una persona (el "político") que es amigo de todos los demás.

En la jerga matemática, este resultado se conoce como el teorema de la amistad. Antes de abordar la demostración, formulemos de nuevo el problema en la terminología de la teoría de grafos. Interpretamos las personas como un conjunto de vértices V, y unimos dos vértices mediante una arista si las dos personas que representan son amigas. Asumimos de manera implícita que la amistad es una relación simétrica, es decir, que si u es amigo de v, entonces v también es amigo de u, y aún más, que nadie es amigo de uno mismo. Así pues, el teorema puede enunciarse de la siguiente manera:

"Sonrisa de político"

Teorema. Supóngase que G es un grafo finito en el cual cualquier pareja de vértices tiene exactamente un vértice vecino común. Entonces existe un vértice que es adyacente a todos los demás. Nótese que existen grafos finitos con esta propiedad; véase la figura, en la que u es el político. Sin embargo, estos "molinos de viento" resultan ser los únicos grafos con la propiedad deseada. De hecho, no es difícil comprobar que ante la presencia de un político, únicamente son posibles grafos del tipo de los molinos de viento. De manera sorprendente, el teorema de la amistad no se verifica para grafos infinitos. De hecho, para la construcción inductiva de un contraejemplo se puede comenzar, por ejemplo, con un 5-ciclo, y añadir reiteradamente vecinos comunes a todos los pares de vértices que no tienen aún ninguno. Esto conduce a un grafo de la amistad infinito (numerable) sin político. Existen varias demostraciones del teorema de la amistad, pero la primera, dada por Paul Erd6s, Alfred Rényi y Vera Sós, continúa siendo la más atractiva . • Demostración.. Supóngase que la afirmación es falsa y que G constituye un contraejemplo, es decir, ningún vértice de G es adyacente a todos los demás. Para llegar a una contradicción procedemos en dos partes. La primera utiliza combinatoria y la segunda álgebra lineal.

Un molino de viento

224

Sobre amigos y políticos

Afinnamos que G es un grafo

es

d( u)

=

d( v) para todo

u,v E V

<) v

Nótese en primer lugar que la condición del teorema implica que no existen ciclos de longitud 4 en G. Nos referimos a ello como la condición-C4 . Veamos en primer lugar que cualesquiera dos vértices u y v no adyacentes tienen el mismo grado d( u) = d( v). Supongamos d( u) = k Y que Wl, ... ,Wk son los vecinos de u. Exactamente uno de los Wi, por ejemplo W2, es adyacente a v, y W2 es adyacente a exactamente uno de los otros Wi, pongamos Wl, de modo que tenemos la situación representada en la figura de la izquierda. El vértice v tiene en común con Wl el vecino W2, Y con Wi (i 2: 2) un vecino común Zi (i 2: 2). Por la condición C4 todos estos Zi han de ser diferentes. Concluimos que d(v) 2: k = d(u) y, por simetría, que d(u) = d(v) = k. Para finalizar la demostración de (1), obsérvese que cualquier vértice diferente de W2 no es adyacente ni a u, ni a v, y por tanto tiene grado k, según lo que acabamos de probar. Sin embargo, puesto que d( W2) < n - 1, existe algún vértice que no es vecino de W2, Y por tanto W2 también tiene grado k, y G es k-regular. Sumando sobre los grados de los k vecinos de u obtenemos k 2 . Puesto que cualquier vértice (excepto u) tiene exactamente un vecino común con u, hemos contado cada vértice una vez, excepto en el caso de u, que ha sido contado k veces. Por tanto, el número total de vértices de G es k2

n =

-

k

+ 1.

(1)

(2) El resto de la demostración es una bonita aplicación de algunos resultados básicos de álgebra lineal. Nótese en primer lugar que k ha de ser mayor que 2, puesto que para k ~ 2, la condición (1) implica que sólo son posibles G = K 1 Y G = K 3 , Y ambos son grafos de molino de viento triviales. Consideremos la matriz de adyacencia A = (aij), tal y como se definió en la página 220. Según el apartado (1), cualquier fila tiene exactamente k unos, y por la condición del teorema, para cualesquiera dos filas existe exactamente una columna en la cual ambas tienen un 1. Aún más, nótese que la diagonal principal está compuesta de ceros. De aquí, se tiene que

1 k 1

1)

(k-1)I+J,

donde 1 es la matriz identidad y J la matriz compuesta únicamente por unos. Se comprueba inmediatamente que los autovalores de J son n (con multiplicidad 1) y O (con multiplicidad n - 1). Se sigue que A2 tiene los autovalores k - 1 + n = k 2 (con multiplicidad 1) y k - 1 (con multiplicidad n - 1). Puesto que A es simétrica, y por tanto diagonalizable, concluimos que A tiene como autovalores k (con multiplicidad 1) y ±-Jk=T Supongamos que 7" de los autovalores son iguales a vIk-=1 y que s de ellos son iguales a -vIk-=1, con 7" + S = n-l. Ahora casi hemos tenninado. Como la suma de los

Sobre amigos y políticos

225

auto valores de A es

a la traza

es

encontramos que

k+r~-svk-l =

y, en particular, r

7: s

0,

y

~=

k s-r

vm

Ahora, si la raíz cuadrada de un número natural m es racional, entonces es un entero. Una elegante demostración de este resultado fue presentada por Dedekind en 1858: Sea no el menor natural con novm E N. Si ti- N, f < 1. Haciendo nI := no( f), entonces existe f E N con < f)vm = nom - f(novm) E N. vemos que nI E N Y nI = no( Ya que nI < no, estamos ante una contradicción para la elección de no. ~ E N, entonces Volviendo a nuestra ecuación, sea h

° vm vm vm -

vm vm -

Como h divide a h 2 + 1 Y a h 2 , tenemos que h debe ser igual a 1, y por tanto k = 2, algo que ya habíamos excluido. En consecuencia, hemos llegado a una contradicción, y la demostración está completa. O Sin embargo, aquí no acaba la historia. Reformulemos nuestro teorema de la siguiente manera: Supóngase que G es un grafo con la propiedad de que entre cualesquiera dos vértices existe exactamente un camino de longitud 2. Claramente, esta formulación es equivalente a la de la condición de amistad. Nuestro teorema afirma entonces que los únicos grafos posibles son los molinos de viento. Pero, ¿qué ocurre si consideramos caminos de longitud mayor que 2? Una conjetura de Anton Kotzig afirma que la situación análoga es imposible. Conjetu.ra de Kotzig. Sea f > 2. Entonces no existen grafos finitos con la propiedad de que entre cualesquiera dos vértices exista precisamente un camino de longitud f. El mismo Kotzig verificó su conjetura para f ::; 8. En [3] se ha probado hasta f = 20, Y A. Kostochka nos ha comunicado recientemente que ahora se ha verificado para todo f ::; 33. Una demostración general, sin embargo, parece inalcanzable ....

[1] P. ERDÓS, A. RÉNYI & V. Sós: On a problem of graph theory, Studia Sci. Math. 1 (1966), 215-235. [2] A. KOTZIG: Regularly k-path connected graphs, Congressus Numerantium 40

(1983), 137-141. [3] A. KOSTOCHKA: The nonexistence of certain generalized friendship graphs, in: "Combinatorics" (Eger, 1987), Colloq. Math. Soco János Bolyai 52, NorthHolland, Amsterdam 1988, 341-356.

Comenzábamos este libro con los primeros trabajos de Paul Erd6s en teoría de números y lo concluimos con lo que posiblemente será considerado como su contribución más importante: la introducción, junto con Alfred Rényi, del método probabilístico. Enunciado de la manera más sencilla, dice así: Si, en un conjunto dado de objetos, la probabilidad de que uno de ellos no tenga una determinada propiedad es menor que 1, entonces ha de existir un objeto con esta propiedad. Por tanto, estamos ante un resultado de existencia. Puede ser muy difícil (y lo es a menudo) encontrar este objeto, pero sabemos que existe. Presentamos tres ejemplos de Erd6s (cada cuál más sofisticado) de este método probabilístico, y acabamos con una reciente y particularmente elegante aplicación. Para entrar en calor, consideremos una familia F de subconjuntos A i , todos de tamaño d 2: 2, de un conjunto X finito. Decimos que F es 2-coloreable si X puede colorearse con dos colores de modo que en cada Ai aparezcan ambos. Es evidente que no cualquier familia de conjuntos es 2-coloreable: consideremos por ejemplo todos los subconjuntos de tamaño d de un conjunto X con 2d - 1 elementos. No importa cómo utilicemos dos colores para X, habrá d elementos que reciban el mismo color. Otra observación evidente es que cualquier subfamilia de una familia 2-coloreable tiene la misma propiedad. Nos interesa el mínimo m = m(d) para el cual existe una familia con m conjuntos que no pueda colorearse con dos colores. Dicho de otra manera, m( d) es el mayor número que garantiza que cualquier familia con menos de m( d) conjuntos sí sea 2-coloreable. Teorema 1. Cualquier familia que contiene como mucho 2d d elementos es 2-coloreable, esto es, m(d) > 2d - 1 .

1

conjuntos de

• Demostración. Sea F una familia que cumple la condición del enunciado. Se colorea X de manera aleatoria y equiprobable con dos colores. Para cada A E F sea EA el suceso "todos los elementos de A tienen el mismo color". Puesto que existen precisamente dos de estas coloraciones, tenemos Prob(EA) =

Usando m =

IFI ::; 2d -

1

(~)d-l.

(nótese que los sucesos EA no son disjuntos),

Concluimos que existe alguna coloración de X con dos colores que no tiene ningún conjunto de F de un solo color. Por tanto, se verifica el teorema. O

228

La probabilidad nos lo pone fácil (aveces) Erdos estableció también una cota superior para m( d), a d 2 2d . Usó de nuevo el método probabilístico, esta vez tomando conjuntos aleatorios y una coloración fija. Los únicos valores exactos conocidos son m(2) = 3 Y m(3) = 7. El valor m(2) = 3 se alcanza para el grafo K 3 , y la configuración de Fano, formada por los siete conjuntos de tres elementos de la figura, conduce a m(3) .:s: 7. Es fácil ver que :F necesita tres colores. Probar que todas las familias de seis conjuntos de tres elementos son 2-coloreables, y por tanto que m(3) = 7, requiere un poco más de cuidado.

3

1

2

6

Nuestro siguiente ejemplo es un clásico del área: los números de Ramsey. Consideremos el grafo completo KN de N vértices. Decimos que KN tiene la propiedad (m, n) si, no importa de qué manera se coloreen las aristas de KN de azul y rojo, siempre existe un subgrafo completo con m vértices cuyas aristas son todas rojas, o uno con n vértices y todas las aristas azules. Es claro que si KN tiene la propiedad (m, n), también la tiene cualquier Ks con s ;::: N. Igual que en el primer ejemplo, nos interesa el menor número N (si existe) con esta propiedad - el llamado número de Ramsey R( m, n). Para comenzar, se tiene R(m, 2) = m, ya que o bien todas las aristas de Km son rojas, o existe una arista azul, que es un K 2 azul. Por simetría, tenemos R(2, n) = n. Ahora supongamos que existen R(m - 1, n) y R(m, n - 1). Probaremos que existe R( m, n) y que

:s:

R(m, n)

A aristas rojas

v

B

R(m - 1, n)

+

R(m, n - 1).

(1)

Sea N = R(m - 1, n) + R(m, n - 1), Y consideremos una coloración arbitraria en rojo y azul de K N . Para un vértice v, llamamos A al conjunto de vértices conectados con v mediante una arista roja, y B a los vértices conectados mediante una arista azul. Puesto que IAI + IBI = N 1, tenemos que o bien IAI ;::: R(m - 1, n), o bien IBI;::: R(m,n-1). Supongamos que IAI;::: R(m-1,n) (el otro caso es análogo). Por la definición de R( m - 1, n), o bien existe en A un subconjunto ARde tamaño m - 1 cuyas aristas son todas rojas (que proporciona, junto con v, un Km rojo), o existe un subconjunto A B de tamaño n con todas las aristas azules. Inferimos que KN satisface la propiedad (m, n), de donde se sigue la afirmación (1). Combinando (1) con los valores iniciales R(m,2) = m y R(2, n) = n, y utilizando la conocida recursión para coeficientes binomiales, obtenemos que

R(m,n)

< ( m+n m-1

2),

y en particular, que

R(k,k)

:s:

2)

2k ( k-1

3) +

2k ( k-1

3)

(2k k-2

< 22k~3.

-

(2)

Ahora lo que realmente nos interesa es encontrar una cota inferior para R( k, k). Para ello hemos de probar que para un N < R(k, k) tan grande como sea posible existe una coloración de las aristas de manera que no haya ningún Kk azulo rojo. Aquí entra en juego el método probabilístico.

La probabilidad nos lo pone fácil (aveces)

229

Teorema Para todo k 2: 2, se tiene la 0'"'''',"',,''' cota números Ramsey:

mio,",nr

para los

R(k, k) 2: 2~. 11 Demostración. Tenemos R(2, 2) = 2. Por (2) sabemos que R(3, 3) :S 6, Y el grafo K5 coloreado como en la figura muestra que R(3, 3) = 6. Sea ahora k 2: 4. Suponemos que N < 2~, Y consideramos todas las coloraciones de KN, donde cada arista se colorea independientemente de azulo rojo con probabilidad ~. Por tanto, todas las coloraciones tienen la misma probabilidad, Ten. Sea A un conjunto de vértices de tamaño k. La probabilidad del suceso A R , todas las aristas de A están coloreadas de rojo, es entonces

Tm.

De aquí se sigue que la probabilidad P R de que las aristas de algún conjunto de tamaño k estén coloreadas de rojo está acotada por

PR

=

Prob(

UA IAI=k

R)

<

L

Prob(AR )

IAI=k

Ya que N < 2~ Y k 2: 4, Y usando (~) página 12), tenemos

< 21!~1 para k > 2 (véase la

Por tanto P R < ~,y simétricamente P B < ~ para la probabilidad de que haya k vértices con todas las aristas azules. Concluimos que PR + PB < 1 para

N < 2~, de manera que debe existir una coloración sin ningún Kk rojo ni azul, lo que significa que K N no tiene la propiedad (k, k). O

Por supuesto, hay una importante diferencia entra las cotas inferior y superior para R( k, k). A pesar de la sencillez de esta demostración sacada de El Libro, en los 50 años posteriores al resultado de Erd6s no se ha hallado ninguna cota inferior con un exponente mayor. Es más, nadie ha sabido demostrar ni una cota inferior de la forma R(k, k) > 2( ~+E)k, ni una cota superior de la forma R(k, k) < 2(2-E)k, para cualquier E> O fijo. Nuestro tercer resultado es otra bonita ilustración del método probabilístico. Se considera un grafo G de n vértices y número cromático x( G). Si x( G) es grande, esto es, si necesitamos muchos colores para colorearlo, podríamos sospechar que G contiene un sub grafo completo grande. Sin embargo, esto está lejos de ser cierto. En los años cuarenta, Blanche Descartes (y otros; véase el recuadro en la página siguiente) construyó grafos con número cromático arbitrariamente grande y sin triángulos, es decir, en los que cada ciclo tiene longitud como mínimo 4. Sin embargo, en esos ejemplos hay muchos ciclos de longitud 4. ¿Podríamos eliminarlos? ¿Podríamos pedir que no haya ciclos cortos y aún así tener el número cromático arbitrariamente grande? ¡Sí, podemos! Para precisar, llamemos cintura ¡( G) a la mínima longitud de un ciclo en G. Entonces se verifica el siguiente teorema, probado por primera vez por Paul Erd6s.

rojo

'::,::" ... :/~~~i'\" ... ::::.' ~"~

.... ",

... ~, . . ,<

:/ ............... , .............,

/~.......... """",,~\.

230

La probabilidad nos lo pone fácil (a veces)

He aquí una sucesión de grafos G 31 G 41 .•. sin triángulos con

n.

e

Empieza con G 3 = 5; por tanto X( G 3 ) 3. 5 , el ciclo de Supongamos que ya hemos construido el grafo con vértices V. El G n +1 tiene como vértices V U VI U {z}, donde los vértices Vi E corresponden de manera biyectiva a los v E y z es un UliCO vértice adicional. 3 clases de aristas en G n +1: primero, todas las aristas de G n ; en segundo lugar, se une cada vértice Vi exactamente a los vecinos de ven G n ; finalmente, se conecta z con todos los Vi E VI. Por tanto, a partir de G 3 el llamado grafo de 5 obtenemos como Mycielski.

e

Es claro que Gn+i no tiene triángulos. Para probar X( Gn+d = n + 1 hacemos inducción sobre n. Sea una clase de color de cualquier coloración de G n con n colores. Tiene que existir un vértice v E e adyacente a por lo menos un vértice de todas las demás clases de color; de otro modo podríamos colorear los vértices de con los n 1 colores restantes, y tendríamos X( G n ) ::; n - 1. Ahora es claro que en esta coloración con n colores, el vértice Vi E VI tiene que recibir el mismo color que el vértice v E V al que corresponde. Por tanto, los n colores aparecen en VI, Y necesitamos un nuevo color para z.

e

e

Construyendo el grafo de Mycielski

Teorema 3. Para todo entero k 2 2 existe un grafo G con número cromático X( G) > k y cintura ,( G) > k. Nuestra estrategia es similar a la utilizada en las demostraciones anteriores: Consideraremos cierto espacio de probabilidad en los grafos y demostraremos que la probabilidad para X( G) :s; k es menor que ~, y de manera similar que la probabilidad para, (G) :s; k es menor que ~. En consecuencia, tiene que existir un grafo con las propiedades deseadas . • Demostración. Sea V = {Vi, V2, ... 1 v n } el conjunto de vértices, y p un número entre O y 1 que elegiremos con cuidado más adelante. Nuestro espacio de probabilidad (} (n, p) está formado por todos los grafos con vértices en y cuyas aristas aparecen con probabilidad p de manera independiente. En otras palabras estamos ante un experimento de Bernoulli en el cual cada arista aparece con probabilidad p. Por ejemplo, la probabilidad Prob(Kn) de que aparezca el grafo completo es Prob(Kn) = p(?). En general, tenemos Prob(H) = pm(1- p)(?)-m si el grafo H tiene exactamente m aristas. Empecemos con el número cromático X(G). Sea a = a(G) el número de independencia, que es el tamaño del mayor conjunto independiente en G. Puesto que en una coloración con X = X( G) colores todas las clases de colores son independientes (y por tanto de tamaño :s; a), se verifica que xa ?:: n. Por tanto, si a es pequeño en comparación con n, entonces X tiene que ser grande, que es lo queríamos.

La probabilidad nos lo pone fácil (a veces)

23

PV"hU.U"'" 2 :::; r :::; n. La de que un de tamaño r en V sea independiente es (1 - p) (;) , y concluimos del mismo modo que en el teorema 2 que

Prob(a

~ r)

(;>1-

<

p)(;)

< n r (l - p)(;)

(n(l - p) r;-l

r

< (ne- p (r-l)/2r,

ya que 1 - p :::; e- P para todo p. Dado cualquier k > O fijo, escogemos ahora p := n continuación que para n lo suficientemente grande, Prob ( a

~ ~)

<

k

k+ 1 •

Demostraremos a

~.

(3)

1

1

De hecho, ya que n k+l crece más deprisa que log n, tenemos n k+l ~ 6k log n para n lo suficientemente grande, y por tanto p ~ 6k lo~ n. Para r := I l esto nos da pr ~ 3 log n, y por tanto

;k

que converge a Ocuando n tiende a infinito. Por tanto, (3) se verifica para todo n ~ nI, siendo nI cierto entero positivo. Ahora tratamos el segundo parametro, "( (G). Para el valor dado de k queremos demostrar que no hay demasiados ciclos de longitud:::; k. Sean i un número entre 3 y k, y A V un conjunto fijo de tamaño i. El número de ciclos de longitud i posibles en A es la mitad del número de permutaciones cíclicas de A (ya que podemos atravesar cada ciclo en dos direcciones), y por tanto igual a (i-;I)!. El número total de posibles i-ciclos es por tanto (7) (i-;I)!, Y cualquier i-ciclo e aparece con probabilidad p'. Sea X la variable aleatoria que cuenta el número de ciclos de longitud:::; k. Para estimar X usaremos dos herramientas sencillas, pero bellas: por un lado la linealidad de la esperanza, y por otro la desigualdad de Markov para variables aleatorias no negativas:

s:

Prob(X

~

EX a

a) :::; - ,

donde EX es el valor esperado de X. En el apéndice del capítulo 14 presentamos un rápido repaso de estas herramientas. Sea Xc la variable aleatoria indicatriz de ciclo e, cuya longitud es, por ejemplo, i. Esto es, hacemos Xc = 1 ó O dependiendo de si e aparece o no en el grafo; por tanto, EXc = pi. Puesto que X cuenta el número de todos los ciclos de longitud:::; k, tenemos X = :z.::: Xc, y por linealidad k

EX =

V ~

(n) (i -

k

1) 1. 1v .. 1 k k 2 'p":::; 2~n'p2:::; 2(k-2)n p ,

i

1

donde la última desigualdad se verifica porque np = n k+l ahora la desigualdad de Markov con a = ~, obtenemos Prob(X

~~)

:::;

~~

< (k _ 2) (n~)k

~

1. Aplicando

1

(k - 2)n- k+l.

La probabilidad nos lo pone fácil (a veces)

232

Puesto que el segundo miembro tiende a Ocuando n tiende a infinito, inferimos que p( X ?: ~) < ~ para n ?: n2. Casi hemos terminado. Nuestro análisis nos dice que para n ?: max(nl, n2) existe un grafo H en n vértices con a(H) < 2nk y menos de ~ ciclos de longitud::; k. Borramos un vértice de cada uno de estos ciclos y llamamos G al grafo resultante. Sabemos que ")'( G) > k. Puesto que G contiene a más de n ~ vértices y satisface a(G) ::; a(H) < 2 k' nos encontramos con n/2

n

n

X(G) ?: a(G) ?: 2a(H) > n/k

=

k,

y hemos acabado la demostración.

o

Hay construcciones explícitas de grafos (muy grandes) con cintura y número cromático grandes. (En contraste, no se sabe cómo construir las 2-coloraciones cuya existencia probamos en el teorema 2, que no contienen a grafos completos monocromáticos grandes.) Un rasgo llamativo de la demostración de Erdos es que nos proporciona la existencia de grafos relativamente pequeños con número cromático y cintura grandes. Para finalizar nuestra excursión al mundo probabilístico mostraremos un importante resultado en la teoría de grafos geométricos (que también se remonta a Paul Erdos) cuya demostración de El Libro es bastante reciente. Partimos de un grafo simple G = G (V, E) con n vértices y m aristas. Nuestro objetivo es dibujar G en el plano de la misma manera en que lo hicimos para grafos planares. Sabemos del capítulo 11 - como consecuencia de la fórmula de Euler - que un grafo planar simple G tiene como mucho 3n - 6 aristas. Por tanto, si m es mayor que 3n - 6, tiene que haber cruces entre algunas aristas. El número de cruce cr( G) se define de manera natural como el menor número de cruces entre todas las maneras de dibujar G, sin permitir que más de dos aristas se crucen en un punto. Por tanto, cr( G) = O si y sólo si G es planar. En el dibujo con cr( G) mínimo buscado se prohíben las siguientes situaciones: ~

Ninguna arista se puede cruzar a sí misma.

<11

No se pueden cruzar aristas que tienen un vértice en común.

~

Ningún par de aristas se puede cruzar dos veces.

Nótese que en cualquiera de estos casos podemos construir un dibujo diferente del mismo grafo con un número menor de cruces usando las operaciones de la figura. Por tanto, a partir de ahora supondremos que cualquier dibujo se ajusta a estas reglas. Supongamos que se ha dibujado G en el plano con cr( G) cruces. Veremos a continuación que hay una cota inferior inmediata para el número de cruces. Consideramos el grafo H, cuyos vértices son todos los vértices de G más todos los puntos de cruce, y cuyas aristas son todas las piezas de las aristas originales según caminamos de un punto de cruce a otro. El nuevo grafo H es plano y simple, por las tres condiciones de antes. El número de vértices de H es n + cr( G), y el número de aristas es m + 2cr( G),

La probabilidad nos lo pone fácil (a veces) ya que todos los vértices nuevos tienen de aristas de un grafo plano tenemos

m

+ 2cr(G)

:$

233 4. Utilizando la cota del número

3(n + cr(G)) - 6,

esto es,

cr(G) 2: m

3n + 6.

(4)

Por ejemplo, para el grafo completo K6 calculamos cr(K6 ) 2: 15 - 18 + 6 = 3, y, en efecto, hay un dibujo con solamente 3 cruces. La cota (4) es bastante buena si m es lineal en n, pero la situación es diferente cuando m es más grande comparado con n. Esta es la afirmación de nuestro siguiente teorema. Teorema 4. Sea G un grafo simple con n vértices y m aristas, donde m 2: 4n. Entonces 1 m3 cr(G) > - - 64 n 2 La historia de este resultado, conocido como el lema de los cruces, es bastante interesante. Fue conjeturado por Erd6s y Guy en 1973 (con alguna constante e en lugar de l4). Las primeras demostraciones fueron dadas por Leighton en lugar de l4) y de manera independiente por en 1982 (con la constante Ajtai, Chvátal, Newborn y Szemerédi. El lema de los cruces apenas fue conocido (de hecho, mucha gente lo supuso una conjetura bastante tiempo después de las demostraciones originales), hasta que László Székely mostró su utilidad en un artículo muy bonito, en el que lo aplicó a varios problemas extremales de geometría, hasta entonces considerados difíciles. La demostración que presentamos a continuación se debe a conversaciones por correo electrónico entre Bernard Chazelle, Micha Sharir yErno WelzI, y sin duda se merece un sitio en El Libro .

160

• Demostración. Consideramos un dibujo minimal de G, y sea p un número entre O y 1, que escogeremos más adelante. Generanlos un sub grafo de G seleccionando cada vértice de G con probabilidad p de manera independiente. Llamaremos G p al sub grafo inducido obtenido de esta manera. Sean np, mp, X p las variables aleatorias que cuentan el número de vértices, aristas y cruces de Gp . Ya que la relación cr( G) - m + 3n 2: O se verifica por (4) para cualquier grafo, con total seguridad tenemos

Ahora calcularemos los valores esperados E(n p), E(m p) y E(Xp ). De manera obvia, E(np) = pn y E(mp) = p2 m , ya que una arista aparece en G p si Y sólo si lo hacen sus dos vértices extremos. Finalmente, E(Xp) = p4 cr(G), porque un corte está presente en G p si y sólo si sus cuatro vértices (¡que son distintos!) están presentes.

~

234

La probabilidad nos lo pone fácil (a veces)

Por linealidad de la esperanza se obtiene que

lo cual nos da m

3n



(5)

P

Y ahora, el golpe de gracia: elegimos p .- ;;:, que es como mucho 1, por nuestra suposición. Entonces (5) es

1

[4m

3n]

cr(G) 2: 64 (n/m)2 - (n/m)3 y hemos terminado.

D

A Paul Erd6s le habría encantado ver esta demostración.

[1] M. AJTAI, V. CHVÁTAL, M. NEWBORN & E. SZEMERÉDI: Crossing-free subgraphs, Annals ofDiscrete Math. 12 (1982), 9-12. [2] N. ALON & J. SPENCER: The Probabilistic Method, Second edition, WileyInterscience 2000.

[3] P. EROOS: Some remarks on the theory ofgraphs, Bulletin Amer. Math. Soco 53 (1947),292-294. [4] P. EROOS: Graph theory and probability, Canadian J. Math. 11 (1959), 34-38. [5] P. EROOS: On a combinatorial problem l, Nordisk Math. Tidskrift 11 (1963), 5-10.

[6] P. EROOS & R. K. GUY: Crossing number problems, Amer. Math. Monthly 80 (1973),52-58. [7] P. EROOS & A. RÉNYI: On the evolution ofrandom graphs, Magyar Tud. Akad. Mat. Kut. Int. Kozl. 5 (1960), 17-61.

[8] T. LEIGHTON: Complexity Issues in VLSI, MIT Press, Cambridge MA 1983. [9] L. A. SZÉKELY: Crossing numbers and hard Erdtfs problems in discrete geometry, Combinatorics, Probability, and Computing 6 (1997), 353-358.

El Libro de las demostraciones

235

Nos alegra tener la posibilidad, y el privilegio, de ilustrar este libro con los maravillosos dibujos originales de Karl Heinrich Hofmann (Darmstadt). ¡Gracias! Los poliedros regulares de la página 66 y el desarrollo en el plano de una esfera flexible de la página 74 son obra de WAF Ruppert (Viena). Jürgen Richter-Gebert nos proporcionó dos ilustraciones de la página 68. En la página 203 aparece el Weisman Art Museum de Mineápolis, diseñado por Frank Gehry. La foto de su fachada occidental es de Chris Faust. El plano pertenece a la Galería Dolly Fiterman Riverview, que se encuentra por detrás de esta fachada. Los retratos de Bertrand, Cantor, Erd6s, Euler, Fermat, Herglotz, Hermite, Hilbert, Pólya, Littlewood y Sylvester pertenecen al archivo fotográfico del Mathematisches Forschungsinstitut Oberwolfach, con autorización. (¡Muchas gracias a Annette Disch!) Los sellos con retratos de Buffon, Chebyshev, Euler y Ramanujan provienen de la colección de sellos matemáticos de Jeff Miller, accesible en la dirección http://jeff560.tripod.com, y han sido reproducidos con su generosa autorización. El retrato de Hermite procede del primer volumen de sus obras completas. La foto de Claude Shannon fue proporcionada por el MIT Museum y aparece reproducida en este libro con su permiso. El retrato de Cayley está tomado del "Photoalbum für WeierstraB" (editado por Reinhard B611ing, Vieweg 1994), con permiso de Kunstbibliothek, Staatliche Museen zu Berlin, Preussischer Kulturbesitz. El retrato de Cauchy está reproducido, con autorización, de Collections de l'École Polytechnique, París. El retrato de Fermat está tomado de Stefan Hildebrandt y Anthony Tromba: The Parsimonious Universe. Shape and Form in the Natural World, SpringerVerlag, New York 1996. El retrato de Emst Witt pertenece al volumen 426 (1992) del Joumal für die Reine und Angewandte Mathematik, con autorización de Walter de Gruyter Publishers. Fue tomada alrededor de 1941. La foto de Karol Borsuk fue tomada en 1967 por Isaac Namioka, y ha sido reproducida aquí con su amable autorización. Damos las gracias al DI. Peter Spemer (Braunschweig) por el retrato de su padre, y a Vera Sós por la foto de Paul Turán. ¡Gracias a Noga Alon por el retrato de A. NiHi!

aguja de Buffon, 133 ángulo diedro, 47 obtuso, 79 anillo de división, 23 anticadena,151 árbol, 57 de Calkin-Wilf, 95 etiquetado, 173 arista, 56 de un poliedro, 50 aristas múltiples, 56 barajar, 157 estrategias, 159, 163 base de retícula, 70 bien ordenado, 105 biyección, 93, 191 bosque, 57 con raíz, 177 bucle, 56 cadena, 151 camino, 57 caminos en retículas, 167 canal, 213 capacidad de error cero, 214 cara, 50, 65 cardinal, 93, 105 centralizador, 23 centro, 23 ciclo, 57 cintura, 229 clan, 207, 215 coeficientes binomiales, 13 coloración con listas, 200 de grafos, 199 por listas, 186 combinatoriamente equivalente, 51 comparación de coeficientes, 39

condición-C4 ,224 conexo, 57 configuración de puntos, 59 congruentes, 51 conjetura de Borsuk, 85 conjunto finito, 151 independiente, 57, 185 ordenado, 105 continuo, 99 convergencia, 39 cuadrado latino, 179, 185 parcial, 179 cuadrados, 18 cubo unidad, 50 cuerpo finito, 23 primo, 18 denso, 103 desigualdad de Cauchy-Schwarz, 109 de Markov, 84 desigualdades, 109 determinante, 167 de Jacobi, 37 dimensión, 99 de un grafo, 140 distribución de probabilidad, 209 doble recuento, 142 emparejamiento estable, 188 espacio de probabilidad, 84 esperanza, 84 estrella, 55 faceta, 50 familia de caminos disjuntos en vértices, 167 crítica, 154

238

temático

familia entrecruzada, 152 fórmula de Binet-Cauchy, 169, 175 de Cayley, 173 de clases, 24 de Euler para poliedros, 65 de Stirling, 11 fórmulas de adición, 128 función de Newman, 97 impar, 128 lineal sobre Q, 46 par, 130 periódica, 128 zeta de Riemann, 41 grado de entrada, 187 de salida, 187 de un vértice, 66, 143, 186 medio, 66 grafo,56 bipartito, 57, 188 bipartito completo, 56 completo,56 de confusión, 213 de aristas, 190 de Mycielski, 230 de un politopo, 51 dirigido, 187 dirigido acíclico, 168 dirigido con pesos, 167 dual,65 dual,199 planar,65 plano, 65, 200 plano casi-triangulado, 200 simple, 56 sin C 4 , 144 sin triángulos, 230 grafos de Turán, 207 isomorfos, 57

incidente, 56 invariante de Dehn, 47 involución, 20

matriz de adyacencia, 220 de caminos, 167 de incidencia, 54, 142 de rango 1, 86 media armónica, geométrica y aritmética,109 de divisores, 143 método probabilístico, 227 mezcla por imbricación, 163 mismo tamaño, 93 molino de viento, 223 núcleo, 187 numerable, 93 número cromático por listas, 186 de clan, 209 de cruce, 232 de independencia, 213, 230 de Ramsey, 228 ordinal, 105 ordinal inicial, 106 primo, 3,7 números armónicos, 10 de Bernoulli, 40, 130 de Fermat, 3 de Mersenne, 4 irracionales, 27 pentagonales, 193 orden de un elemento, 4

hipótesis del continuo, 102 identidades de particiones, 191 de Rogers-Ramanujan, 195

paradoja de los cumpleaños, 157 paraguas de Lovász, 216 partición, 191 plano proyectivo, 145

temático poliedro, 45, 50 de SchOnhardt, 204 poliedros equicompletables, 45 equidescomponibles, 45 polígono, 50 elemental, 69 polinomio complejo, 117 con raíces reales, 111, 120 en coseno, 121 polinomios de Chebyshev, 122 politopo, 79 convexo, 50 postulado de Bertrand, 7 principio del palomar, 139 problema de Dinitz, 185 de la pendiente, 59 de Littlewood-Offord, 123 del coleccionista, 158 tercero de Hilbert, 45 producto de grafos, 214 escalar, 86 infinito, 191 proporción áurea, 217

239 sub grafo, 57 completo, véase clan inducido, 57, 187 sub sucesiones monótonas, 140 sucesión refinadora, 177 suma de dos cuadrados, 17

raíces de la unidad, 25 rectángulo latino, 180 tangencial, 111 regla de detención, 160 representación hiperbinaria, 96 ortonormal,216 retícula, 69

tamaño de un conjunto, 93 tasa de transmisión, 213 teorema de Sylvester-Gallai, 68 de Chebyshev's theorem, 118 de Dehn-Hadwiger, 47 de Erd6s-Ko-Rado, 152 de la amistad, 223 de la galería de arte, 204 de Lagrange, 4 de Legendre, 8 de los cuatro colores, 199 de los dos cuadrados, 17 de los números primos, 10 de Lovász, 219 de Pick, 69 de rigidez de Cauchy, 71 de SchrOder-Bemstein, 100 de Spemer, 151 de Sylvester, 13 de Sylvester-Gallai, 53 de Turán, 207 del buen orden, 105 del matrimonio, 154 del punto fijo de Brouwer, 147 matricial de los árboles, 175 tercer problema de Hilbert, 45 triángulo tangencial, 111 truco de Herglotz, 127

serie

unimodal, 12

de Euler, 35 diatómica de Stem, 95 series de potencias formales, 191 simetría central, 51 simetrización de Minkowski, 81 símplice, 50 símplices en contacto, 75 sistema de conjuntos 2-coloreable, 227 de representantes distintos, 154

variable aleatoria, 84 vecino, 56 vectores casi-ortogonales, 86 vértice, 50, 56 convexo, 205 vértices adyacentes, 56 vigilantes del museo, 203 volumen, 74

Related Documents


More Documents from "Mision Rahma Peru"

March 2021 0
Series Fourier
January 2021 0
January 2021 0