Title: Sin t
1Von Neumann, Nash, Mentes Brillantes y la Teoría
de Juegos Guillermo Durán Departamento de
Computación Facultad de Ciencias Exactas y
Naturales Universidad de Buenos Aires
2Imaginemos el siguiente juego (macabro, por
cierto) Dos personas, que llamaremos A y B, son
colocadas en habitaciones separadas con un botón
próximo a cada una. Saben que ambos serán
matados a menos que uno apriete su respectivo
botón en la próxima hora. La primer persona que
apriete el botón salvará a la otra, pero se
condenará a su propia muerte. Asumiremos que A y
B se aman mutuamente. Qué estrategia tendrá
cada uno?
3Claramente, ambos deben hacer una evaluación de
quien debe salvarse y obrar en consecuencia. Repr
esentemos las estrategias posibles en una matriz
4El caso sencillo es cuando los dos llegan a la
misma conclusión A debe salvarse y B
sacrificarse, o viceversa. Serían los casos
(1,1) y (2,2) de la matriz. En el primero A
espera que B toque el botón, y ambos están de
acuerdo. En el segundo, B espera que A toque el
botón, y listo.
5Los casos de conflicto son los otros dos, y en
cierta medida son similares entre sí. El de
(2,1) lo podríamos llamar el de amor profundo.
Ambos quieren salvar al otro. En este caso se
desataría una carrera por llegar primero al botón
para cumplir con el deseo. El de (1,2) lo
podríamos llamar el de amor, pero no tanto.
Ambos esperan el sacrificio del otro. En este
caso, van a esperar hasta el último segundo para
apretar el botón (una especie de carrera para
llegar último al botón).
6El dilema nuclear un juego un poco más
real En Agosto de 1949 la Unión Soviética
explotó su primer bomba atómica en Siberia,
demostrando que ya poseía la tecnología
necesaria. Mucho antes de lo que los americanos
(y sus aliados) habían esperado ya había dos
poderes atómicos. El mundo estaba ante una
situación similar a la que mostramos en el juego
anterior.
7 Estados Unidos y la Unión Soviética tenían dos
opciones apretar el botón nuclear y hacer
desaparecer a su enemigo de la faz de la tierra o
mantener su poderío nuclear como una amenaza
latente.
8El caso (1,1) de la matriz ahora no es posible,
por motivos obvios. Los casos simétricos (1,2) y
(2,1) permitían terminar definitivamente con el
enemigo, pero pagando el costo mundial del uso de
la bomba. El caso (2,2) aparecía como una suerte
de equilibrio donde los dos mantenían la
amenaza latente (y de hecho fue lo que pasó en la
práctica).
9 Para 1950, importantes sectores de USA y sus
aliados europeos creían que Estados Unidos debía
contemplar seriamente la idea de un ataque
nuclear sobre la entonces URSS. Lo llamaban la
guerra preventiva. Contra lo que uno podría
suponer, la guerra preventiva estaba defendida
por algunos de los principales intelectuales
americanos, entre ellos dos de los más famosos
matemáticos del momento Bertrand Russell y John
von Neumann.
10John von Neumann (1903-1957) fue el creador de la
teoría de juegos. Desde la década del 20 estuvo
trabajando en la estructura matemática del poker
y otros juegos, pero enseguida vio que sus
teoremas podían ser aplicados a economía,
política, relaciones internacionales, etc. JVN
demostró matemáticamente que siempre hay un curso
racional de acción para juegos de dos jugadores,
con intereses completamente opuestos (uno gana y
el otro pierde). Esta prueba es conocida como el
Teorema Minimax.
11La clase de juegos cubiertos por este Teorema
incluye un montón de juegos recreativos, desde el
ta-te-ti hasta el ajedrez. JVN probó que siempre
hay una forma optimal de jugar a dichos
juegos. La primer referencia bibliográfica que
aparece sobre estos temas es un artículo de von
Neumann de 1928, ampliado años después en el
libro Theory of Games and Economic Behavior, de
von Neumann y Morgenstern, publicado en 1944.
12Qué es la Teoría de Juegos? Es la teoría
matemática que modela situaciones de conflicto.
Una situación de conflicto (un juego) es una
situación en la cual individuos (jugadores)
interactúan y obtienen resultados que dependen de
tal interacción. Cada jugador tiene control
parcial de la situación. Cada jugador tiene
ciertas preferencias sobre los resultados
posibles y se asume que estas preferencias son
descriptas por una función numérica (función de
utilidad). Cada jugador trata de llevar a cabo
las estrategias que resulten más favorables a sus
intereses, o sea, trata de maximizar su función
de utilidad.
13Tradicionalmente la TdJ clásica se ha dividido en
dos ramas Teoría Cooperativa y No
Cooperativa. La TdJ No Cooperativa asume que no
hay lugar para comunicación, correlación o
acuerdos entre los jugadores, de no ser los
explícitamente estipulados por las reglas del
juego. Es de interés el describir
recomendaciones para los jugadores tales que
ninguno tenga incentivos para unilateralmente
desviarse (si los demás siguen las
recomendaciones, y yo me muevo, pierdo). Esta
idea corresponde al concepto de Equilibrio de
Nash. Es el concepto más importante en Teoría No
Cooperativa y su estudio formal (John Nash, 1950)
marcó un hito en el tema, que le terminó dando a
Nash el premio Nobel de Economía en 1994 por su
análisis pionero del equilibrio en la teoría de
los juegos no cooperativos.
14El Dilema del Prisionero Es el problema madre
en Teoría de Juegos y tiene infinitas
formulaciones diferentes. Veamos una de ellas
son detenidos dos hombres acusados de cometer un
crimen y son encarcelados en celdas
diferentes. El juez tiene ciertos indicios sobre
la culpabilidad de ambos, pero decide hacer un
interrogatorio planteándoles el siguiente dilema
15- Si ambos se declaran inocentes, serán condenados
a 3 años de prisión cada uno. - Si ambos acusan al otro, serán condenados a 10
años de prisión cada uno. - Si uno se declara inocente y es acusado por su
compañero, será condenado a 20 años de prisión,
mientras al otro le corresponde sólo 1. - Llamaremos C a la estrategia cooperativa
(declararse inocente) y D a la estrategia
defraudativa (acusar al otro).
16La matriz de pagos queda entonces de la siguiente
manera
Una interpretación más interesante de situaciones
que presentan las características del Dilema del
Prisionero se presenta cuando dos empresas
compiten en la venta de un mismo producto y
tienen que fijar el precio del mismo. Pueden
definir una estrategia de competición con la otra
empresa y fijar un precio bajo (estrategia D), o
elegir una estrategia de cooperación y fijar un
precio alto (estrategia C).
Es inmediato verificar que el único equilibrio de
Nash de este juego es (D,D) .
17Sin embargo, a simple vista resulta muy atractivo
el resultado que surge de usar las estrategias
(C,C) y naturalmente uno se preguntará si en
alguna otra versión del modelo esta estrategia
goza de una estabilidad apropiada. Un camino que
da respuesta satisfactoria a este hecho surge de
considerar un modelo donde el juego en cuestión
se repite.
18Ejemplos de estrategias en juegos repetidos
Estrategia Gatillo
Estrategia C-tft
Observación estas estrategias asumen que los
juegos son infinitos. La asunción de finitud
modifica en parte las estrategias (excepto que el
juego se repita una cantidad finita de veces,
pero el número final sea desconocido).
19Freno o no freno? En la vida cotidiana nos
topamos con este tipo de decisiones todos los
días. Supongamos que llegamos a una esquina en
simultáneo con otro auto. Para darle un sentido
económico al ejemplo, supongamos tambien que
Lavagna abrió el corralito en forma muy
restringida y que cada sucursal va a devolverle
la plata al primero que llegue, y que justamente
quien maneja el otro auto que llegó a la esquina
conmigo tiene su plazo fijo en la misma sucursal
que yo (y que además somos los dos que estamos
por llegar primero).
20La matriz de pagos podría ser la
siguiente Cuáles son los equilibrios
de Nash de este juego?
21La Teoría de Movidas (TOM) (Theory of Moves,
Steven Brams, 1994) Asume juegos estrictamente
ordinales. Supongamos que tenemos dos actores (el
jugador fila F y el jugador columna C) cada uno
con dos posibles decisiones. Cada jugador
ranquea los 4 estados del juego de 1 a 4 (1 es el
peor estado, 4 es el mejor). Por ejemplo
C1 C2
F1 F2
22Estos resultados son sólo ordinales, indican sólo
un ordenamiento de los resultados de mejor a
peor. No da ninguna graduación sobre cuanto la
prefiere un jugador a un resultado sobre los
otros. Sólo indica las preferencias de los
jugadores. Primera diferencia entre la TOM y la
TJC es que para la TJC importan las utilidades
mientras que para la TOM no son relevantes.
23Otra diferencia es que en la TJC los movimientos
son en simultáneo, o al menos se realizan sin
conocer el movimiento del otro jugador. En la
TOM vamos a suponer que se mueve en forma
alternada partiendo de un estado inicial y
llegando a un estado final. Aparecen nuevos
conceptos de equilibrios y estrategias que me
llevan a mover o detenerme en un estado
determinado. Veamos aplicaciones de la TOM a
ejemplos que nos van a resultar cotidianos y
cercanos.
24La renuncia de Chacho Alvarez a la
vicepresidencia Corría octubre del 2000 y se
empezaba a resquebrajar la Alianza que había
ganado las elecciones unos pocos meses antes. El
vicepresidente de la Nación (y líder de uno de
los partidos de la Alianza) había denunciado
coimas en el Senado en la aprobación de la ley de
reforma laboral. El presidente de la Nación (y
uno de los líderes del otro partido de la
Alianza) se debatía entre investigar a fondo las
denuncias apoyando a su vicepresidente (y
fortaleciendo la Alianza) o no hacer nada,
dejando pedalear en el aire a Chacho. Chacho
Alvarez se debatía entre renunciar o no renunciar.
25Cómo repesentamos este juego en términos de la
TOM? 1) La realidad (desde mi óptica) Cu
ál es el estado inicial? Cuál es el estado
final?
262) De la Rua estadista (obviamente ficticio
!) Cuál es el estado inicial? Cuál es el
estado final?
27El asalto Supongamos que soy asaltado por una
persona armada. Definamos mi objetivo y el del
ladrón en términos de prioridades Los
míos 1)No salir herido. 2)Que no me
roben. 3)Atraer la atención de la gente. El del
ladrón (inteligente) 1)Robarme todo lo que
tenga. 2)No llamar la atención. 3)Evitar el uso
de la fuerza (si lo llegan a agarrar la pena
es mucho peor)
28Cómo repesentamos este juego en términos de la
TOM? Cuál es el estado inicial? Cuál
es el estado final?
29Juegos Cooperativos Supongamos que tenemos 100
presos y se les plantea el siguiente
problema. Se los coloca en una fila, cada uno
con un gorro negro o blanco. El último de la fila
ve todos los gorros, excepto el suyo. El
anteúltimo de la fila ve todos los gorros,
excepto el suyo y el del último. Y asi
siguiendo... Cada preso para ser liberado debe
acertar el color de su gorro, empieza a arriesgar
el último, luego el anteúltimo, etc. Todos
escuchan lo que dicen todos.Lo único que tienen
permitido es arriesgar el color de su gorro,
absolutamente ninguna cosa más.
30Cuál será la estrategia conjunta para salvar a
la mayor cantidad de presos?
Una estrategia para salvar al menos al 50
Consiste en que cada preso de orden par dice
el color del gorro del que tiene adelante. Así,
garantizamos salvar a todos los de orden impar,
ya que la estrategia es conocida por todos de
antemano.
Una estrategia para salvar seguro a todos menos
al último de la fila (el primero que
arriesga) El preso de orden 100 dice blanco
si la cantidad de blancos que tiene adelante es
impar, y negro en caso contrario. De ahí en
adelante todos pueden deducir que gorro tienen
contando la paridad de blancos y negros de los
que tienen adelante.