teoria de juegos

30
Von Neumann, Nash, Mentes Brillantes y la Teoría de Juegos Guillermo Durán Departamento de Computación Facultad de Ciencias Exactas y Naturales Universidad de Buenos Aires

description

economia

Transcript of teoria de juegos

  • Von Neumann, Nash, Mentes Brillantes y la Teora de Juegos

    Guillermo DurnDepartamento de ComputacinFacultad de Ciencias Exactas y NaturalesUniversidad de Buenos Aires

  • Imaginemos el siguiente juego (macabro, por cierto):

    Dos personas, que llamaremos A y B, son colocadas en habitaciones separadas con un botn prximo a cada una.

    Saben que ambos sern matados a menos que uno apriete su respectivo botn en la prxima hora.

    La primer persona que apriete el botn salvar a la otra, pero se condenar a su propia muerte.

    Asumiremos que A y B se aman mutuamente.

    Qu estrategia tendr cada uno?

  • Claramente, ambos deben hacer una evaluacin de quien debe salvarse y obrar en consecuencia.

    Representemos las estrategias posibles en una matriz:

  • El caso sencillo es cuando los dos llegan a la misma conclusin: A debe salvarse y B sacrificarse, o viceversa.

    Seran los casos (1,1) y (2,2) de la matriz.

    En el primero A espera que B toque el botn, y ambos estn de acuerdo.

    En el segundo, B espera que A toque el botn, y listo.

  • Los casos de conflicto son los otros dos, y en cierta medida son similares entre s.

    El de (2,1) lo podramos llamar el de amor profundo. Ambos quieren salvar al otro. En este caso se desatara una carrera por llegar primero al botn para cumplir con el deseo.

    El de (1,2) lo podramos llamar el de amor, pero no tanto. Ambos esperan el sacrificio del otro. En este caso, van a esperar hasta el ltimo segundo para apretar el botn (una especie de carrera para llegar ltimo al botn).

  • El dilema nuclear: un juego un poco ms real

    En Agosto de 1949 la Unin Sovitica explot su primer bomba atmica en Siberia, demostrando que ya posea la tecnologa necesaria.

    Mucho antes de lo que los americanos (y sus aliados) haban esperado ya haba dos poderes atmicos.

    El mundo estaba ante una situacin similar a la que mostramos en el juego anterior.

  • Estados Unidos y la Unin Sovitica tenan dos opciones: apretar el botn nuclear y hacer desaparecer a su enemigo de la faz de la tierra o mantener su podero nuclear como una amenaza latente.

  • El caso (1,1) de la matriz ahora no es posible, por motivos obvios.

    Los casos simtricos (1,2) y (2,1) permitan terminar definitivamente con el enemigo, pero pagando el costo mundial del uso de la bomba.

    El caso (2,2) apareca como una suerte de equilibrio donde los dos mantenan la amenaza latente (y de hecho fue lo que pas en la prctica).

  • Para 1950, importantes sectores de USA y sus aliados europeos crean que Estados Unidos deba contemplar seriamente la idea de un ataque nuclear sobre la entonces URSS.

    Lo llamaban la guerra preventiva.

    Contra lo que uno podra suponer, la guerra preventiva estaba defendida por algunos de los principales intelectuales americanos, entre ellos dos de los ms famosos matemticos del momento: Bertrand Russell y John von Neumann.

  • John von Neumann (1903-1957) fue el creador de la teora de juegos.

    Desde la dcada del 20 estuvo trabajando en la estructura matemtica del poker y otros juegos, pero enseguida vio que sus teoremas podan ser aplicados a economa, poltica, relaciones internacionales, etc.

    JVN demostr matemticamente que siempre hay un curso racional de accin para juegos de dos jugadores, con intereses completamente opuestos (uno gana y el otro pierde).

    Esta prueba es conocida como el Teorema Minimax.

  • La clase de juegos cubiertos por este Teorema incluye un montn de juegos recreativos, desde el ta-te-ti hasta el ajedrez.

    JVN prob que siempre hay una forma optimal de jugar a dichos juegos.

    La primer referencia bibliogrfica que aparece sobre estos temas es un artculo de von Neumann de 1928, ampliado aos despus en el libro Theory of Games and Economic Behavior, de von Neumann y Morgenstern, publicado en 1944.

  • Qu es la Teora de Juegos?

    Es la teora matemtica que modela situaciones de conflicto. Una situacin de conflicto (un juego) es una situacin en la cual individuos (jugadores) interactan y obtienen resultados que dependen de tal interaccin.

    Cada jugador tiene control parcial de la situacin.

    Cada jugador tiene ciertas preferencias sobre los resultados posibles y se asume que estas preferencias son descriptas por una funcin numrica (funcin de utilidad).

    Cada jugador trata de llevar a cabo las estrategias que resulten ms favorables a sus intereses, o sea, trata de maximizar su funcin de utilidad.

  • Tradicionalmente la TdJ clsica se ha dividido en dos ramas: Teora Cooperativa y No Cooperativa.

    La TdJ No Cooperativa asume que no hay lugar para comunicacin, correlacin o acuerdos entre los jugadores, de no ser los explcitamente estipulados por las reglas del juego.

    Es de inters el describir recomendaciones para los jugadores tales que ninguno tenga incentivos para unilateralmente desviarse (si los dems siguen las recomendaciones, y yo me muevo, pierdo).

    Esta idea corresponde al concepto de Equilibrio de Nash. Es el concepto ms importante en Teora No Cooperativa y su estudio formal (John Nash, 1950) marc un hito en el tema, que le termin dando a Nash el premio Nobel de Economa en 1994 por su anlisis pionero del equilibrio en la teora de los juegos no cooperativos.

  • El Dilema del Prisionero

    Es el problema madre en Teora de Juegos y tiene infinitas formulaciones diferentes.

    Veamos una de ellas: son detenidos dos hombres acusados de cometer un crimen y son encarcelados en celdas diferentes.

    El juez tiene ciertos indicios sobre la culpabilidad de ambos, pero decide hacer un interrogatorio plantendoles el siguiente dilema:

  • Si ambos se declaran inocentes, sern condenados a 3 aos de prisin cada uno.

    Si ambos acusan al otro, sern condenados a 10 aos de prisin cada uno.

    Si uno se declara inocente y es acusado por su compaero, ser condenado a 20 aos de prisin, mientras al otro le corresponde slo 1.

    Llamaremos C a la estrategia cooperativa (declararse inocente) y D a la estrategia defraudativa (acusar al otro).

  • La matriz de pagos queda entonces de la siguiente manera:Una interpretacin ms interesante de situaciones que presentan las caractersticas del Dilema del Prisionero se presenta cuando dos empresas compiten en la venta de un mismo producto y tienen que fijar el precio del mismo.

    Pueden definir una estrategia de competicin con la otra empresa y fijar un precio bajo (estrategia D), o elegir una estrategia de cooperacin y fijar un precio alto (estrategia C).Es inmediato verificar que el nico equilibrio de Nash de este juego es (D,D) .

  • Sin embargo, a simple vista resulta muy atractivo el resultado que surge de usar las estrategias (C,C) y naturalmente uno se preguntar si en alguna otra versin del modelo esta estrategia goza de una estabilidad apropiada.

    Un camino que da respuesta satisfactoria a este hecho surge de considerar un modelo donde el juego en cuestin se repite.

  • Ejemplos de estrategias en juegos repetidos:

    Estrategia Gatillo:Estrategia C-tft:Observacin: estas estrategias asumen que los juegos son infinitos. La asuncin de finitud modifica en parte las estrategias (excepto que el juego se repita una cantidad finita de veces, pero el nmero final sea desconocido).

  • Freno o no freno?

    En la vida cotidiana nos topamos con este tipo de decisiones todos los das.

    Supongamos que llegamos a una esquina en simultneo con otro auto.

    Para darle un sentido econmico al ejemplo, supongamos tambien que Lavagna abri el corralito en forma muy restringida y que cada sucursal va a devolverle la plata al primero que llegue, y que justamente quien maneja el otro auto que lleg a la esquina conmigo tiene su plazo fijo en la misma sucursal que yo (y que adems somos los dos que estamos por llegar primero).

  • La matriz de pagos podra ser la siguiente:

    Cules son los equilibrios de Nash de este juego?

  • La Teora de Movidas (TOM)(Theory of Moves, Steven Brams, 1994)

    Asume juegos estrictamente ordinales. Supongamos que tenemos dos actores (el jugador fila F y el jugador columna C) cada uno con dos posibles decisiones.

    Cada jugador ranquea los 4 estados del juego de 1 a 4 (1 es el peor estado, 4 es el mejor).

    Por ejemplo: C1 C2F1F2

  • Estos resultados son slo ordinales, indican slo un ordenamiento de los resultados de mejor a peor.

    No da ninguna graduacin sobre cuanto la prefiere un jugador a un resultado sobre los otros.

    Slo indica las preferencias de los jugadores.

    Primera diferencia entre la TOM y la TJC es que para la TJC importan las utilidades mientras que para la TOM no son relevantes.

  • Otra diferencia es que en la TJC los movimientos son en simultneo, o al menos se realizan sin conocer el movimiento del otro jugador.

    En la TOM vamos a suponer que se mueve en forma alternada partiendo de un estado inicial y llegando a un estado final.

    Aparecen nuevos conceptos de equilibrios y estrategias que me llevan a mover o detenerme en un estado determinado.

    Veamos aplicaciones de la TOM a ejemplos que nos van a resultar cotidianos y cercanos.

  • La renuncia de Chacho Alvarez a la vicepresidencia

    Corra octubre del 2000 y se empezaba a resquebrajar la Alianza que haba ganado las elecciones unos pocos meses antes.

    El vicepresidente de la Nacin (y lder de uno de los partidos de la Alianza) haba denunciado coimas en el Senado en la aprobacin de la ley de reforma laboral.

    El presidente de la Nacin (y uno de los lderes del otro partido de la Alianza) se debata entre investigar a fondo las denuncias apoyando a su vicepresidente (y fortaleciendo la Alianza) o no hacer nada, dejando pedalear en el aire a Chacho.

    Chacho Alvarez se debata entre renunciar o no renunciar.

  • Cmo repesentamos este juego en trminos de la TOM?

    1) La realidad (desde mi ptica)

    Cul es el estado inicial?Cul es el estado final?

  • 2) De la Rua estadista (obviamente ficticio !)

    Cul es el estado inicial?Cul es el estado final?

  • El asalto

    Supongamos que soy asaltado por una persona armada.Definamos mi objetivo y el del ladrn en trminos de prioridades:

    Los mos:

    1)No salir herido.2)Que no me roben.3)Atraer la atencin de la gente.

    El del ladrn (inteligente):

    1)Robarme todo lo que tenga.2)No llamar la atencin.3)Evitar el uso de la fuerza (si lo llegan a agarrar la pena es mucho peor)

  • Cmo repesentamos este juego en trminos de la TOM?

    Cul es el estado inicial?Cul es el estado final?

  • Juegos Cooperativos

    Supongamos que tenemos 100 presos y se les plantea el siguiente problema.

    Se los coloca en una fila, cada uno con un gorro negro o blanco. El ltimo de la fila ve todos los gorros, excepto el suyo. El anteltimo de la fila ve todos los gorros, excepto el suyo y el del ltimo. Y asi siguiendo...

    Cada preso para ser liberado debe acertar el color de su gorro, empieza a arriesgar el ltimo, luego el anteltimo, etc.

    Todos escuchan lo que dicen todos.Lo nico que tienen permitido es arriesgar el color de su gorro, absolutamente ninguna cosa ms.

  • Cul ser la estrategia conjunta para salvar a la mayor cantidad de presos?Una estrategia para salvar al menos al 50 %:

    Consiste en que cada preso de orden par dice el color del gorro del que tiene adelante. As, garantizamos salvar a todos los de orden impar, ya que la estrategia es conocida por todos de antemano.Una estrategia para salvar seguro a todos menos al ltimo de la fila (el primero que arriesga):

    El preso de orden 100 dice blanco si la cantidad de blancos que tiene adelante es impar, y negro en caso contrario.

    De ah en adelante todos pueden deducir que gorro tienen contando la paridad de blancos y negros de los que tienen adelante.