💾 Archived View for psicobyte.com › blog › nash_y_el_prisionero.gmi captured on 2024-12-17 at 10:17:52. Gemini links have been rewritten to link to archived content

View Raw

More Information

⬅️ Previous capture (2023-06-14)

-=-=-=-=-=-=-

Nash y el prisionero

2007-01-10

A veces, el universo parece conspirar contra nosotros:

Vas conduciendo al trabajo entre el lento y denso tráfico. Estás pensando que, con suerte, sólo te retrasarás media hora cuando ves un hueco entre los dos vehículos que te preceden. Si consigues meter tu coche entre ellos podrás adelantar unos minutos.
Pero evidentemente, cuando lo intentas resulta que no eres el único que lo ha visto. Otros conductores están intentando lo mismo, y ahora teneis los coches atrancados en un hueco demasiado pequeño y sin espacio para maniobrar.
Me temo que hoy vas a llegar muy tarde.

Hay días que sería mejor pasarlos en la cama.

Esa misma noche estás en tu "solución habitacional" de treinta metros cuadrados intentando ver "Casablanca". Con la mierda de tabiques que tienes, escuchas cómo tu vecino intenta ver el futbol. Por supuesto, subes el volumen de tu televisor.
Mala idea: Tu vecino responde haciendo lo mismo, y acabais metidos en una "escalada armamentística". Cuando Bogart dice que "los alemanes iban de gris en su propio campo, tú ibas vestida de azul y Ronaldinho percutía por el alero" entiendes que la habeis jodido ambos.
A la mierda Casablanca y a la mierda el fútbol. Hoy no es tu día.

Teoría de Juegos

La "teoría de juegos" es una disciplina que sirve para que los matemáticos tengan de qué hablar durante el café (mientras los topólogos intentan distinguir el donut y la taza) y, además, para para "estudiar interacciones en estructuras formalizadas de incentivos[1]".

O sea: Que hacen modelos de "juegos" en los que varios "jugadores" tratan de obtener estrategias para maximizar un incentivo (Vale. Mejor te lees el enlace de arriba y lo entenderás).

En el caso del tráfico que te he puesto arriba, el incentivo es el tiempo ahorrado y los jugadores son los conductores. Las estrategias podrían ser "tratar de colarse" o "no tratar de colarse". En el otro ejemplo, tu vecino y tú competís por escuchar la televisión "subiendo el volumen" o "no subiéndolo".

En ambos casos se dá la situación de que, al intentar mejorar cada uno su propia estrategia (ahorrando tiempo o subiendo más el volumen), todos los jugadores acaban peor que si no lo hubiesen intentado.

Ahora es cuando un matemático diría "_¡Ah, claro! Eso es el Dilema del Prisionero_".

El dilema del prisionero

En el llamado "dilema del prisionero" se dá la siguiente situación:

Antonio y Benito, dos compinches, están incomunicados en celdas separadas, y la policía le ofrece a cada uno el mismo trato:

Lo verás mejor en la siguiente tabla:

B. CallaB. Delata

A. Calla-1,-1 -3,0

A. Delata0,-3 -2,-2

He puesto los años de condena como negativos para que se vea más claro (más años es más malo), y para que esto se parezca más a una matriz normal[2] de juegos.

Puede que Antonio y Benito sean criminales egoístas, pero también son unos tipos absolutamente lógicos, y ambos lo saben. ¿Cómo deberían actuar para cumplir la menor condena posible?

Veamos lo que piensa Antonio:

¿Qué debería hacer yo?
* Si Benito calla, mi mejor baza es delatarle, porque así me voy libre en lugar de estar encerrado un año.
* Si Benito me delata, lo mejor para mí es delatarle también a él, para ir sólo dos años a la carcel en lugar de tres.
De modo que, haga Benito lo que haga, a mí me interesa delatarle a él.

Dado que la situación es idéntica para ambos, Benito ha llegado a la misma conclusión que Antonio y, por tanto, ambos se traicionan mutuamente, y van dos años a prisión.

Si Antonio y Benito no hubiesen sido tan egoístas, podrían haber callado ambos, de modo que sólo habrían ido un año a la carcel. Vista "en conjunto", esta es la mejor combinación de estrategias para todos: Cualquier otro par de estrategias perjudicará, al menos, a uno de ellos.

Los matemáticos llaman a esta situación "Óptima en el sentido de Pareto" o, por simplificar, "Pareto-óptima".

Lo que ocurre es que eso es "en conjunto". Dada esa situación, cualquiera de los dos podría cambiar de estrategia (delatando al otro) y mejorar **su propia** situación (a costa de joder al otro).

Y, si uno de los dos guarda silencio y el otro le traiciona, el que ha callado (y por tanto le van a caer tres años) puede también cambiar de estrategia y hablar (con lo que la condena será "solo" de dos años).

Pero, en la delación mutua se dá un curioso equilibrio: Ninguno de los dos prisioneros puede mejorar su situación cambiando de estrategia unilateralmente.

Equilibrio de Nash

El conjunto de estrategias tales que ningun jugador se puede beneficiar cambiando **unilateralmente** la suya es lo que los matemáticos llaman "equilibrio de Nash" (Sí, el John Nash de la película[3]).

No todos los juegos tienen un equilibrio de Nash, y algunos tienen varios. Pero el equilibrio de Nash es interesante porque es estable: Si se llega a uno, ningún jugador intenta abandonarlo (evidentemente, porque saldría perjudicado).

Date cuenta que, en el dilema del prisionero, el equilibrio es Pareto-subóptimo: Si **ambos** jugadores cambiasen de estrategia, ambos saldrían beneficiados. Pero, en esa circunstancia, como hemos visto antes, lo mejor para cada uno individualmente sería traicionar al otro...

Si el problema fuera distinto, el equilibrio de Nash (si lo hubiere) pordía coincidir con el óptimo de Pareto (Lo que es mejor para todos) pero, como hemos visto, esto no tiene por qué ser así.

Igual que en los ejemplos del principio (y muchos otros que te puedes imaginar).

En resumen: Que la vida es muy puta, y que tú te quedas sin ver Casablanca.

Links

[1] estudiar interacciones en estructuras formalizadas de incentivos

[2] matriz normal

[3] la película

Meta

Publicación orginal.

Índice de posts