ESCRIBA LO QUE DESEA LEER EN ESTE BLOG

domingo, 7 de agosto de 2022

Teoría de Juegos y aplicaciones: El Dilema del Prisionero

Teoría de Juegos y aplicaciones: El Dilema del Prisionero 

 María de Gracia Blázquez Vallejo 

 100025152@alumnos.uc3m.es 

Carmen Virginia Gámez Jiménez 

100025054@alumnos.uc3m.es

ABSTRACT 

En este paper se realiza una introducción a la Teoría de Juegos clásica viendo sus orígenes y su evolución y exponiendo algunos conceptos básicos. Como caso particular se estudiará el clásico problema del Dilema del Prisionero. Se expondrán varias aplicaciones de este dilema en situaciones de la vida real y se analizarán sus posibles resultados. 

Categories and Subject Descriptors H.4.3. [Internet Explorer] H.4.1. [Word Office] H.3.4. [World Wide Web] 

General Terms Teoría 

1. INTRODUCCIÓN 

La importancia de los juegos desde la infancia ha sido destacada por los psicólogos como medio de formar la personalidad y de aprender de forma experimental a relacionarse con la sociedad y a resolver problemas y situaciones conflictivas. [2] 

El estudio de los juegos ha inspirado a científicos de todos los tiempos para el desarrollo de modelos matemáticos y teorías. Una de las ramas de las matemáticas que surgió de los cálculos para diseñar estrategias vencedoras en los juegos de azar fue la estadística. Los conceptos propios de la estadística, como probabilidad o distribución, tienen aplicación en el análisis de juegos de azar o en situaciones en las que hay que tomar decisiones y correr riesgos ante componentes aleatorios. 

Pero la teoría de juegos sólo se relaciona lejanamente con la estadística. Su objetivo es el estudio de los comportamientos estratégicos de los jugadores. En muchas situaciones del mundo real, tales como en relaciones políticas, sociales o económicas, aparecen escenarios en los que, al igual que ocurre en los juegos, el resultado depende de las distintas decisiones de los jugadores. 

La teoría de juegos es una rama de la matemática con aplicaciones en economía, biología, sociología y psicología.[4] Examina el comportamiento estratégico de jugadores que interactúan y toman decisiones en un marco de incentivos formalizados, los juegos, y que están motivados por la maximización de la utilidad sabiendo que los otros jugadores son racionales. La utilidad final conseguida por cada uno de los jugadores depende de las acciones escogidas por el resto de los individuos. 

Los juegos analizan matemáticamente situaciones en las que aparece un conflicto de intereses. Su objetivo es encontrar las opciones óptimas para que se consiga el resultado deseado en las circunstancias dadas.

La teoría de juegos ayuda a analizar problemas de optimización interactiva. Tiene muchas aplicaciones en las ciencias sociales. En la mayoría de los casos, la teoría de juegos se utiliza en situaciones que implican estrategias, conflictos de interés y trampas. 

2. ORIGEN 

La teoría de juegos comienza con los trabajos de Zermelo, el cual expone que ciertos juegos como el ajedrez son resolubles. En los años 20, Borel y Von Neumann analizan los equilibrios de tipo minimax para juegos de suma cero (juegos en los que un jugador gana lo que pierde su rival). 

 A pesar de ello, el primer avance importante no se produce hasta la publicación del libro de Neumman y Morgenstern The Theory of Games Behavior (años 40).[3] En este libro se divulgó una formalización general de juegos en su forma extendida y normal, se introdujo el concepto de estrategia en juegos extensivos y se propusieron aplicaciones. 

Un desarrollo importante de estas ideas se produjo en Princeton en los años 50 cuando Luce y Raiffa difunden los resultados en su libro introductorio, Kuhn expone su definición del concepto de información en los juegos, Sharpley define su forma de atacar los juegos cooperativos (juegos en los que los jugadores pueden establecer contratos para actuar de forma cooperativa) y Nash define el llamado ‘equilibrio de Nash’, que permitió extender la teoría a juegos no-cooperativos más generales que los de suma cero. 

Debido a que en esta época la mayor parte de las aplicaciones de los juegos tipo suma-cero iban destinadas a estrategias militares, fue el Departamento de Defensa de los EEUU quien financió las investigaciones. 

Harsany, en los años 60 y 70, extendió la teoría de juegos a juegos de información incompleta (juegos en los que los jugadores no conocen todas las características del juego). Selten, ante la multiplicidad de equilibrios de Nash, definió el concepto de equilibrio perfecto en el subjuego para juegos de información completa y una generalización para el caso de juegos de información imperfecta 

3. CONCEPTOS FUNDAMENTALES 

3.1 Juego 

En teoría de juegos, la palabra juego se refiere a un tipo especial de conflicto en el que toman parte un número de individuos o grupos. A estos individuos o grupos se les conoce como los jugadores. 

En todo juego hay unas ciertas reglas propias de dicho juego. Estas reglas imponen las condiciones para que el juego comience, definen las posibles jugadas legales durante las distintas fases del juego, el número de jugadas que constituye una partida completa y los posibles resultados cuando la partida finaliza (recompensas para cada combinación de estrategias). 

3.2 Jugada 

En teoría de juegos, un movimiento o jugada define cómo progresa el juego de una fase a otra, desde la posición inicial hasta el último movimiento del juego. Las jugadas son el resultado de una decisión personal de cada jugador o pueden ser debidas al azar. Si son debidas al azar, puede determinarse la probabilidad de una cierta jugada. 

Las jugadas de todos los jugadores pueden ser simultáneas o pueden ser alternativas entre los distintos jugadores de una manera determinada. 

3.3 Ganancia 

El resultado de un juego es una cierta asignación de utilidades finales. La ganancia o resultado designa lo que ocurre cuando una partida termina. En algunos juegos el resultado consiste en declarar un ganador o un perdedor (caso del ajedrez o las damas). En otros juegos con apuestas la ganancia está determinada por la cantidad que ha apostado cada jugador y por el número de veces que un jugador gana a lo largo de la partida (caso del póquer). 

Dentro de los juegos, obtendremos un resultado de equilibrio si ninguno de los jugadores puede mejorar su ganancia unilateralmente dado que los otros jugadores no modifican sus estrategias. 

El resultado de un determinado juego puede representarse utilizando una matriz de resultados. En esta matriz se representan las posibilidades de cada uno de los jugadores y los resultados del juego en función de la opción escogida por cada uno de ellos. La forma de representar las posibilidades y resultados de cada uno de los jugadores en una matriz de resultados será explicada posteriormente. 

3.4 Estrategia 

Una estrategia es una lista con opciones óptimas para cada jugador en cualquier momento del juego. Se dice que un jugador tiene una estrategia cuando tiene en cuenta las reacciones de otros jugadores para realizar su elección. Una estrategia es un plan de acciones completo que se lleva a cabo cuando se juega el juego. Se explicita antes de que comience el juego, y prescribe cada decisión que los agentes deben tomar durante el transcurso del juego, dada la información disponible para el agente. La estrategia puede incluir movimientos aleatorios. 

3.5 Formas normal y extendida 

A la hora de estudiar los juegos, una de las diferencias más importantes es la forma en que estos están representados. Hay dos posibilidades: forma normal y extendida.[1] 

3.5.1 Forma normal 

 Un juego está en forma normal cuando la lista de todos los posibles resultados de cada jugador, con todas las posibles combinaciones de estrategias, viene dada para cualquier secuencia de decisiones en el juego. Este tipo de juego no depende de la elección de estrategia por parte del jugador. 

En un juego representado en forma normal, se muestran los jugadores, las estrategias, y las recompensas en una matriz. Un jugador elige las filas y el otro jugador elige las columnas. Cada jugador tiene diversas estrategias, que están especificadas por el número de filas y el número de columnas. 

Las recompensas que obtienen cada uno de ellos se muestran en el interior de la matriz. El primer número del par dado para cada una de las opciones es la recompensa recibida por el jugador de las filas y el segundo es la recompensa del jugador de las columnas. La representación de una matriz de resultados para un juego en su forma normal sería la siguiente: 

Tabla 1: Matriz de resultados Opción 

VER MÁS AQUÍ

Equilibrio de Nash

El equilibrio de Nash es una situación en donde los individuos o jugadores no tienen ningún incentivo a cambiar su estrategia tomando en cuenta las decisiones de sus oponentes.

En el equilibrio de Nash la estrategia que elige cada uno de los participantes de un conflicto o juego es óptima, dada la estrategia que han elegido los demás. En otras palabras, nadie ganará nada si decide cambiar su estrategia bajo el supuesto de que los demás individuos no cambian la suya.

Origen del concepto

El equilibrio de Nash es un concepto que pertenece a la teoría de juegos, una rama de la economía que estudia modelos matemáticos de conflicto y cooperación entre individuos supuestamente racionales.

La gente que sabe está en el Campus

Para que aprendas mucho más sobre finanzas, inversión y bolsa, hemos creado el Campus de Economipedia. Una plataforma de cursos en vídeo, pensada para que aprendas de forma entretenida con contenidos prácticos y entretenidos.

La suscripción cuesta $14, y te das de baja cuando quieras.

El creador el concepto es el matemático John Nash quien en el año 1951 logró demostrar que en todo juego en donde los participantes pueden escoger entre un número finito de estrategias (que pueden ser puras o mixtas) siempre existirá al menos un equilibrio de Nash.

Suponga que existen dos prisioneros A y B que cometieron un asalto a mano armada. La policía los ha detenido, pero requiere de más evidencia para poder encarcelarlos. Para obtener más información, los encierran en dos celdas separadas de modo que no puedan comunicarse entre sí y les presentan las siguientes condiciones:

  1. Si confiesas, pero tu compañero no, te dejaremos en libertad mientras que a tu compañero le daremos 10 años de cárcel.
  2. Si vemos que ambos confiesan, les daremos 5 años a cada uno.
  3. Si ninguno de los dos confiesa, les daremos 1 año de cárcel a cada uno.

Podemos graficar esta situación a través de un juego que representamos por medio de una matriz de pagos en donde cada año de cárcel tiene un valor negativo.

 

 

Jugador A/B

 

 

Confesar

 

 

No confesar

 

 

Confesar

-5; -5 

 

0; -10

 

 

No confesar

 

 

-10; 0

 

 

-1; -1

En este juego, el equilibrio de Nash es Confesar-Confesar, ya que ninguno de los jugadores tiene incentivos a cambiar su decisión considerando lo que hará su compañero. Sin embargo, ambos individuos preferirían ubicarse en otro equilibrio (No confesar-no confesar).

No obstante lo anterior, cuando cambian las condiciones del juego (por ejemplo una repetición infinita), es posible alcanzar otros equilibrios.

VER MÁS AQUÍ




Utilidad esperada

 Utilidad esperada

 Francisco Coll Morales


 Referenciar

La utilidad esperada, o teoría de la utilidad esperada, es una teoría que describe un modelo de elección racional con resultados inciertos. De esta forma, la teoría nos permite clasificar los resultados en términos de utilidad, y representarlos mediante la función que lleva su nombre: la función de utilidad. Así, el resultado escogido es el que presenta una utilidad más elevada.

La utilidad esperada, por tanto, es una teoría que se centra en el análisis de situaciones en las que los individuos deben tomar una decisión y desconocen los efectos que trascienden por haber escogido dicha decisión. Es decir, deben tomar una decisión en un escenario de incertidumbre.  

Para tomar esta decisión, medimos los resultados y los clasificamos con base en su utilidad, siendo esta la suma de los productos de probabilidad y utilidad sobre todos los resultados posibles.

El resultado escogido, en teoría, es aquel que presenta una mayor utilidad. Es decir, aquel que, tras el análisis, presenta una utilidad más elevada. No obstante, existen casos en los que la aversión al riesgo, entre otros factores, podrían llevarnos a escoger una decisión con una menor utilidad esperada, pero con menor riesgo, por ejemplo.

La gente que sabe está en el Campus

Para que aprendas mucho más sobre finanzas, inversión y bolsa, hemos creado el Campus de Economipedia. Una plataforma de cursos en vídeo, pensada para que aprendas de forma entretenida con contenidos prácticos y entretenidos.

La suscripción cuesta $14, y te das de baja cuando quieras.

Detalles aquí

Teoría de la utilidad esperada

La utilidad esperada es una teoría, frecuentemente estudiada en campos como la Economía y, más concretamente, la teoría de juegos.

Así, fue Daniel Bernoulli, matemático de origen holandés y rector de la universidad de Basilea, quién introdujo la teoría de la utilidad esperada, utilizándola posteriormente para resolver la paradoja de San Petersburgo.

Para resolver la paradoja, de acuerdo con Bernoulli, se proponía un nuevo sistema de medición del riesgo (en su en su libro “Exposición de una nueva teoría en la medición del riesgo» en 1738), basado en las loterías y las apuestas.

No obstante, no fue hasta 1944 cuando el matemático húngaro-estadounidense John von Neumann, y el economista austriaco Oksar Morgenstern, publicaron su obra «Teoría de juegos y comportamiento económico». Esta obra ha sido considerada como principal fundamento de la teoría de la utilidad esperada.

La obra de estos dos autores proporciona grandes contribuciones y desarrolla una función matemática que resuelve la paradoja mencionada. Los autores desarrollan un conjunto de axiomas para las relaciones de preferencia con el fin de garantizar que la función de utilidad citada funcione correctamente.

De Bernoulli a von Neumann y Morgenstern

Cabe hacer un inciso en el camino y destacar los cambios introducidos por von Neumann y Morgenstern, así como el planteamiento inicial propuesto por Bernoulli.

En este sentido, Daniel Bernoulli, en 1738, trató de solventar esta paradoja (de San Petersburgo ) con un modelo de elección racional basado en el valor esperado, que para Bernoulli no fundamentaba una elección racional. Para ello, a través de este valor esperado, desarrolla una función de utilidad, mediante la que calcula la utilidad esperada.

Para Bernoulli, la ganancia monetaria, aunque pueda incrementarse indefinidamente, no aumenta la utilidad de modo paralelo.

Posteriormente, en 1944, el matemático John von Neumann y el economista Oksar Morgenstern publicaban cuatro axiomas, cuatro proposiciones, que sí aseguraban una elección racional.

Con base en las preferencias de cada persona, se generan supuestos en los que los individuos toman decisiones racionales. Ahora bien, estas preferencias, como decíamos anteriormente, vienen motivadas, en última instancia, por otros factores, como la aversión al riesgo.

Los modelos propuestos por von Neumann y Morgenstern completan la base desarrollada por Bernoulli, a la vez que publican la obra considerada la columna vertebral de dicha teoría: la teoría de la utilidad esperada.

Axiomas de la utilidad esperada

Los axiomas de la utilidad esperada son:

Preferencias completas

En este axioma, el individuo tiene las preferencias bien definidas y siempre puede decidir entre las alternativas. Es decir, en un escenario en el que debemos coger A o B, o preferimos A, o preferimos B, o nos es indiferente.

Imaginemos que tenemos 2 caminos. Escogiendo el primero tardamos 1 hora, mientras que, si escogemos el segundo, 3 horas. Entonces, iremos por el primer camino, el más rápido. Como vemos, las alternativas están bien definidas y es fácil escoger.

Transitividad

Las decisiones que toma un individuo, además de completas, deben ser consistentes. Es decir, entre escoger A, B y C, si preferimos A en lugar de B, y B en lugar de C, A, por tanto, debe ser mejor alternativa que C.

Independencia

Un individuo, ante la necesidad de elegir entre dos alternativas donde ya ha anunciado que prefiere la primera con respecto a la segunda, mantendrá este orden de preferencia ante una situación que mezcle las dos alternativas propuestas en un inicio, en adición a una nueva, una tercera.

Por tanto, introducir una tercera opción no influye sobre el orden de preferencia inicial señalado.

Continuidad

Imaginemos que tenemos tres loterías, a las que denominamos A, B y C.

Ahora, imaginemos que preferimos antes A que B, a la vez que preferimos B en lugar de C.

Si se cumple el axioma, el individuo es capaz de indicar una probabilidad p para estar indiferente entre la lotería B y una lotería compuesta, a la que denominamos L, y donde elegimos A con probabilidad p, o C con probabilidad 1-p.

Críticas a la teoría de la utilidad esperada

Daniel Kahneman, quien es Premio Nobel de Economía, junto al psicólogo Amos Tversky, han desarrollado supuestos en los que los individuos, de acuerdo con los autores, violan los axiomas propuestos por von Neumann y Morgenstern.

La primera violación la encontramos tras analizar el Efecto Marco o Efecto Framing.

Este efecto, que llevó a los autores citados a recibir el Premio Nobel de Economía en el 2002, nos muestra que, tanto el enunciado del problema como el punto de partida y de destino, provocan que los individuos cambien sus decisiones, aunque ello implique la selección de una opción que no es la más útil y, por tanto, menos racional.

Asimismo, encontramos otro ejemplo de esta ineficiencia de la teoría en la paradoja de Allais, que llevó a su creador, Maurice Félix Charles Allais, a obtener el Premio Nobel de Economía en 1988.

VER MÁS AQUÍ

https://economipedia.com/definiciones/utilidad-esperada.html

Teoría prospectiva

 

Teoría prospectivaun análisis de la decisión bajo riesgo

  • Autores: Amos TverskyDaniel Kahneman
  • Localización: Studies in Psychology = Estudios de PsicologíaISSN 0210-9395, ISSN-e 1579-3699, Nº 29-30, 1987págs. 95-124
  • Idioma: español
  • Resumen
    • Español

      Este artículo presenta una crítica a la teoría de la utilidad esperada como modelo descriptivo de la toma de decisiones bajo riesgo y presenta un modelo alternativo llamado teoría prospectiva. Las elecciones entre alternativas arriesgadas muestran diversos efectos generales que son inconsistentes con los principios básicos de la teoría de la utilidad. En concreto, el efecto de certidumbre contribuye a la aversión del riesgo cuando se trata de ganancias seguras y a la atracción por el riesgo en caso de elecciones con pérdidas seguras. Además, el efecto de aislamiento lleva a preferencias inconsistentes cuando una misma elección se presenta de formas diferentes. Se desarrolla una teoría alternativa de la elección, donde los valores de medida son asignados a las ganancias y a las pérdidas en vez de a los resultados finales y donde se sustituyen las probabilidades por pesos de decisión. La función de valoración es normalmente cóncava para las ganancias y normalmente convexa para las pérdidas, y generalmente más acelerada para las pérdidas que para las ganancias. Los pesos de decisión son, generalmente, más bajos que sus correspondientes probabilidades, excepto en el caso de probabilidades bajas. Que se ponderen más las probabilidades bajas puede contribuir a la atracción tanto por el juego como por la compra de seguros.

    • English

      This article presents a criticism of the theory of expected utility as a descriptive model of decision making under risk, and presents the prospective theory as an alternative model. The choices between risky alternatives show several general effects that are not consistent with the principal of the theory of utility. The certainty effect, for instance, contributes to the aversion to risk when it is about certain gain and to the attraction to risk when the choices implicate certain loss. The isolation effect contributes to non-consistent preferences when the same choice is presented in different ways.

      An alternative theory of choice is developed, where measurement values are given to gain and loss instead of to the final results and where probabilities where substituted by decision importance. The function of validation is usually concave for gain, and more acelerate for loss than for gain. The decision importance is normally lower than its respective probabilities, except for the lowest probabilities. The atraction to gambling and to insurances purchase may be increased by the preference towards the consideration of low probabilities.

    • VER AQUÍ