Introducción a la teoría de juegos

La teoría de juegos es el estudio del comportamiento racional en el contexto de la interdependencia. La teoría de juegos es un método formal de analizar la interacción entre un grupo de individuos estratégicamente racionales. Inicialmente, resolvió el juego de suma cero, en el que la ganancia de una persona conduce a la pérdida de otros participantes.

Una persona racional tomará acciones que consisten en sus metas. La interdependencia significa que cualquier jugador se verá afectado por el comportamiento de los demás, y su comportamiento debe depender de la predicción de las reacciones de los demás. Para que los individuos decidan qué hacer, deben determinar cómo actuarán los demás. Esta decisión requiere comprender los objetivos de otras personas y las opciones disponibles para ellos.

La teoría de juegos se ha utilizado para tomar decisiones en escenarios comerciales como el precio, la producción, el desarrollo de productos y la promoción de productos.

Ejemplo de teoría de juegos

  • Los compradores y los vendedores negocian los precios.
  • La empresa y sus competidores
  • subasta
  • El dilema del prisionero

La cooperación en la teoría de juegos generalmente se analiza a través de un juego de suma distinta de cero llamado dilema del prisionero. Originalmente fue trabajado en RAND en 1950 por Merrill Flood y Melvin Dresher. Albert W. Tucker formalizó este juego como una recompensa de la prisión y lo llamó “El dilema del prisionero”.

Dos miembros de la banda criminal fueron arrestados y encarcelados. Todos los presos estaban recluidos en régimen de aislamiento y no podían comunicarse con los demás. El fiscal carecía de pruebas suficientes para condenar el cargo principal. Esperan que ambos sean condenados a un año de cárcel por un cargo menor. Al mismo tiempo, el fiscal ofrece un trato para cada preso. Todo prisionero tiene una oportunidad: traicionar a la otra parte testificando que la otra parte cometió un delito, o cooperar con la otra parte permaneciendo en silencio. La oferta es:

  • Si A y B se traicionan, cada uno de ellos cumplirá dos años de prisión.
  • Si A traiciona a B y B permanece en silencio, A será liberado y B cumplirá tres años de prisión (y viceversa).
  • Si tanto A como B permanecen en silencio, ambos solo cumplirán un año de prisión (un cargo menor)

Dos jugadores en el juego pueden elegir entre acciones de “cooperación” o “defecto”. La idea es que cuando las dos partes cooperen, cada jugador obtendrá beneficios, pero si solo uno de ellos coopera, la persona defectuosa obtendrá más beneficios. Si ambos lados tienen defectos, ambos lados pierden.

Ejemplos del dilema del prisionero

La siguiente tabla muestra los beneficios del juego del dilema del prisionero.

Los economistas creen que el juego del dilema del prisionero es de suma cero porque hay No cooperando: O ambos lados obtienen 0 cuando traicionan, o cuando uno de ellos coopera, el traidor obtiene (+10), el cooperador obtiene (-10) y un total de 0.

Si Cooperación, Habrá un rendimiento positivo: cada persona obtiene 5, un total de 10. El beneficio de la cooperación (5) es menor que el beneficio de la traición unilateral (10), por lo que siempre existe la tentación de traicionar.

Acción de A / acción de B cooperar defecto
cooperar Bastante bien (+5) Pobre (-10)
defecto Bueno (+10) Mediocre (0)

Juego de movimientos secuenciales

El juego del dilema del prisionero es un juego en el que dos jugadores se mueven al mismo tiempo. Existe otro tipo de juego en el que los jugadores se mueven en un orden específico, que se denomina juegos de movimiento secuencial.

Ejemplo de juego secuencial para móviles

En este juego móvil secuencial, el jugador A es un nuevo participante en el mercado. Tiene dos opciones:

O entrará en el mercado o se mantendrá alejado.

El jugador B ya está en el mercado. Si el jugador A entra, puede elegir acomodar a sus competidores sin aumentar el precio o iniciar una guerra de precios.

El movimiento lógico para el jugador A es ingresar al mercado, porque sabe que si se une, el jugador B elegirá “acomodarse” y obtener una devolución de (1) en lugar de intentar iniciar una guerra de precios y obtener (-1) .

Para el participante A, el retorno de (1) es mejor que (0), que es el retorno de salir del mercado.

Ejemplo de juego secuencial para móviles

Equilibrio de Nash

El equilibrio de Nash lleva el nombre de John Forbes Nash, Jr. (John Forbes Nash, Jr.). El equilibrio de Nash ocurre cuando un jugador juega el juego de la mejor manera y adivina correctamente lo que harán los otros jugadores. En otras palabras, cada jugador adopta la mejor estrategia de respuesta asumiendo las acciones de otros jugadores.En el equilibrio de Nash, se supone que todos los participantes conocen equilibrio La estrategia de otros jugadores, ningún jugador obtendrá ningún beneficio cambiando su estrategia.

Ejemplo de equilibrio de Nash

Un juego de coordinación:

permanecer derecho
arriba -1, -1 2, 0
abajo 1, 1 1, 1

Jugador 1: Si el jugador 1 asume que el jugador 2 elegirá ir a la izquierda, el jugador 1 elegirá bajar

Si el jugador 1 asume que el jugador 2 elegirá bien, el jugador 1 elegirá

Jugador 2: Si el jugador 2 asume que el jugador 1 elegirá subir, el jugador 2 elegirá ir a la derecha

Si el jugador 2 asume que el jugador 1 elegirá bajar, el jugador 2 no se moverá a la izquierda ni a la derecha.

Es fácil determinar que este juego tiene dos equilibrios de Nash en (abajo, izquierda) y (arriba, derecha). Ambas estrategias incluyen recompensas que son la mejor respuesta para cada participante.

Toda la información expuesta en este articulo es solo de carácter informativo, esta compuesto por una recopilación de información de internet. No necesariamente esta actualizada o debe ser tomada como una fuente

(Visited 1 times, 1 visits today)