Toma y daca

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

El Toma y daca (Tit for tat en su expresión original en inglés) es una estrategia óptima en teoría de juegos para el dilema del prisionero iterado.

La expresión inglesa tit for tat significa "represalia equivalente" (toma y daca, tanto "tit" como "tat" son golpes suaves, por lo que vendría a decir "golpea suavemente al que te ha golpeado suavemente").

En ella, un agente que use esta estrategia responderá consecuentemente a la acción previa del oponente. Si el oponente ha cooperado previamente, el agente cooperará. Si el oponente deserta, el agente se vengará de él.

Esta estrategia depende de cuatro condiciones:

  1. El agente siempre colabora, a menos que sea provocado con una deserción
  2. El agente se vengará ante cualquier deserción
  3. El agente perdona fácilmente una vez que se ha vengado
  4. El agente debe tener una probabilidad mayor de 2/3 de jugar de nuevo contra el mismo oponente


"Toma y daca" y el dilema del prisionero[editar]

Robert Axelrod organizó un concurso para encontrar una estrategia válida para el dilema del prisionero iterado. Se jugaría un torneo con 200 rondas por partida, y el programa con mayor puntuación sería el ganador.

Entre los 14 participantes, Anatol Rapoport presentó un programa que consistía en 4 líneas en BASIC, y al que llamó Toma y daca. Sólo tenía dos reglas:

  1. Comenzar colaborando
  2. Hacer lo que tu oponente hizo la ronda anterior

Era la más sencilla de todas las estrategias presentadas, y fue la que obtuvo la puntuación más alta.

Después de la publicación de los resultados, se organizó un segundo torneo, en el que el número de rondas a jugar por partida sería aleatorio (para no crear una ronda especial, la final, en la que se favorece la deserción). A esta competición se presentaron 62 participantes, entre ellos el mismo Toma y daca. De nuevo, obtuvo la mayor puntuación.

Comentario[editar]

Robert Axelrod relacionó el éxito de esta estrategia en el dilema del prisionero con sus características de "amabilidad", "provocabilidad" y "capacidad de perdón". Una estrategia "amable" es aquella en la que nunca se es el primero en desertar. Una estrategia "provocable" es aquella en la que se responde inmediatamente a la deserción de un oponente. Una estrategia con "capacidad de perdón" vuelve rápidamente a la cooperación si su oponente lo hace.

Estas características hacen que el funcionamiento de esta estrategia sea fácil de comprender por el oponente, y se pueda así encontrar una forma de trabajar.

Variantes[editar]

Toma por cada dos dacas (Tit for two tats)[editar]

Es similar al Toma y daca, pero sólo se venga si el oponente ha desertado la dos veces anteriores. Esta generosidad hace que esté en desventaja frente a Toma y daca, ya que se puede ganar si sólo se deserta contra él en turnos alternos.

Toma y daca desconfiado[editar]

Similar a Toma y daca, pero el primer turno deserta.

Sonda ingenua[editar]

Comienza cooperando y siempre venga una deserción, pero de vez en cuando deserta espontáneamente (por lo tanto, no es tan altruista como Toma y daca). Está en desventaja con otras estrategias recíprocas como Toma y daca misma, porque puede iniciar una cadena de recriminaciones.

Sonda con remordimientos[editar]

Similar a sonda ingenua, pero nunca se venga de la venganza de una de sus deserciones. Así, elimina las recriminaciones mutuas.

Explorador[editar]

Deserta en la primera jugada, y si su oponente responde vengándose (con lo que es una estrategia recíproca), juega Toma y daca en adelante. Si su oponente no responde, alterna deserción con cooperación.

Vengativo[editar]

Comienza colaborando, pero una vez que su oponente deserta, deserta siempre.

Referencias[editar]

Enlaces externos[editar]