Este artículo fue publicado en Diciembre del año 1984, en un momento en que parecía muy adecuado, puesto que entonces existía una psicosis de Guerra Fría entre el bloque Occidental y el Oriental. A pesar del tiempo transcurrido desde entonces, pensamos que, a pesar de los cambios acaecidos en el Mundo y en previsión de nuevos conflictos, no perderá nunca su vigencia.
Equipo del Centro de Estudios Joan Bardina.
Primera versión en castellano: Viernes, 2 de Noviembre de 2001.
Última versión: Martes, 16 de Julio de 2019.
Cambio 16. 2-10 de diciembre de 1984. Número 679. Páginas 183-190.
Vivir hoy.
Según demuestra la informática.
El que coopera siempre gana.
Al tratar con un vecino, con el o la cónyuge, con un cliente, o en las relaciones internacionales entre las grandes y pequeñas potencias, el que gana siempre es el que plantea la cooperación y no la competencia. Esto lo demuestra, al menos, la teoría y la práctica de los juegos, estudiados minuciosamente por científicos ingleses y norteamericanos.
Corría el mes de agosto de 1915 y la Primera Guerra Mundial había derivado ya hacia una guerra de trincheras librada en extensos parajes desolados. El capitán J. R. Wirton, oficial del Ejército británico, tomaba el té con sus soldados cerca de Armentieres (Estado francés), cuando de repente un obús cayó en medio del campamento y explotó. Los soldados se lanzaron a sus trincheras preparando sus armas y maldiciendo a los alemanes.
Entonces, desde la tierra de nadie –Wilton escribió en su diario– llegó un soldado alemán que se asomó a sus trincheras. «Lo sentimos mucho –gritó–. Esperamos que no haya habido heridos. No ha sido culpa nuestra. ¡Son esos malditos prusianos!».
Aunque cualquiera piense que los soldados enemigos serían los últimos en echarse una mano, éstos sí lo hicieron.
A despecho de las exhortaciones a luchar y de las amenazas de represalias por parte de sus comandantes, la paz brotó a menudo entre las infanterías alemana e inglesa. Algunas treguas fueron acordadas mediante negociaciones formales, pero muchas veces eran los mismos soldados los que dejaban de dispararse o apuntaban su artillería hacia donde no hiciera daño.
«A dos prisioneros se les dio la oportunidad de acusarse mutuamente a cambio de obtener condenas menores».
Que existiese tal cooperación entre los soldados pudo sorprender al alto mando en la primera guerra mundial; no así a Robert Axelrod, profesor de Ciencia Política de la Universidad de Michigan, que ha estudiado un juego sencillo, pero revelador, bien conocido entre los teóricos de los juegos y los analistas políticos. Axelrod organizó una competición basada en un juego cuyos resultados apuntan a que la cooperación entre las tropas enemigas era altamente probable.
El Dilema del Prisionero, tal es el nombre del juego, consiste en ofrecer a dos jugadores la oportunidad de cooperar entre sí, o no, en un simple intercambio.
Aunque el juego se ha venido estudiando a lo largo de treinta años, no se ha encontrado una estrategia que resulte la mejor en todos los casos. Axelrod, sin embargo, quiso saber si tal estrategia era posible en caso de que el juego se repitiera una y otra vez. Para ello organizó un «torneo informático» en el que participaron los expertos en el Dilema del Prisionero. Resultó vencedora una de las estrategias más simples del concurso. Y, para sorpresa de Axelrod y de los allí presentes, resultó victoriosa debido a su carácter de cooperación.
Este juego debe su nombre a que en su origen –principios de la década de los años 1950– fue aplicado a dos prisioneros. Se les dio la oportunidad de acusarse mutuamente a cambio de obtener condenas menores, con el inconveniente de que si ambos se acusaban recaerían sobre los dos sentencias más largas que si no lo hubieran hecho. El Dilema del prisionero, no obstante su origen, puede aplicarse a otras circunstancias –no tan criminales– en las cuales los jugadores puedan cooperar entre si o jugar sucio.
Suponga, por ejemplo, que usted hace un trato que conlleva el intercambio de artículos –digamos, una bolsa de comida por una de dinero–. Usted acuerda, entonces, encontrarse con su socio para realizar el intercambio con la condición de no volver a verse jamás.
En principio parece un buen trato. Pero ¿y si su socio le entrega una bolsa vacía? Si no obtiene dinero a cambio de su bolsa de comida, no podrá pagar el alquiler. Al mismo tiempo, sin embargo, se le ocurre que puede ser una buena ocasión para ganar un dinero extra: usted podría entregar una bolsa vacía y recibir una llena de dinero. Ese dinerillo extra podría pagar la operación de la abuela, una causa noble que aliviaría un tanto su conciencia. Además, nunca más volverá a ver a esa persona. Así, pues, entregando una bolsa vacía queda a salvo de volver con las manos vacías y tal vez pueda ayudar a la abuela.
Parece lógico. Pero cuando finalmente se realiza el intercambio, usted descubre que el otro ha seguido su misma línea de acción y, por lo tanto, ambos están como al principio. Esto podría hacer pensar que lo mejor es colaborar y llevar la bolsa llena. Por supuesto, siempre que el socio vaya a hacer lo mismo, lo que podría no suceder. Pero incluso si lo hiciera, la operación de la abuela estaría un poco más cercana aunque...
«Se trata de que el jugador coopere en la primera movida; después, irá repitiendo las jugadas de su oponente».
En los torneos informáticos, los que no colaboran tienen menos posibilidades de ganar.
El juego que ideó Axelrod para su torneo fue parecido a este de la comida y el dinero. Se les pidió a los concursantes que inventaran un programa informático del que se obtuviera una C si se deseaba cooperar o una D si se pensaba en lo contrario. La diferencia con el juego precedente era que en el de Axelrod los participantes intervendrían una y otra vez durante aproximadamente 200 rondas. Si de ambos programas se obtenía una C, estos recibirían tres puntos. Si, por el contrario, se presentaba una D, se les daría un punto. Si uno generaba una C y el otro una D, el programa no colaborador (D), entonces, obtendría cinco puntos, en tanto que el otro (C) recibiría la llamada paga del novato: un enorme cero. Cada programa se enfrentó a todos los demás, así como a una copia de sí mismo y a otro que generaba una C o una D de forma aleatoria.
Los catorce participantes en la competición eran psicólogos, políticos, matemáticos, economistas y sociólogos, expertos en el Dilema del Prisionero. El programa ganador resultó ser el más breve de todos los presentados: un programa de cuatro líneas, llamado Taz por Taz (intercambio de dos cosas de igual valor), y presentado por Anatol Rapoport, de la Universidad de Toronto. La estrategia a seguir es sencilla: se trata de que nuestro jugador coopere en la primera movida; y a partir de entonces, este sujeto cooperador irá repitiendo las jugadas de su oponente. Axelrod escribió un artículo en el que presentaba los resultados de este primer torneo, así como una discusión sobre el por qué Taz por Taz había resultado ganador.
Se anunció en diversas revistas de informática una segunda competición en la que podían intervenir los catorce participantes del primer torneo y, esta vez, Axelrod recibió a 62 concursantes provenientes de seis países.
Uno de los programas presentados llamado Tranquilizador, comenzaba colaborando para después hacer lo contrario, ocasionalmente, esperando que los demás programas tolerasen su engaño. Otro, llamado Probador, comenzaba haciendo trampa a ver cómo reaccionaria su adversario.
Sin embargo, estas modificaciones no fueron suficientes. Taz por taz volvió a ganar. Rapoport fue el único en utilizar esta estrategia, a pesar de que estaba permitido elegir cualquier programa, independientemente de que el participante fuera su autor o no.
Taz por faz puede ser una buena estrategia para ganar un torneo informático. Pero ¿funcionaria en la vida real? Axelrod cree que sí. Muchas de las relaciones entre animales, personas y naciones pueden considerarse, desde una perspectiva general, como un Dilema del Prisionero.
Un abogado del Tribunal Supremo de los Estados Unidos aplica los descubrimientos de Axelrod a la libre competencia y a las leyes antitrust. Un profesor de Derecho de Familia de la Universidad de Stanford ha observado que las parejas que tramitan su divorcio siguen, a menudo, una estrategia tipo Taz por taz a la hora de negociar sus asuntos legales. Robert Calfee, profesor de Educación y Psicologia de Stanford, recomienda la enseñanza del Taz por taz en la escuela primaria. «Es una técnica, un modo de aprender a tratar con los demás. ¿Qué hacer cuando uno está locamente enamorado de alguien? Nada hay en nuestras escuelas que nos enseñe a resolver este tipo de problemas».
La violencia, como el crimen, no pagan.
Axelrod opina que también los países tienen mucho que aprender de este juego. «Los problemas más importantes a los que hoy se enfrenta la Humanidad surgen del terreno de las relaciones internacionales, en el que las naciones, egoístas e independientes, compiten entre sí en un clima cercano a la anarquía», escribe en su libro The Evolution of Cooperation. «Entre los ejemplos se pueden citar la carrera de armamentos, la proliferación nuclear, la escalada militar... Un acercamiento real a estos problemas debería tener en cuenta muchos factores que no están presentes en la formulación del Dilema del Prisionero. No obstante, podemos utilizar las conclusiones que se desprenden del mismo».
«Muchas de las relaciones entre seres vivos y naciones pueden considerarse como un Dilema del Prisionero».
¿Dónde reside el éxito del Taz por taz? Axelrod destaca, en primer lugar, el lugar limpio: no envidiar la puntuación del contrario y nunca ser el primero en engañar.
De todos los principios implicados en la cooperación, el de no sentir envidia quizá sea el más difícil de comprender para el hombre.
Una de las razones por la cual se siente envidia de los demás es que estamos acostumbrados a los juegos que podríamos llamar de «suma-cero», en los que, para avanzar, es necesario arrebatarle algo al contrario, de modo que cuanto menos consigue éste más obtiene uno. El ajedrez, el póquer y gran parte de los juegos de mesa pertenecen a esta categoría. En los juegos que no siguen esta regla, que podríamos denominar de «suma-no-nula», el objetivo sigue siendo conseguir la mayor cantidad posible de puntos, pero, a veces, el permitir al rival realizar una buena jugada redunda en un beneficio mutuo. El juego de sociedad más parecido a uno de este tipo son las adivinanzas.
El que el Dilema del Prisionero sea un juego de «suma-no-nula» es la razón de que Taz por faz obtuviera la mayor puntuación acumulativa entre todos los programas que participaron en el torneo de Axelrod –aunque nunca consiguiera una puntuación superior a la de sus adversarios en los enfrentamientos individuales–. De hecho, puesto que únicamente engaña las mismas veces que el contrario, lo más que puede conseguir es un empate. Puede que los juegos de sociedad sean del tipo «suma-cero», pero no se puede decir lo mismo de la vida real. La carrera de armamentos es un devastador ejemplo de ello. Recientes investigaciones sugieren que la explosión de tan sólo mil armas atómicas sobre las principales ciudades originaría un invierno nuclear que haría prácticamente imposible la vida en la Tierra. Ralph Earle II, que intervino durante seis años en las negociaciones del tratado Salt II, dice: «Creo que ambos bandos saben cuál es la situación. No importa demasiado quién dispare primero; el resultado final sería el mismo: la autodestrucción».
El juego en el que están envueltos los miembros del Parlamento tampoco es del tipo «suma-cero». Un legislador, por ejemplo, no tiene razón alguna para mostrarse reacio a prestar su ayuda a un colega. Las posibles amenazas a la reelección de un senador provendrán no de los restantes senadores sino de los aspirantes de su propio Estado. Del mismo modo, el beneficio inmediato de pagar con un talón sin fondos en la tienda de la esquina puede verse frustrado a largo plazo por el perjuicio que se deriva de no poder volver a comprar en dicha tienda.
Roger Fisher y William Ury del Harvard Negotiation Project, nos muestran una visión semejante en su libro Getting to Yes: Negotiating Agreement Withouf Giving In. A lo largo del mismo, se expone que un mal sistema para negociar es aquel que «aparece como un juego de «suma-fija»»; 100.000 pesetas más para ti en el precio de un coche representan 100.000 pesetas menos para mí. ¿Por qué molestarse en aportar nuevas propuestas de negociación?, se preguntaría cualquiera, si es evidente que uno sólo puede satisfacer al otro a costa de sus propios intereses. Fisher y Ury opinan que en lugar de discutir desde posiciones fijas, sería más positivo buscar la forma de definir lo que es un acuerdo justo. Los padres divorciados, por ejemplo, podrían decidir conjuntamente sobre las reglas de visitas a los hijos antes de que el tribunal dictamine sobre la custodia.
Engaño contra engaño.
Puede que Taz por taz no lo haga nunca mejor que su rival, pero eso no significa que sea un ingenuo. Responde al engaño con el engaño. Así, mientras que en una única jugada del Dilema del Prisionero hay oportunidad de obtener un gran beneficio a costa del contrario, a la larga tal beneficio desaparecerá cuando los mismos contrarios jueguen una y otra vez, si uno de ellos emplea la estrategia del Taz por taz.
Por ejemplo: Ante un programa que engaña continuamente, llamado Todo-D, el Taz por taz no conseguirá ningún punto en la primera jugada, mientras que Todo-D ganará cinco. En cada jugada sucesiva Taz por taz y Todo-D conseguirán un punto cada uno. Pero ambos programas deberán enfrentarse también a las demás estrategias del torneo, y Taz por taz conseguirá buenas puntuaciones cuando se enfrente a programas que cooperen, obteniendo tres puntos en cada jugada. En una competición a diez jugadas entre dos programas Todo-D y dos programas Taz por taz, por ejemplo, en Todo-D obtendrá catorce puntos en sus enfrentamientos con cada programa Taz por taz. Cada uno de éstos, por su parte, conseguirá nueve puntos contra los Todo-D. Pero estos últimos sólo conseguirán diez puntos cuando se enfrenten entre sí, mientras que los Taz por taz obtendrán 30, reuniendo un total de 48 puntos en el torneo frente a los 38 de los Todo-D.
«Lo que más fomenta la cooperación no es la amistad ni los acuerdos formales, sino la continuidad de la relación».
Taz por taz mantiene su privilegiada posición cooperando con los otros programas honestos y reaccionando rápidamente ante los tramposos. Una de las mayores sorpresas para Axelrod fue el comprobar el valor de la capacidad de reaccionar ágilmente ante las provocaciones: «Al principio del proyecto creía que se debía ser lento en la ira. Sin embargo, el torneo demostró que era mejor responder con rapidez a una provocación. Si se espera se corre el riesgo de dar una impresión equivocada».
Si el vecino de arriba comienza de pronto a practicar sus lecciones de baile a media noche, por ejemplo, no resultará muy efectivo el enterrar la cabeza en la almohada con la esperanza de que, tarde o temprano, dejará de hacerlo. Si no reaccionamos inmediatamente ante tal provocación, no sólo no se dará cuenta de que estamos enfadados sino que tomará nuestro silencio como señal de aprobación. Si después de un tiempo decidimos censurarle por habernos mantenido despiertos todas esas noches, probablemente se mostrará más confundido que arrepentido.
Las reacciones retardadas pueden tener consecuencias más serias aún. Estados Unidos, por ejemplo, está instalando misiles Pershing y Crucero en Europa occidental como respuesta el despliegue soviético de los misiles nucleares de alcance medio SS-20. Sin embargo, como señala Earle, estos últimos han tenido misiles nucleares –aunque menos sofisticados– apuntando a Europa occidental desde principios de los años 60. El despliegue de los Pershing, como reacción a la provocación soviética, llega con tanto retraso que da la impresión de que es Estados Unidos el protagonista de la escalada.
El efecto eco.
Uno de los peligros de responder rápidamente a las provocaciones es lo que Axelrod denomina efecto eco. Si dos programas Taz por taz se desincronizan, consumirán sus turnos en engañarse mutuamente, lo que les llevaría a una versión de ordenador de la enemistad entre «Capuletos y Montescos». La forma de evitar esto en la vida real sería responder de una manera menos enérgica a las provocaciones, según Axelrod. Por ejemplo, si el Pacto de Varsovia movilizase repentinamente tres divisiones hacia Alemania Oriental, los países de la OTAN responderían con una movilización semejante de sus propias tropas. Sin embargo, dado que los soviéticos podrían no interpretar esta respuesta como una consecuencia de su acción, la OTAN tal vez debiera movilizar únicamente 1 ó 2 divisiones para evitar un agravamiento de la situación.
Taz por taz reacciona rápidamente ante las provocaciones, pero también perdona con facilidad. Tan pronto como un programa decida volver a cooperar, Taz por taz estará dispuesto a aceptarlo. Muchos otros programas «honestos» del torneo no tuvieron tanto éxito como Taz por taz porque en cuanto el rival trataba de engañarles, dejaban de jugar limpio para pasarse el resto de la partida intentando a su vez engañar al contrario, cortando de esta manera cualquier posibilidad de cooperación.
Una razón más del éxito de Taz por taz es que no trataba de pasarse de listo; su estrategia era clara, en seguida se sabía qué clase de respuesta iba a provocar una acción determinada. Hubo, por el contrario, una estrategia tan extraordinariamente complicada que se clasificó en último lugar, por detrás incluso de aquellas que elegían sus respuestas de forma aleatoria.
En la vida real es importante también seguir una estrategia clara y estable. Algunas personas adoptan frente a sus cónyuges una actitud de desquite sin siquiera explicarles el motivo. Aunque esto pudiera aportarles una dudosa satisfacción, es evidente que no ayuda a resolver los problemas. El que un director ejecutivo elogie o reprenda a sus empleados puede resultar una buena política, pero si se lleva a cabo de forma incoherente, aquellos podrán considerar posteriormente que una falta de elogios o de reprimendas constituyen una señal de insatisfacción o aprobación.
Vive y deja vivir.
La colaboración no es patrimonio exclusivo de aquellos que suelen mostrarse amistosos. Incluso los más egocéntricos, tras considerar los resultados del torneo, concluirían que el uso de la estrategia Taz por taz es una buena manera de favorecer sus propios intereses. Los soldados de la Primera Guerra Mundial manifestaban una buena voluntad, en términos generales, a pesar del estado de guerra en que estaban viviendo, que se puede confirmar por una frase que la infantería que dejaba el frente recitaba a los nuevos reemplazos: «Vive y deja vivir».
No es la amistad, ni la confianza, ni los acuerdos formales lo que fomenta la cooperación, sino la continuidad de la relación, según piensa Axelrod. La cooperación se desarrollará por sí sola en la medida en que las partes interesadas sean conscientes de que en el futuro estarán ligadas por tratados conjuntos.
Axelrod cree que es el futuro lo que da fuerzas a estas relaciones. Los tratantes en diamantes, así como otros comerciantes, saben que tendrán que negociar entre ellos continuamente. Según el comentario de uno de estos hombres de negocios, «si surge cualquier problema, uno se pone en contacto con el otro por teléfono y discute el asunto. Uno no le va a leer al otro las cláusulas legales de los contratos si quiere volver a hacer negocios».
«El mayor impedimento para el desarrollo de la cooperación es que naciones y personas no reconocen el juego que se traen entre manos».
Esa visión del futuro es también importante en las relaciones humanas. La ceremonia del casamiento, por ejemplo, es una afirmación simbólica de que una pareja se compromete a una vida en común con proyección hacia el futuro. «Las personas que viven juntas sin casarse tienden a verse a sí mismas como individuos y no como una empresa conjunta», explica el sociólogo Pepper Schwartz, de la Universidad de Washington, quien ha publicado, junto con Philip Blumstein, un estudio sobre la pareja norteamericana. «Esto mina el compromiso y hace menos probable que se decidan a compartir sus recursos. Si la gente valora su relación en términos de lo que aportan a la misma, es más probable que su pareja fracase. Las parejas que viven juntas se rompen con mucha más frecuencia que las casadas».
La tácita cooperación entre los soldados de las trincheras durante la Primera Guerra Mundial surgió porque, a diferencia de otras guerras, las tropas estaban situadas de forma que ambos bandos podían verse día tras día; sabían que los mismos a los que se disparaba un día, dispararían contra uno al siguiente.
Para notar los beneficios de la cooperación, bastaría observar lo que ocurre en los reinos animal y vegetal, donde la consigna de la «supervivencia del más apto» parecería prohibir la ayuda a otros organismos y donde, sin embargo, la cooperación es vital. Los líquenes son una combinación de hongos y algas –un ejemplo de cooperación planta/planta–; las hormigas defienden a las acacias que les sirven de morada al tiempo que les proporcionan alimento.
Juego peligroso.
Según Axelrod, este entorno cerrado existe también en el caso de Estados Unidos y la Unión Soviética. Asimismo, Earle lo confirma: «Es como uno viviese en un extremo de un edificio, y en el extremo opuesto viviera un vecino molesto e intratable, pero con una casa preciosa y un buen trabajo; además, tiene toda la intención de quedarse. En este caso no tendría demasiado sentido plantarse todas las mañanas delante de su casa y gritar: ¡Vete al infierno!». «La gente tiene muchas dificultades cuando se trata de pensar en el futuro –comenta Axelrod–. Pero está claro que tanto la Unión Soviética como Estados Unidos van a permanecer aquí durante mucho tiempo. O eso o ninguno estará presente».
Tal vez el mayor impedimento para el desarrollo de la cooperación sea que naciones y personas no consiguen reconocer la naturaleza del juego que se traen entre manos. Fisher y Ury cuentan la historia de un americano que jugaba con su hijo de doce años a lanzarse un disco frisbee en Hyde Park, Londres. Era al principio de los años 60 y muy pocos británicos habían visto alguna vez a aquel extraño disco en acción. Una pequeña multitud de curiosos se había congregado a su alrededor. Finalmente, uno de los espectadores abordó al padre: «Discúlpeme; llevo observándoles un cuarto de hora. ¿Quién gana?».