EVOLUCIÓN DE LA COOPERACIÓN
Por Robert Axelrod


Muchos filósofos han encarado la añeja pregunta de cómo resolver los conflictos que surgen de la naturaleza del hombre como animal social. Aquí, Robert Axelrod usa una computadora para ahondar en un juego clásico cuya premisa es que los jugadores deben elegir entre ayudarse o traicionarse entre sí. Él encuentra que, a falta de autoridad central, la cooperación basada en el interés personal surge naturalmente entre los jugadores; este es un modelo para muchos tipos de interacción en el mundo real.

Axelrod es profesor de ciencias políticas y política pública en la Universidad de Michigan. Su libro anterior, The Structure of Decisión: The Cognitive Maps of Political Elites (La estructura de la decisión: mapas cognoscitivos de las élites políticas), fue publicado en 1976.

¿En que condiciones surgirá la cooperación en un mundo de egoístas sin autoridad central? Esta pregunta ha intrigado a la gente durante largo tiempo y por una buena razón. Todos sabemos que los humanos no somos ángeles y que solemos ver primero por nosotros y por lo nuestro. Sin embargo, también sabemos que la cooperación existe y que nuestra civilización se basa en ella. No obstante, en las situaciones donde cada individuo tiene un incentivo para ser egoísta, ¿cómo puede llegar a desarrollarse la cooperación?

La respuesta más famosa la dio Tomas Hobbes hace mas de 300 años y fue pesimista. Él afirmó que, antes que existieran los gobiernos, el ambiente natural estaba dominado por los individuos egoístas, que competían en condiciones tan crueles que la vida era “solitaria, pobre, desagradable, brutal y corta”. En su opinión, la cooperación no puede desarrollarse sin una autoridad central y, por consiguiente, es necesario un gobierno firme. Desde entonces, las discusiones sobre el alcance adecuado del gobierno se han concentrado en determinar si cabe esperar o no que surja la cooperación en un dominio particular donde no hay una autoridad que vigile la situación.

Hoy día, las naciones interactúan sin una autoridad central. Por tanto, las condiciones para que surja la cooperación son pertinentes en muchos de los aspectos centrales de la política internacional. El problema más importante es el dilema de la seguridad: las naciones suelen buscar su propia seguridad por medios que amenazan la seguridad de los demás. Este problema se presenta en esferas tales como la intensificación de conflictos locales y la carrera armamentista. Problemas afines ocurren en las relaciones internacionales en forma de competencia dentro de las alianzas, negociaciones arancelarias y conflictos étnicos dentro de los países.

En la vida diaria encaramos también muchos dilemas de elección. Por ejemplo, podemos preguntarnos cuántas veces podemos invitar a cenar a nuestros conocidos si ellos nunca nos invitan en reciprocidad. El ejecutivo de una organización le hace favores a otro ejecutivo a fin de obtener favores a cambio. El periodista que ha recibido una historia noticiosa filtrada da la debida protección a la fuente, con la esperanza de que se produzcan otras filtraciones. Una empresa comercial de una industria que sólo tiene una compañía competidora importante cobra precios altos, para ventaja de ambas y a expensas del consumidor.

Para mí, un caso típico del surgimiento de la cooperación es el desarrollo de pautas de comportamiento en un cuerpo legislativo como el Senado de los EUA. Cada senador tiene el incentivo de parecerles eficaz a sus electores, aun a expensas de entrar en conflicto con otros senadores que también tratan de parecer eficaces ante sus electores. Sin embargo, difícilmente es esta una situación de intereses en completa oposición, un juego de ganadores y perdedoras. Por el contrario, hay muchas oportunidades para las actividades de mucho provecho entre dos senadores. Estas acciones de mutuo beneficio han conducido a la creación de un conjunto complejo de normas, o costumbres en el Senado. Entre las más importantes está la norma de la reciprocidad, una costumbre que incluye la ayuda a un colega y la reciprocidad, en especie. Incluye el canje de votos, pero abarca tantos tipos de comportamiento en provecho mutuo que, como lo plantea un politólogo, “ la reciprocidad es una forma de vida en el Senado”

Una teoría de la cooperación para explicar este comportamiento se basaría en la investigación de individuos que persiguen su propio interés sin la ayuda de una autoridad central que los obligue a cooperar entre sí. La razón para suponer el egoísmo es que permite examinar el caso difícil en que la cooperación no se basa completamente en la preocupación por los demás o en el bienestar del grupo en conjunto.

Un buen ejemplo del problema fundamental de la cooperación es el caso en que dos naciones industriales han levantado barreras comerciales mutuas a sus exportaciones. Debido a las ventajas recíprocas del libre comercio, a ambos países les iría mejor si se eliminaran estas barreras. Sin embargo, si uno de los países eliminara unilateralmente sus barreras, se encontraría de cara a condiciones de comercio que perjudicarían su propia economía. De hecho, sin importar lo que haga un país, el otro estará en mejor situación si conserva sus propias barreras comerciales. Por tanto, el problema es que cada país tiene un incentivo para conservar sus barreras comerciales, lo cual produce un resultado peor de lo que hubiese sido posible si ambos países hubieran cooperado entre sí.

Este problema básico se presenta cuando cada uno busca el interés propio y logra un resultado insatisfactorio para todos. A fin de entender la vasta gama de situaciones específicas como ésta, se necesita una forma de representar lo que tienen en común, sin entretenerse en los detalles singulares de cada una. Afortunadamente, existe esa representación: el famoso juego del Dilema del Prisionero, inventado hacia 1950 por dos científicos de RAND Corporation.

En ese juego participan dos personas. Cada una tiene dos opciones: “cooperar” o “abandonar”. Cada una debe hacer la elección sin saber lo que hará la otra. Independientemente de lo que haga el otro jugador, el abandono reditúa mas que la cooperación. El dilema es que, si ambos abandonan, a ambos les va peor que si hubieran cooperado. Al juego se le llama el Dilema del Prisionero porque, en su forma original, los dos prisioneros confrontan la opción de informar al otro o quedarse callado.

Aquí se muestra la mecánica del juego. Un jugador selecciona una hilera, ya sea cooperando o abandonando. Al mismo tiempo, el otro elige una columna, también cooperando o abandonando. Juntas, estas elecciones dan uno de los cuatro resultados posibles que se muestran en esa matriz. Si ambos jugadores cooperan, a ambos les va bastante bien. Ambos obtienen R, la recompensa por la cooperación mutua. En el ejemplo concreto presentado aquí, la recompensa es de tres puntos. Este número podría ser, digamos, una recompensa en dólares que cada jugador recibiría por el resultado. Si un jugador coopera y el otro abandona, el segundo tiene la tentación de abandonar, mientras que el jugador que cooperó recibe la recompensa del incauto. En el ejemplo, Estas tienen un valor de cinco y cero puntos respectivamente. Si ambos abandonan, ambos reciben un punto, el castigo por abandono mutuo.

El Dilema del Prisionero
 

   

Jugador de las Columnas

Jugador

 de las

 filas

  Cooperar Abandonar
Cooperar

R=3, R=3

Recompensa por cooperación mutua

S=0, T=5

Recompensa del incauto y tentación de abandonar

Abandonar

T=5, S=0

Tentación de abandonar y recompensa del incauto

P=1, P=1

Castigo por abandono mutuo


¿Qué debe hacerse en ese juego? Supongamos que usted, el jugador de las hileras, piensa que el jugador de las columnas cooperará. Usted tiene una disyuntiva: puede cooperar también, con lo cual recibe los tres puntos de la recompensa por cooperación mutua, o bien puede abandonar, recibiendo los cinco puntos de la recompensa de tentación. Por tanto, le conviene abandonar si piensa que el otro jugador cooperará. Sin embargo supongamos que usted piensa que el otro jugador abandonará. Ahora usted se encuentra en la segunda columna y tiene la alternativa entre cooperar, lo cual lo haría un incauto y lo dejaría sin puntos, y abandonar, lo cual ocasionaría un mutuo castigo que le daría un punto. Por ende, le conviene abandonar si piensa que el otro jugador abandonará. Esto significa que es mejor abandonar si uno piensa que el otro jugador cooperará, y es mejor abandonar si piensa que el otro abandonará. Así pues, no importa que haga el otro jugador, a usted le conviene abandonar.

Hasta allí todo va bien. No obstante, la misma lógica se aplica también al otro jugador. Por tanto, él abandonará, sin importar lo que se espere que usted haga. Así pues, ambos abandonarán, pero entonces ambos tienen un punto, lo cual es menos bueno que los tres puntos de recompensa que ambos podían haber obtenido si hubiesen cooperado simultáneamente. La racionalidad individual los lleva a los dos a un resultado peor que el otro resultado posible. He aquí el dilema.

El Dilema del Prisionero es simplemente una formulación abstracta de algunas situaciones muy comunes e interesantes donde la conveniencia propia de cada persona provoca el abandono mutuo, aun cuando todos se habrían beneficiado más con la cooperación mutua.
Así pues, dos egoístas que intervengan una sola vez en el juego escogerán el abandono y cada uno obtiene menos de lo que podrían haber conseguido si ambos hubieran cooperado. Si el juego se realiza un número de veces finito y conocido, los jugadores seguirán careciendo de un estimulo para cooperar. Esto se aplica sin duda a la última jugada pues no hay un futuro en que ésta vaya a influir. En la penúltima jugada, ningún jugador tendrá un estímulo para cooperar, puesto que ambos pueden prever el abandono del otro en la última jugada. Esta forma de racionamiento indica que el juego permanecerá igual, remontándose hasta el abandono mutuo en la primera jugada de cualquier secuencia que tenga una duración finita y conocida. Sin embargo, este racionamiento no se aplica si los jugadores interactúan un número indefinido de veces. Es el caso que, en la mayoría de los ambientes objetivos, los jugadores no pueden estar seguros de cuándo ocurrirá la ultima interacción entre ellos. Ante un número indefinido de interacciones, puede surgir la cooperación. Así pues, el asunto se convierte en el descubrimiento de las condiciones precisas que son necesarias y suficientes para que surja dicha cooperación.

La primera pregunta que nos sentimos tentados a hacer en esta situación es: “¿Cuál resulta ser la estrategia óptima?”. En otras palabras, ¿qué estrategia le redituará al jugador la puntación más alta posible? Esta es una buena pregunta, pero no existe regla alguna, independientemente de la estrategia que utilice el otro jugador. En esta sentido, el Dilema del Prisionero reiterado es del todo diferente de un juego como el ajedrez. Un maestro de ajedrez puede suponer con seguridad que el otro jugador hará la jugada mas temida. Esta suposición constituye la base de todos los planes en el ajedrez, donde los intereses de los jugadores están en pleno antagonismo. Sin embargo, las situaciones que representa el juego del Dilema del Prisionero son muy distintas; aquí, los intereses de los jugadores no están en conflicto total. Ambos jugadores pueden beneficiarse con la recompensa R por cooperación mutua o ambos pueden tener malos resultados con la penalización P por abandono mutuo. Basarse en la suposición de que el otro jugador siempre hará la jugada que uno mas teme implica especular que el otro nunca cooperará, lo cual insta al primero a abandonar, provocándose así una serie interminable de penalizaciones. Por tanto, a diferencia del ajedrez, en el Dilema del Prisionero no es seguro suponer que el otro jugador quiere perjudicarnos.

De hecho, la estrategia que funciona mejor en el Dilema del Prisionero depende directamente de la estrategia que el otro jugador emplee y, en particular, de que ésta permita el desarrollo de la cooperación mutua. En otras palabras, el futuro tiene mucha importancia en el cálculo de la recompensa total. Después de todo, si es poco probable que usted se vuelva a encontrar con la otra persona o si le tiene sin cuidado las futuras recompensas, podrá abandonar ahora sin preocuparse por las consecuencias para el futuro.

Antes de proceder al estudio del comportamiento que cabe esperar en el futuro próximo, es conveniente observar más de cerca las características de la realidad que el marco del Dilema del Prisionero puede y no puede abarcar. Afortunadamente, la simplicidad misma de tal marco permite evitar muchas suposiciones restrictivas que en otras condiciones limitarían el análisis:

1. Las recompensas de los jugadores no tienen que ser comparables forzosamente. Por ejemplo, un periodista podría verse recompensado con una nueva información confidencial, mientras que el burócrata que coopera con él podría tener como recompensa la oportunidad de que un argumento de política sea presentado bajo una luz favorable.

2. La cooperación no forzosamente debe ser considerada apetecible desde el punto de vista del resto de mundo. En ocasiones se desearía retrasar, y no fomentar, la cooperación entre los jugadores. Las prácticas comerciales de colusión son benéficas para las compañías involucradas, pero no lo son tanto para el resto de la sociedad. En realidad, la mayoría de las formas de corrupción son casos de cooperación vistos con beneplácito por los participantes, pero no por todos los demás.

3. No hay por qué suponer que los jugadores aplican siempre la lógica: no necesariamente tratan de maximizar sus réditos. Es posible que sus estrategias reflejen simplemente procedimientos de operación uniformes, reglas prácticas, instintos, hábitos o imitación.

4. Las acciones de los jugadores no siempre son siquiera decisiones conscientes. La persona que a veces devuelve un favor y en otras ocasiones no lo hace, puede no pensar en qué estrategia esta utilizando. No hay por que suponer que las elecciones son deliberadas.

El contexto es lo bastante amplio para incluir en él no sólo personas, sino también naciones y bacterias. Sin duda, las naciones toman medidas que pueden interpretarse como decisiones en un Dilema del Prisionero, tales como el alza y reducción de los aranceles. No se debe suponer que tales acciones sean racionales o el resultado de un actor unificado que persigue una sola meta. Por el contrario, bien podrían ser fruto de una política burocrática increíblemente compleja, que incluye el procesamiento de información complicada y modificaciones en las coaliciones políticas.

Así mismo, en el otro extremo, un organismo no necesita tener cerebro para intervenir en el juego. Por ejemplo, las bacterias son muy sensibles a determinados aspectos de su entorno químico. Por tanto, pueden responder específicamente a lo que otros organismos hacen, y estas estrategias de condicionamiento pueden heredarse. Más aún, el comportamiento de una bacteria puede influir en la adecuación de los demás organismos circundantes, igual que el comportamiento de otros organismos puede afectar la adecuación de ella.

Desde luego, la formulación abstracta del problema de la cooperación como un Dilema del Prisionero excluye muchas características vitales que hacen de cualquier interacción real un caso único. Entre lo que queda excluido por esta abstracción formal, figuran la posibilidad de la comunicación verbal, la influencia directa de terceros, los problemas de poner en práctica una decisión y la incertidumbre de lo que el otro jugador hizo en realidad en la jugada precedente. Claro está que ninguna persona inteligente debe tomar una decisión importante sin tomar en cuenta esos factores que complican la situación. El valor de un análisis que prescinde de éstos estriba en que puede ayudar a esclarecer algunos rasgos sutiles de la interacción (rasgos que podrían perderse en el laberinto de complejidades que se presentan en las circunstancias muy particulares en que realmente debe hacerse la elección).

A fin de encontrar una buena estrategia, aplicable a tales situaciones, invité a expertos en la teoría de los juegos a que presentaran programas destinados a un torneo computarizado de Dilema del Prisionero, muy parecido a los torneos de ajedrez por computadora. Cada una de estas estrategias fue comparada con todas las demás para determinar cuál de ellas producía el mejor rendimiento general. Lo más sorprendente fue que resulto triunfadora la más sencilla de las estrategias propuestas. Ésta era la TIT FOR TAT, que consiste en cooperar en la primera jugada y después hacer lo que haya hecho el otro jugador en la jugada previa. Se efectuó una segunda ronda del torneo, con un número mucho mayor de propuestas de aficionados y profesionales por igual, todos los cuales conocían los resultados de la primera ronda. El resultado fue otra victoria para el TIT FOR TAT. El análisis de los datos obtenidos en esos torneos revela cuatro propiedades que contribuyen al éxito de una estrategia evitar el conflicto innecesario cooperando mientras lo hago el otro jugador; conservar la facultad de lanzar una provocación en caso de abandono injustificado del otro; conceder el perdón después de responder a una provocación; y claridad en las pautas de comportamiento, de modo que el otro jugador pueda adaptarse al propio sistema de acción.

Los resultados de estos torneos demuestran que, en condiciones adecuadas, la cooperación puede surgir en un mundo de egoístas sin autoridad central. La evolución de la cooperación requiere que los individuos tengan probabilidades suficientemente grandes de volver a alterar entre sí, para que puedan tener interés en su interacción futura. Si esto es cierto, la cooperación puede desarrollarse en tres etapas:

1. El comienzo de la historia es que la cooperación puede iniciarse aun en un mundo de abandono incondicional. El desarrollo no puede ocurrir si sólo lo intentan individuos dispersos que prácticamente no tienen oportunidad de interactuar entre sí. Sin embargo, la cooperación puede surgir de pequeños grupos de individuos que basan su cooperación en la reciprocidad y que realizan entre ellos mismos una parte (aun pequeña) de sus interacciones.

2. La parte media de la historia es que una estrategia basada en la reciprocidad puede prosperar en un mundo donde se aplican muchas estrategias diferentes.

3. El final de la historia es que la cooperación, una vez que se establece sobre la base de la reciprocidad, puede protegerse de la invasión de estrategias menos cooperativas. Así, las ruedas de engranaje de la evolución social tienen una cremallera.

Una demostración concreta de esta teoría en el mundo real es el caso fascinante del sistema de “vivir y dejar vivir”, que apareció durante la guerra de trincheras en la Primera Guerra Mundial. En medio de aquel amargo conflicto, los soldados del frente se abstenían a menudo de tirar a matar, siempre que su abstención fuera correspondida por los soldados del otro bando. Lo que hizo posible el refrenamiento mutuo fue el carácter estático de la guerra de trincheras, en la cual las mismas unidades pequeñas se enfrentaban durante períodos prolongados. Los soldados de esas pequeñas unidades opositoras desobedecían en realidad a las órdenes de su alto mando, a fin de lograr dicha cooperación tácita con el enemigo. Un análisis detallado de este caso muestra que, cuando existen las condiciones propicias para que surja la cooperación, ésta puede iniciarse y mantenerse estable aun en situaciones que, en otras circunstancias, parecerían muy poco prometedoras. En particular, el sistema de “vivir y dejar vivir” demuestra que la amistad difícilmente es imprescindible para el desarrollo de la cooperación. En condiciones apropiadas, la cooperación basada en la reciprocidad puede desarrollarse incluso entre antagonistas.

Aun cuando la previsión no es imprescindible para que evolucione la cooperación, sin duda puede resultar útil. Desde el punto de vista del participante, su objetivo es obtener el mayor provecho posible, sin importar qué tanto se beneficie el otro jugador. A juzgar por los resultados del torneo, es posible ofrecer cuatro sencillas sugerencias para orientar a los individuos en sus decisiones: no envidiar el éxito del otro jugador; no ser el primero en abandonar; reciprocar la cooperación y el abandono; y no pasarse de listo.

El meollo del problema de cómo lograr beneficios de la cooperación consiste en que el método de aprendizaje por tanteos es lento y arduo. Todas las condiciones pueden ser favorables para los acontecimientos a largo plazo, pero es factible que no tengamos tiempo para esperar que esos oscuros procesos nos lleven lentamente hacia estrategias de mutuo provecho, basadas en la reciprocidad, Tal vez si entendemos mejor el proceso, podamos usar nuestra previsión para acelerar la evolución de la cooperación.
 

Descargar Aquí
 

 
 
Oxcam Consultores - Universidad Central de Venezuela. FACES.
Apartado 54006, Caracas 1053-A, Venezuela
Fax: (212) 9455707 e-mail: info@oxcamconsultores.com