El capítulo 12 se titula Los buenos chicos acaban primero. Es un capítulo nuevo, no incluido en la edición original.
Dado el tono del capítulo, y tal como explica el propio autor el sentido de la frase, creo que una traducción más exact hubiera sido Los chicos buenos acaban los primeros.
Bueno en el sentido de Dawkins, el de los "rencorosos" de un capítulo anterior, en la que ese comportamiento era el que prevalecía: Individuos que no volvían a ayudar a aquellos que no les ayudaran previamente. Su premio era transmitir mejor sus (egoístas) genes que los "incautos" y que los "tramposos".
Luego empleaba el término, tal vez menos negativo, de "altruismo recíproco", de R. Trivers.
Este capítulo nuevo surge de los trabajos de R. Axelrod (junto con el ya mencionado otras veces W.D. Hamilton), cuya especialidad es la política, no la biología, aunque con especial atención al aspecto evolutivo de la cooperación.
artisinternational.org/images/raxelrod.jpg |
(en.wikipedia.org/wiki/Robert_Axelrod)
Uno de sus intereses fue el de las consecuencias del llamado Dilema del prisionero, que tiene tanto aplicaciones en la política como en la biología.
El planteamiento es muy sencillo: Si traicionas al otro y el otro no te traiciona, te llevas el mayor beneficio mientras que el que colabora recibe el mayor castigo. Un castigo que es menor si los dos traicionan; y un beneficio también menor, si los dos colaboran.
En el planteamiento del juego, el reparto de beneficios y castigos tiene que ser de tal manera que traicionar mientras el otro colabora es el máximo beneficio, que incluso superaría al beneficio de la colaboración mutua.
Es en ese mejor beneficio de traicionar a un incauto, donde reside el dilema. Porque en el planteamiento, nunca se sabe qué va a hacer el otro, y mi premio o castigo depende de él.
El conflicto viene de pensar qué va a hacer el otro. Y la conclusión es que el otro también va a pensar que yo le voy a traicionar (desertar, en la terminología del libro), por lo que para no recibir el mayor castigo, también escogerá traicionar. Ergo, yo escojo traicionar para no ser el pringao. Además, si hay suerte y el otro es un pringao, al traicionar me podría llevar el mayor beneficio. Se piense como se piense, mejor traicionar.
Pero si ambos cooperásemos, no habría problema,aunque la recompensa fuese menor... Esa sería la solución más conveniente para ambos, pero y si el otro me traiciona? Vaya dilema, no?
Efectivamente, es un problema de desconfianza mutua. Igualito que pasó durante la Guerra Fría y la escalada de armamento nuclear. Porque nadie quiere ser el pringao que coopera para que el otro se lleve todo el beneficio.
Hasta ahora la versión clásica del dilema, pero hay más versiones. La que se indica en el libro se llama el Dilema del prisionero repetido, en la que el juego se repite muchas veces entre los mismos jugadores. La novedad consiste en que ahora sabemos qué ha hecho antes el otro, por lo que podemos usar esa información para tomar la decisión de qué hacer la siguiente vez. Es casi obvio que ahora la opción clara es la de cooperar, pues en términos globales saldremos ambos beneficiados aunque no con el mayor beneficio posible (que sólo se alcanzaría si el otro fuese de verdad un pringao que siempre colaborase aunque yo traicione). En este contexto es más beneficioso colaborar algunas veces que traicionar siempre.
La versión repetida del Dilema sería la que según Dawkins se está jugando en la naturaleza. Porque la repetición permite establecer estrategias de actuación ante el comportamiento del otro. Estrategias que pueden ser teóricamente infinitas, pero que Axelrod (a través de un concurso entre expertos en la teoría de juegos) englobó en 15 que se usaron como programas de ordenador y se pusieron a competir entre sí durante 200 partidas. Se buscaba ver qué estrategia conseguía el mayor beneficio (incluso compitiendo consigo misma). Como estrategia de comparación se usó una de comportamiento totalmente aleatorio e independiente de la acción del otro competidor.
Mediante los correspondientes cálculos, se puede determinar que la máxima puntuación posible después de las 200 partidas serían 15000 puntos (yo siempre traiciono y el otro siempre colabora, que se llevaría 0 puntos).
Ninguna de las estrategias usadas en las simulaciones consiguió ni el máximo ni el mínimo posibles.
La cooperación mutua en todas las partidas proporcionaría a ambos 600 puntos. Pero la mayoría de las estrategias usadas tenían cierto componente de venganza ante una traición, lo que se tradujo en puntuaciones menores de 600 puntos.
Toda una pista de por dónde va el sentido de este capítulo...
Los programadores de las estrategias (con la egoísta intención de ganar) serían los genes, y los programas serían las máquinas de supervivencia.
Pero cuál consiguió la mayor puntuación? Pues la más sencilla, denominada Donde las dan las toman. Es decir, que repite lo que hizo el otro en la partida anterior. Y en la primera? Colabora.
Si esa estrategia se enfrenta a sí misma, el resultado es siempre colaborar y la puntuación sería de 600. El mejor resultado esperable.
El peor resultado fue el de la estrategia aleatoria, seguido de la estrategia más compleja.
Pero también se extrajeron resultados más genéricos. Por ejemplo, de las 15 estrategias, 8 de ellas se caracterizaban por no ser las que primero traicionaban (definidas como "amables"), aunque sí pueden hacerlo después de una traición. Esas 8 estrategias fueron las que más puntuación obtuvieron. Las otras 7 estrategias tuvieron menor puntuación y todas se caracterizaban por aceptar ser las primeras en traicionar (definidas como "sucias").
Por tanto, ser buenos parece que da buenos resultados.
Pero esa bondad puede tener matices. Por ejemplo, una estrategia se definía como "clemente" si olvida la traición (aunque reaccione ante ella en la siguiente partida). Esa estrategia tiene más puntuación que la del rencoroso que no olvida aunque sólo le hayan traicionado una vez.
Incluso se puede plantear una variación de la mejor estrategia: Donde las dan las toman 2 (es decir, que permite dos traiciones antes de vengarse). En el concurso no estaba, pero los cálculos demostraron que hubiera sido la ganadora!
Por tanto, no sólo los buenos si no también los clementes acaban los primeros.
Axelrod convocó un segundo concurso en el que el número de partidas no era de 200, sino abierto. Además, los nuevos participantes conocerían los resultados del primer concurso. Es decir, que sabían que ser amable y clemente daba buenos resultados. En este concurso es donde J.M. Smith presentó la de Donde las dan las toman 2. Pero otra gente, pensando que los demás presentarían estrategias de pringao, buscaron estrategias todavía más sucias para ganar. Sí, así de idiotas son los humanos.
Dada la sofisticación en la suciedad de las estrategias, Donde las dan las toman 2 no ganó. Volvió a ganar Donde las dan las toman!!
Y otra vez, las estrategias sucias volvieron a quedar peor que cualquiera de las estrategias buenas.
Se puede aplicar el razonamiento de la Estrategia Evolutivamente Estable? En este contexto Donde las dan las toman ganó porque se encontraba en un entorno favorable a las estrategias amables. si el número de estrategias sucias hubiera sido mayor, casi con seguridad habría conseguido muy poca puntuación.
Así que se propone un tercer concurso usando las del segundo y aplicando el concepto de evolución. Después de la 1ª generación (es decir después de la primera ronda de partidas) a cada estrategia se le asignaba una descendencia según sus ganancias. Es decir, que la ganadora tenía en la segunda ronda, más representación, y así con todas las demás estrategias. Eso significó que con el paso de las generaciones, unas estrategias se hacían más abundantes y otras podían llegar a extinguirse.
Por tanto, lo que iba cambiando con las diferentes abundancias de las estrategias era el entorno, hasta que llegase a obtenerse una estabilidad. Se comprobó que las estrategias sucias se iban extinguiendo, algunas muy rápido. Era debido a que también desaparecían las estrategias débiles, que son las que necesitan las sucias para permanecer.
Lo curioso del caso es que cuando todas las estrategias sucias desaparecieron, las estrategias amables eran indistinguibles de Donde las dan las toman. Todas colaboraban siempre!!
El resultado final sería como considerar que las estrategias amables, pero vengativas serían, en conjunto, más que una EEE, unas ECE ("estrategias colectivamente estables"). Sólo el azar determinaría cuál de ellas es la realmente dominante en un momento concreto?
No, según Dawkins. Las estrategias similares formarían una especie de grupo local donde poder evolucionar hacia la estabilidad, aumentando al mismo tiempo su tamaño. Hasta que alcanza un valor umbral y se transforma en la dominante. Qué hace que supere ese umbral? No ser una estrategia de suma cero (yo gano, tú pierdes [y aquí Dawkins lanza una buena andanada contra los abogados]).
El Dilema del prisionero es un juego de suma no cero, existe la posibilidad de que ambos participantes ganen (no lo máximo posible a costa de la máxima pérdida del otro). Lo que sería una "estabilidad de orden superior".
Ese sería el motivo por el cual, a pesar del egoísmo intrínseco de lo genes, la cooperación puede prosperar. Eso sí, siempre que el juego sea repetido y los jugadores nunca sepan cuándo dejarán de jugarlo. Puede haber una estimación de lo que puede durar, pero si esa estimación es a largo plazo el resultado es mejor que si se cree que el juego durará poco (siempre la desconfianza...).
Para explicar la realidad de este modelo, Dawkins usa el comportamiento entre algunos soldados británicos y alemanes en las trincheras de la Primera Guerra Mundial y el de ciertos murciélagos chupadores de sangre.
Pero eso es mejor leerlo directamente en el libro. Que yo no lo voy a contar todo...
Uno de sus intereses fue el de las consecuencias del llamado Dilema del prisionero, que tiene tanto aplicaciones en la política como en la biología.
El planteamiento es muy sencillo: Si traicionas al otro y el otro no te traiciona, te llevas el mayor beneficio mientras que el que colabora recibe el mayor castigo. Un castigo que es menor si los dos traicionan; y un beneficio también menor, si los dos colaboran.
En el planteamiento del juego, el reparto de beneficios y castigos tiene que ser de tal manera que traicionar mientras el otro colabora es el máximo beneficio, que incluso superaría al beneficio de la colaboración mutua.
Es en ese mejor beneficio de traicionar a un incauto, donde reside el dilema. Porque en el planteamiento, nunca se sabe qué va a hacer el otro, y mi premio o castigo depende de él.
(Ejemplo de los posibles resultados indicados en el libro) |
El conflicto viene de pensar qué va a hacer el otro. Y la conclusión es que el otro también va a pensar que yo le voy a traicionar (desertar, en la terminología del libro), por lo que para no recibir el mayor castigo, también escogerá traicionar. Ergo, yo escojo traicionar para no ser el pringao. Además, si hay suerte y el otro es un pringao, al traicionar me podría llevar el mayor beneficio. Se piense como se piense, mejor traicionar.
Pero si ambos cooperásemos, no habría problema,aunque la recompensa fuese menor... Esa sería la solución más conveniente para ambos, pero y si el otro me traiciona? Vaya dilema, no?
Efectivamente, es un problema de desconfianza mutua. Igualito que pasó durante la Guerra Fría y la escalada de armamento nuclear. Porque nadie quiere ser el pringao que coopera para que el otro se lleve todo el beneficio.
Hasta ahora la versión clásica del dilema, pero hay más versiones. La que se indica en el libro se llama el Dilema del prisionero repetido, en la que el juego se repite muchas veces entre los mismos jugadores. La novedad consiste en que ahora sabemos qué ha hecho antes el otro, por lo que podemos usar esa información para tomar la decisión de qué hacer la siguiente vez. Es casi obvio que ahora la opción clara es la de cooperar, pues en términos globales saldremos ambos beneficiados aunque no con el mayor beneficio posible (que sólo se alcanzaría si el otro fuese de verdad un pringao que siempre colaborase aunque yo traicione). En este contexto es más beneficioso colaborar algunas veces que traicionar siempre.
La versión repetida del Dilema sería la que según Dawkins se está jugando en la naturaleza. Porque la repetición permite establecer estrategias de actuación ante el comportamiento del otro. Estrategias que pueden ser teóricamente infinitas, pero que Axelrod (a través de un concurso entre expertos en la teoría de juegos) englobó en 15 que se usaron como programas de ordenador y se pusieron a competir entre sí durante 200 partidas. Se buscaba ver qué estrategia conseguía el mayor beneficio (incluso compitiendo consigo misma). Como estrategia de comparación se usó una de comportamiento totalmente aleatorio e independiente de la acción del otro competidor.
(Adaptación de los premios para el Dilema repetido, indicados en el libro) |
Mediante los correspondientes cálculos, se puede determinar que la máxima puntuación posible después de las 200 partidas serían 15000 puntos (yo siempre traiciono y el otro siempre colabora, que se llevaría 0 puntos).
Ninguna de las estrategias usadas en las simulaciones consiguió ni el máximo ni el mínimo posibles.
La cooperación mutua en todas las partidas proporcionaría a ambos 600 puntos. Pero la mayoría de las estrategias usadas tenían cierto componente de venganza ante una traición, lo que se tradujo en puntuaciones menores de 600 puntos.
Toda una pista de por dónde va el sentido de este capítulo...
Los programadores de las estrategias (con la egoísta intención de ganar) serían los genes, y los programas serían las máquinas de supervivencia.
Pero cuál consiguió la mayor puntuación? Pues la más sencilla, denominada Donde las dan las toman. Es decir, que repite lo que hizo el otro en la partida anterior. Y en la primera? Colabora.
Si esa estrategia se enfrenta a sí misma, el resultado es siempre colaborar y la puntuación sería de 600. El mejor resultado esperable.
El peor resultado fue el de la estrategia aleatoria, seguido de la estrategia más compleja.
Pero también se extrajeron resultados más genéricos. Por ejemplo, de las 15 estrategias, 8 de ellas se caracterizaban por no ser las que primero traicionaban (definidas como "amables"), aunque sí pueden hacerlo después de una traición. Esas 8 estrategias fueron las que más puntuación obtuvieron. Las otras 7 estrategias tuvieron menor puntuación y todas se caracterizaban por aceptar ser las primeras en traicionar (definidas como "sucias").
Por tanto, ser buenos parece que da buenos resultados.
Pero esa bondad puede tener matices. Por ejemplo, una estrategia se definía como "clemente" si olvida la traición (aunque reaccione ante ella en la siguiente partida). Esa estrategia tiene más puntuación que la del rencoroso que no olvida aunque sólo le hayan traicionado una vez.
Incluso se puede plantear una variación de la mejor estrategia: Donde las dan las toman 2 (es decir, que permite dos traiciones antes de vengarse). En el concurso no estaba, pero los cálculos demostraron que hubiera sido la ganadora!
Por tanto, no sólo los buenos si no también los clementes acaban los primeros.
Axelrod convocó un segundo concurso en el que el número de partidas no era de 200, sino abierto. Además, los nuevos participantes conocerían los resultados del primer concurso. Es decir, que sabían que ser amable y clemente daba buenos resultados. En este concurso es donde J.M. Smith presentó la de Donde las dan las toman 2. Pero otra gente, pensando que los demás presentarían estrategias de pringao, buscaron estrategias todavía más sucias para ganar. Sí, así de idiotas son los humanos.
Dada la sofisticación en la suciedad de las estrategias, Donde las dan las toman 2 no ganó. Volvió a ganar Donde las dan las toman!!
Y otra vez, las estrategias sucias volvieron a quedar peor que cualquiera de las estrategias buenas.
Se puede aplicar el razonamiento de la Estrategia Evolutivamente Estable? En este contexto Donde las dan las toman ganó porque se encontraba en un entorno favorable a las estrategias amables. si el número de estrategias sucias hubiera sido mayor, casi con seguridad habría conseguido muy poca puntuación.
Así que se propone un tercer concurso usando las del segundo y aplicando el concepto de evolución. Después de la 1ª generación (es decir después de la primera ronda de partidas) a cada estrategia se le asignaba una descendencia según sus ganancias. Es decir, que la ganadora tenía en la segunda ronda, más representación, y así con todas las demás estrategias. Eso significó que con el paso de las generaciones, unas estrategias se hacían más abundantes y otras podían llegar a extinguirse.
Por tanto, lo que iba cambiando con las diferentes abundancias de las estrategias era el entorno, hasta que llegase a obtenerse una estabilidad. Se comprobó que las estrategias sucias se iban extinguiendo, algunas muy rápido. Era debido a que también desaparecían las estrategias débiles, que son las que necesitan las sucias para permanecer.
Lo curioso del caso es que cuando todas las estrategias sucias desaparecieron, las estrategias amables eran indistinguibles de Donde las dan las toman. Todas colaboraban siempre!!
El resultado final sería como considerar que las estrategias amables, pero vengativas serían, en conjunto, más que una EEE, unas ECE ("estrategias colectivamente estables"). Sólo el azar determinaría cuál de ellas es la realmente dominante en un momento concreto?
No, según Dawkins. Las estrategias similares formarían una especie de grupo local donde poder evolucionar hacia la estabilidad, aumentando al mismo tiempo su tamaño. Hasta que alcanza un valor umbral y se transforma en la dominante. Qué hace que supere ese umbral? No ser una estrategia de suma cero (yo gano, tú pierdes [y aquí Dawkins lanza una buena andanada contra los abogados]).
El Dilema del prisionero es un juego de suma no cero, existe la posibilidad de que ambos participantes ganen (no lo máximo posible a costa de la máxima pérdida del otro). Lo que sería una "estabilidad de orden superior".
Ese sería el motivo por el cual, a pesar del egoísmo intrínseco de lo genes, la cooperación puede prosperar. Eso sí, siempre que el juego sea repetido y los jugadores nunca sepan cuándo dejarán de jugarlo. Puede haber una estimación de lo que puede durar, pero si esa estimación es a largo plazo el resultado es mejor que si se cree que el juego durará poco (siempre la desconfianza...).
Para explicar la realidad de este modelo, Dawkins usa el comportamiento entre algunos soldados británicos y alemanes en las trincheras de la Primera Guerra Mundial y el de ciertos murciélagos chupadores de sangre.
Pero eso es mejor leerlo directamente en el libro. Que yo no lo voy a contar todo...
Comentarios
Publicar un comentario
Los comentarios serán editados por el autor siguiendo su propio criterio