历史
完美世界 > 自私的基因 > 第十二章 好人终有好报 · 2

第十二章 好人终有好报 · 2(1 / 5)

上一章   ←  章节目录  →   下一页

这里,我们不关心某一个策略是否优于另一个策略。我们只关心哪个策略在与15个对手博弈后,最终赢得最多的“钱”。在这里,“钱”指的是赢得的分数。相互合作的奖赏为3分,背叛的诱惑为5分,互相背叛的惩罚为1分(相当于我们早先例子中的轻判),失败的代价为0分(等同于之前例子中的重罚)。

zsdjy3

无论是哪一种策略,理论上它们能得到的最高分都是15000分(每一回合5分,15个对手共有200回合),最低分则是0分。不用说,这两个极端都没有实现。实际上,一个策略如果能超过15个对手中的平均水平,最多也只能获得比600分高出一些的分数。因为如果对手双方决定他们持续合作,每人在200场博弈中都能得到3分,总共便是600分。我们可以将600分作为基准分,将所有分数表达为600分的百分比。这么算来,理论上的最高分将是166%(1000分)。但事实上,没有任何一个策略的平均分超过600分。

要知道,竞赛中的博弈者并不是人类,而是计算机事先设定好的程序。而基因则在这些程序的作者里事先设定了“程序”,使得它们身体力行地扮演同样的角色(想想第四章中的计算机对弈与“仙女座”超级计算机)。你可以将这些策略想象成这些作者的微型代理。虽然一个作者原本可以提交一个以上的策略,但这其实是作弊,这表示作者将在竞争本身中加入策略,使得其中一个角色从另一个角色的牺牲中得到合作的好处。阿克塞尔罗德应该不会接受这一点。

交上来的有一些很聪明的策略,当然它们远没有其作者聪明。然而,最后胜出的策略却是一个最简单的、而且看起来最不聪明的一个。这个策略称为“针锋相对”(TitforTat),它来自多伦多一位著名心理学家和博弈学家阿纳托尔(AnatolPapoport)教授。这个策略在第一回合时采取合作行动,然后在接下来的所有步骤里,只是简单复制对手上一步的行动。有了“针锋相对”策略的博弈将如何进行呢?一如寻常,下一步的出牌完全取决于对手。假设另一对手也选择了“针锋相对”的策略(每一个策略不止与其他14个对手竞争,也与自己本身博弈),双方都选择以“合作”而开场。第二步中,双方都复制对方上一步的策略,仍然采取“合作”。这样,博弈双方持续合作,直到游戏结束,双方都能获得100%的600分基准分。

那么,假设“针锋相对”

排行阅读

苍白爱情

三秋泓
天之骄子渣攻X自卑怯懦美人伪骨科年下宋知雨寄人篱下,为了苟活,主动变成了继弟严越明最喜欢的床上玩具。注意:没有排雷,到处是雷。自带扫雷系统,谢谢。

相爱未遂

金陵十四钗
满城衣冠副CP,律师X检察官,破镜重圆本文第一人称,互攻。
我深深地爱着你,你却爱着一个傻逼,傻逼他不爱你,你比傻逼还傻逼,爱着爱着傻逼的你,我比你更傻逼,简单来说,本文讲述一个,谁比谁更傻逼的故事。

职业替身

水千丞
周翔不知道老天爷给他第二次活的机会,究竟是额外照顾他,还是没玩儿够他,否则他怎么会戏里戏外、前世今生,都被晏明修当成同一个人的替身?他也不知道他和晏小少爷,究竟是谁比谁更可怜,一个只能当替身,一个只能找替身。

暗火

白芥子
娱乐圈,大魔王诱圈他的小甜心。 凌灼是个流量爱豆,长得好、业务强,选秀出道一路顺风顺水,直到他被经纪人塞进剧组,拍人生第一部戏,遇到大魔王陆迟歇。 大魔王强势逼近,抢了凌灼和别人的丘比特箭,一步一步将凌灼勾进自己的领地,再画地为牢。某日大魔王看到凌灼和别人的《真相是真》饭制剪辑,喝醋三碗,转发微博,评曰:“假的。”再@凌灼 言:“我的。”全网哗然。 *陆迟歇x凌灼 *受和竹马队友双向暗恋,攻强势插

秋以为期

桃千岁
军二代攻 X 黑帮老大受,强强,肯定有反攻。《无地自容》系列文。军二代和黑帮老大的强强对决。主角:柯明轩,边以秋。是否互攻,看我心情,反攻是一定有的。
最新小说: 臣服Ⅳ 佛子被娱乐圈拐走了 反派看我的眼神不对劲 暗渡 黑渊 乱七八蕉的爱情 他会证明我爱你 不为人知 假如让我说下去 臣服Ⅲ