《纳什均衡与博弈论》

下载本书

添加书签

纳什均衡与博弈论- 第12部分


按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
能实际起作用。利他主义的秘密,诺瓦克认为,是声誉的力量。“通过帮助别人,我们会提高自己的声誉,”他说,“而且在群体中的好名声会增加别人帮助你的机会。”

  名誉的重要性解释了为什么人类语言变得很重要——所以人们喜欢说闲话。闲话传播人的名誉,使得利他主义的行为更可能根据名誉来实施。“人们要花费多少时间来谈论别人,好像人们一直都在评价他人的名声,这个问题很有趣,”诺瓦克说。“语言帮助合作性行为的发展,反之,合作也促进语言的演化。一个合作的群体使语言变得更重要……在间接互惠的情况下,你可以观察一个人,看他如何表现,或者更有效地,你可以直接和他说话……完成这些事,语言是非常必须的。”

  名誉滋生合作,因为它允许人在生活博弈中更好地预测他人的行为。在囚徒困境游戏中,例如,如果两个囚徒相互合作的话,那么他们都会出狱。但是你如果怀疑你的对手会不合作,那么你最好背叛他。在一轮只有一颗子弹的枪击游戏中,如果遇到不出名的对手,聪明的玩法是背叛他。然而,如果你的对手是位信誉很好的合作者,那么与他合作是很好的主意,这样你们两个都会受益。在重复博弈的情况下,合作会提高你的名誉。

  第五节 以牙还牙策略

  关于名誉的闲话可能还不足以创造一个合作的社会。数学计算表明间接互惠会给大的社会带来一些利他行为,而这些行为可能会导致发生某些问题。诺瓦克和西格蒙德的间接互惠模型受到几位专家的批评。他们指出,这种模式只能在种群规模小的群体中起作用。2004年在波士顿召开的复杂性会议上,我再次遇见诺瓦克时,他的分析已经变得很详尽了。

  在与他的谈话中,在分析合作进化论时,他重新阐述了囚徒困境中博弈的角色。该理论的背景是出自1980年一个著名的博弈论比赛,组织这场比赛的是密歇根大学的政治科学家艾克斯·罗德。他用囚徒困境博弈来测试博弈理论家自身的能力强弱。他邀请博弈论专家们参加这一比赛,并以计算机程序的形式提交一种策略来进行囚徒困境博弈,然后在循环赛中让这些程序互相斗争。每一个程序都会与其余程序进行互相斗争,最终以达尔文观点来决出最适应的策略。

  在14个提交的策略中,赢者是用最简单的方法——一个模拟的方法称为以牙还牙,这个策略是由博弈理论家阿纳托尔·拉波波特想出的。在以牙还牙的策略中,游戏者在第一轮中采取合作方案。然后,在下一轮游戏中,该游戏者会选择上一轮游戏中对手所采取的方案。如果其他游戏者选择合作,那么以牙还牙的游戏者也会如此。然而不管什么时候,只要对手选择背叛,以牙还牙的游戏者在下一轮比赛中也会选择背叛。直到对手选择合作之前,他一直会采用背叛这种方式。

  在任意给定游戏次数,并与固定对手对弈的比赛中,使用以牙还牙的策略也许会输。但是如果比赛次数无限多,并与不同的策略对抗时,平均来说,以牙还牙的策略是优于其他策略的。或者至少在艾克斯的比赛中是这样。

  一旦采用以牙还牙的策略者取胜,那么看起来更好的策略似乎是可能发掘的。所以艾克斯又举办了一次比赛,这次有62个人参加,在第二轮的参赛者中,只有一个人使用以牙还牙的策略。他就是拉波波特,而且他又一次赢了。

  你可以明白以牙还牙策略是如何在一个群体中增加合作机会的。作为以牙还牙的游戏者,信誉会促使你的对手与你合作,知道他们这样做后,你也会选择合作。如果他们不合作,你也不合作。

  奈何,如此一来,事情变得更为复杂。仅仅因为以牙还牙的策略赢得艾克斯的比赛,这并不意味着它在现实世界中是最佳策略。首先,在肉搏战中和其他策略相比,它很少能赢;总体来说,它做得很好(因为采用以牙还牙策略击败对手,和其他策略相比,对手也要损失惨重)。

  诺瓦克在会议上,探讨以牙还牙策略在广泛背景下的细微差别,乍看,以牙还牙的成功似乎否定了纳什均衡理论,暗示最佳策略就是一直背叛。进化博弈论的数学基础是分析无限多的群体数量,似乎证实了那种以牙还牙的策略。然而,诺瓦克指出,对于一个现实的有限的群体,在一定的情况下,你可以证明以牙还牙的策略能够成功侵犯所有具有背叛行为的种群。

  但是如果游戏继续,你一直计算下一步会发生什么,这样会变得更复杂。以牙还牙采取的是不原谅策略——如果你的对手本来打算合作,但是由于意外他背叛了你,于是你开始背叛他,并终止合作。如果你能计算出博弈中将会发生什么,那么你会发现以牙还牙策略并不是很成功,而改进后的策略,即宽宏大量的以牙还牙策略则比改进前要好很多。所以宽宏大量的以牙还牙策略被用来管理种群中的事务。

  “宽宏大量的以牙还牙策略以合作开始。无论你什么时候开始合作,我都会采取合作的方式。有时即使你背叛我,我也会和你合作”,诺瓦克补充道。“这允许我们为自己犯下的错误进行改正——如果是不小心犯下的错误,你有机会改正它。”

  诺瓦克说,随着游戏的继续进行,情况变得更让人吃惊。宽宏大量的以牙还牙的方法开始被全部合作的方法代替!“因为如果每个人都采用宽宏大量的以牙还牙的策略,或者以牙还牙策略,那么没有人会故意的试图背叛;即每个人都是合作者。”啊,多么快乐的时光啊!

  “一直合作”不是一个稳定的策略。一旦每个人都合作,那么一直背叛策略就会入侵,就像一头鹰出现在一群鸽子身边,那么鸽子会灭亡。所以你开始选择全部背叛,然后转向以牙还牙,接着是宽宏大量的以牙还牙,接着是合作,然后再全部背叛。“这,”诺瓦克说,“就是人类的战争与和平的理论”。

  第六节 博弈与惩罚

  尽管如此,人类还是会合作。如果间接互惠不是合作的原因,那么什么是呢?后来,一种流行的看法是由于害怕受到惩罚的威胁,所以合作才会兴起。并且博弈论证明了这种情况是如何产生的。

  经济学家萨缪尔·鲍尔斯、赫伯特·金迪斯,以及人类学者罗伯特·博依德是这一观点的倡导者。他们称该观点为“强互惠”。一个强互惠者奖励合作者,同时惩罚背叛者。在这种情况下,一个比较复杂的游戏描述了相互作用。不像玩囚徒困境游戏——一系列的一对一对抗——强互惠博弈研究者在不同的公共利益下进行实验游戏。

  第三章里曾描述过一系列的游戏。在这些游戏中,不同的个体会采取不同的策略——有些是自私者,有些是合作者,还有一些是互惠者。在一个典型的公共利益的游戏中,在开始时给游戏者一些“分”(以后可用真实钱收回)。在每一轮,游戏者可能捐献一些分给社会基金组织,自己留一部分。然后每个人收到一部分的社会基金。然而一个贪婪者为确保自己个人的收益最大化,什么都没捐,整个群体的结果可能更遭。利他主义者为增加整个群体的收益,会把他们自己的一些分给群体。而互惠者基于“他人捐献什么,相应地自己就捐献什么”,惩罚那些捐献很少却贪享整个群体福利的“吝啬鬼”(但是这样做的话,也惩罚了群体中的其他人,包括他们自己)。正如我们已经看到的,人类由三种类型的游戏者组成。进一步的研究表明,为什么人类种族已经演化到包含惩罚者。

  在一个公共利益游戏的测试中,大部分人在一开始就捐献了大约一半的分。然而,在几轮后,捐献逐渐减少。在一个测试中,在第十轮中,将近有3/4的游戏者什么都没捐。显然地,研究者发现,人们对于那些一开始捐献很少的人很生气,为了报复,他们也减少了捐献数额,以此来惩罚每个人。也就是说,大部分游戏者变成互惠者了。

  但是在另一个版本的游戏中,一名研究者公布每一个游戏者的捐献数额,并恳求其他参赛者给予评价。如果捐献少的人会被嘲笑,该吝啬者在后几轮会勉强地慷慨地捐献。如果没有人批评少捐赠者,那么他后面几轮的捐献会更少。显然,羞辱会促使行为发生改善。

  其他的实验证明,非合作者具有被惩罚的危险。所以可能在过去的进化过程中,种群中会包括惩罚者,这样能更多地鼓励合作——而没有实施惩罚的群体被淘汰。惩罚的趋势可能因此在存活的人类种群中根深蒂固,即使惩罚者自己这样做的话也会遭受损失(“根深蒂固”可能不仅仅只在基因中遗传,一些专家认为文化将惩罚的态度延续给下一代)。

  当然,在人类的进化历史中,惩罚的形式可能很不明显。鲍尔斯和金迪斯已经提出惩罚的措施可能主要是放逐,使惩罚者承受相对低的代价却仍然让非合作者承受沉重的代价。他们证明,博弈论的相互作用是如何自然地引导人类社会形成3种类型的人——非合作者(免费乘车者)、合作者和惩罚者(互惠者),正如其他电脑程序模拟所说明的一样。人类种族采取的是混合策略。

  然而专家仍在争论这些问题。我见过一篇文章这样认为:事实上,利他主义通过利他主义者个体的所得利益单独进行发展演化,而并非一定演化自种群的利益。这一结论基于另外一个流行的博弈游戏的模拟结果,这个游戏便是著名的最后通牒游戏,今天,它在由诸如科林·卡麦勒等科学家探索的另一个博弈论的领域——“行为博弈论”得以广泛地运用。行为博弈论专家认为,要深刻理解人类社会行为的深层原因——理解自然法则——根本上是需要知道是什么促使个体在行动。换句话说,你需要知道人们是怎么想的。现在,开展这些研究的流行做法是将博弈论、经济学、心理学和神经系统学结合起来,并以一个新的具有争议的学科即神经经济学为人们所认识。

  第五章 弗洛伊德的梦——博弈和大脑

  我们旨在将心理学建立为一门自然科学:亦即将心理过程表示为确定物质的定量状态,使其精确明了。

  ——西格蒙德·弗洛伊德,《科学心理学方案》,1895

  弗洛伊德渴望读懂大脑。

  他学医期间专攻神经病学,希望能破解联系大脑物理过程和神秘的精神世界的密码。1895年,他起草了一项“科学心理学”方案,用大脑中神经细胞的物理性交互来解释精神状态和人类行为。但是弗洛伊德发现十九世纪末期的脑科学远未发展到能将颅内化学和思想行为相联系的水平。因此他跳过了大脑,直接走向精神世界,通过分析梦来寻找操纵精神生活的无意识记忆的线索。

  其他人甚至从未憧憬过弗洛伊德预见的“大脑物理学”。很多人简单地将大脑视作研究的禁区,称其为科学无法检验的“黑匣子”。这些“行为主义者”宣称心理学应该专注于行为观察,研究刺激和反应。

  20世纪以后,弗洛伊德主义和行为主义都走向了衰退。随着分子医学开始揭示一些大脑的内部活动,黑匣子逐渐变得透明。现如今,得益于各种造影技术的发展,我们能看到大脑活动时的影像,大脑对我们来说几乎是完全透明。一个多世纪前被弗洛伊德抛弃的神经科学的雏形此刻已经成熟,离他最初的目标不过咫尺之遥。

  然而,弗洛伊德不可能梦想过将神经科学和经济学联系在一起,因为在他有生之年,博弈论还未崛起。尽管博弈论的创始人将博弈论看作通往人类行为的一扇窗,他们想象不到,有朝一日他们的数学会推动脑科学的发展。他们不曾预见到有一天博弈论会和神经科学结为伙伴,也不可能预见到这种联合将为博弈论征服经济学界添加筹码。但在20世纪90年代末期,在一个被称为神经经济学的新兴交叉领域,博弈论的数学成为了联合神经科学和经济学的不二选择。

  第一节 大脑和经济学

  博弈论的一个吸引人之处在于它能反映现实生活的很多侧面。要赢得一场纸牌游戏,或者在丛林中生存,或者在商场上制胜,你必须懂得如何玩你的牌。你要聪明地选择是补牌还是不补,是押还是过,或者可能是下空注。你必须知道什么时候该持牌,什么时候该退出。而且通常你必须想得很快。胜者善于快速地做出聪明的决策。在丛林中,你没有时间去计算,不管是用博弈论还是别的什么,比如对比战斗和逃跑、躲藏或寻找孰优孰劣。

  动物知道这一点。它们总是要在一大堆可能的行为中做出选择,正如神经科学家格里高利·伯恩斯(Gregory Berns)和瑞德·蒙特格(Read Montague)所观察到的(用比你通常在神经科学期刊上看到的更通俗的语言来说)。“我是去追捕这只新猎物还是继续享受上一顿的美餐?”格里高利·伯恩斯和瑞德·蒙特格在《神经元》(Neuron)杂志上写道,“我应该躲开那只我看到的可能藏在丛林里的捕猎者还是躲开我听到的那只?我应该追逐这个潜在的伴侣还是再等等看有没有更好的?”

  也许动物并不会有意识地去做这些决定,至少不会花很长时间。犹豫不利于它们的健康。而且即使动物有能力并且有时间进行复杂的思考,也并不存在着一种显而易见的方式让它们来比较自己对食物、安全和性的需要。尽管如此,动物的大脑将所有这些因素放在一起并且计算出一系列有助于生存的行为。在这点上,人和其他动物没有太大分别。大脑进化出一种方式,可以用一种“共同货币”来评估各种行为,比较并做出选择。换句话说,人类的大脑中不仅只有钱的概念,还有运转钱的神经等价物。正如钱代替了物品交换系统——提供了一种用来比较各种商品和服务的共同货币——神经细胞回路进化出一种能力,将各种行为选择翻译成大脑化学的共同货币

小提示:按 回车 [Enter] 键 返回书目,按 ← 键 返回上一页, 按 → 键 进入下一页。 赞一下 添加书签加入书架