0%

《囚徒的困境》3星

1 二难推论

  • 📌 事实上,“先发制人战争”的运动在许多十分优秀的知识分子中也获得了支持,其中包括两位当代最出色的数学家:伯特兰·罗素和约翰·冯·诺依曼。一般说来,数学家通常不是由于他们的政见或对世界的看法而闻名于世的;而且,罗素和冯·诺依曼是两个完全不同的人,但在“世界上不应该有两个核大国共存”这一点上,他们恰恰站到了一起。

    • ⏱ 2023-07-18 22:25:45
  • 📌 罗素是“先发制人战争”这场运动的主要推动者,他热衷于宣传“苏联具有核摧毁能力”,除非苏联对由美国主导世界这种状态放弃主权。在1947年的一次演讲中,罗素说:“我倾向于认为俄罗斯人会默认美国主导世界这种状态:否则,世界将经历由此造成的战争,并出现一个独一无二的政府,因为这是世界的需要。”冯·诺依曼的态度更加强硬,他热衷于出其不意地使用核武器先发制人。《生活》(Life)杂志曾经引用冯·诺依曼的言论:“如果你问为什么明天不用原子弹去轰炸他们,我倒要问为什么不今天就去轰炸呢?如果你说今天5点去轰炸,那么我要问为什么不是今天1点就去轰炸呢?”

    • ⏱ 2023-07-18 22:25:54

约翰·冯·诺依曼

  • 📌 冯·诺依曼从数学上证明了,在两个人的博弈中,只要他们的利益是完全相悖的,就总是存在一个理性的行动过程。这一证明被称为“极小极大定理”(minimax theorem)。极小极大定理所覆盖的博弈种类包括许多娱乐性游戏,从十分简单的连城游戏(ticktacktoe)到非常复杂的棋类游戏,它适用于所有一输一赢的博弈(这是符合博弈双方的利益“完全相悖”这一要求的最简单情况)。冯·诺依曼证明,在这样的博弈中,总有一种“正确的”,或者更确切地说,“最优的”方法。
    • ⏱ 2023-07-18 22:23:30

个性

  • 📌 冯·诺依曼最喜欢的笑话之一是第一次世界大战时在柏林创作的:“一个人站在街角大喊:‘皇帝是个白痴!’警察要以谋反罪逮捕他。他说:‘你不能逮捕我,我说的是奥地利皇帝。’警察说:‘你骗不了我们,我们知道谁是白痴。’”
    • ⏱ 2023-07-18 22:27:33

世界上最聪明的大脑

  • 📌 冯·诺依曼有一则逸事就说明了这一点。一次,一位拜占庭历史的著名专家参加在普林斯顿大学冯·诺依曼家举行的派对。冯·诺依曼和这位专家讨论起历史问题来,并在一个日期上发生了分歧。于是他们从书架上抽出一本书来查对,结果冯·诺依曼是正确的。几周以后,这位历史学家又一次收到冯·诺依曼家的邀请,他打电话给克拉拉说:“如果冯·诺依曼答应不讨论拜占庭历史,我就来。因为大家都认为我是世界上最权威的拜占庭历史专家,我希望他们继续保持这种印象。”
    • ⏱ 2023-06-05 22:19:42

零和博弈

  • 📌 “零和博弈”是博弈论中少数几个成为一般用语的专门术语,它指的是这样一种博弈:其总的赢取或支付是固定的。零和博弈最好的例子是打扑克,游戏者都把钱投入钱罐,结果总是被某个人赢取了。只要有人赢1美元,就有一人输1美元。正是在这种有限制的但是有不同类型的博弈中,博弈论取得了最大的成功。这种博弈显然可以用经济学作类比。我们可以说“零和社会”,意思是有人得就有人失。俗话不是说,“天下没有免费的午餐”吗?大多数娱乐性博弈是零和的,即使是不涉及钱的博弈。
    • ⏱ 2023-06-05 22:21:46

极小极大原理和蛋糕

  • 📌 如果切蛋糕的孩子均分蛋糕,他知道他的结果是获得差不多的半块蛋糕。如果他切得一大一小,他知道他的结果必定是只能拿到小的那半块。因此他只能在差不多的半块和小于半块蛋糕这二者之间做出选择,也因此他只能选择尽量均分蛋糕以保证获得差不多的半块蛋糕。这个量,是行中极小值的极大值,被称为“极大极小”。伊塔洛·卡尔维诺在《寒冬夜行人》(If on a Winter’s Night a Traveler, 1979)一书中写道:“你知道,你所能期盼的最好结果就是避免最坏情况。”这个警句很好地说明了极小极大原理。策略的选取是一个自然的结果,它不仅仅是由博弈理论中的仲裁推荐的“合理”结果,而且还是一种被游戏者双方各自的利益强制形成的真正的平衡。游戏者决不会从他的最佳策略上偏离到对自己造成威胁的策略上去(因此也就偏离到有利于对手的策略上,因为这是一个零和博弈)。

    • ⏱ 2023-07-18 22:28:26
  • 📌 当极大极小和极小极大相同时,该结果称为“鞍点”。

    • ⏱ 2023-07-18 22:25:01

曲线球和致死基因

  • 📌 冯·诺依曼区分了两类骗术。一点儿不搞虚张声势的人因此会丧失很多机会诱使他人摊牌。假定你和你的对手的牌都不好,你不唬人,而你的对手却唬人,这意味着你会彻底失败,而且对手不必摊牌就赢了。如果你也想吓唬对方一下,那么你手中糟糕的牌就要同对手糟糕的牌做比较,这样你有可能赢。唬人一方总比不唬人一方占便宜,因此,冯·诺依曼认为理性的打牌者必须会虚张声势。
    • ⏱ 2023-06-05 22:31:19

伯特兰·罗素

  • 📌 罗素不是博弈方面的理论家,但他发明的“胆小鬼困境”是博弈论中被分析得最多的一种博弈。

    • ⏱ 2023-07-18 22:29:18
  • 📌 在第一次世界大战期间,罗素仍然是坚定的和平主义者。他由于宣传反战的观点而被处以罚金,后来又被投入监狱6个月。由于倡导和平主义,他失去了在剑桥大学的地位。

    • ⏱ 2023-06-07 20:44:09

先发制人的战争

  • 📌 《雷诺新闻》于1948年11月21日抗议罗素:“用他在漫长的生命中积累起来的全部智慧提炼而出的话,竟然就是关于死亡和绝望的信息。他就是要我们放弃对人类理性的所有信念,把自己陷入没有尽头的大规模杀戮、城市的毁灭、被原子辐射所污染和毒化等状态。罗素爵士——著名的哲学家,提出的是最老式且最血腥的谬论——用战争结束战争。”
    • ⏱ 2023-06-07 20:49:24

约翰·纳什

  • 📌 在冯·诺依曼之后,博弈论领域的下一个主要人物是兰德的另一位顾问约翰·纳什

    • ⏱ 2023-06-07 20:53:45
  • 📌 冯·诺依曼处理过的唯一一种非协作博弈是二人零和博弈——这种博弈是必然非协作的。当一个游戏者的收益正是另一个游戏者的损失的时候,则不可能形成同盟。然而,这种情况已包含在冯·诺依曼的极小极大定理之中。纳什的工作主要涉及非零和博弈以及有三个或更多个游戏者的博弈。

    • ⏱ 2023-06-07 20:54:08

马后炮

  • 📌 纳什对非协作博弈的分析方法强调的是“平衡点”。所谓平衡点是双方都无怨无悔的结果,其分析方法如下:在博弈之后进行事后分析,轮流询问每个参与者,在对手的玩法已经确定的情况下,你是否愿意对玩法做一些变动?如果每个人都乐于接受刚才的玩法并且不再做任何变动,那么刚才的结果就是平衡点。

    • ⏱ 2023-06-07 21:09:03
  • 📌 显然,行游戏者对这个结果是满意的,因为他赢了5点,是在任何情况下他能赢得的最大值。但这个结果同样能被列游戏者接受,因为用放马后炮的方法,在给定了行游戏者选择其策略2的情况下,列游戏者对自己选择了策略2是无怨无悔的,因为如果他当初选择策略1,他什么也赢不了,而现在他至少赢了2点

    • ⏱ 2023-06-07 21:10:29
  • 📌 这听起来像是对“理性解”的一个合理的描写。纳什证明,每一个二人有限博弈都至少有一个平衡点。这是对冯·诺依曼的极小极大定理的一个重要发展。零和博弈的极小极大解也就是一个平衡点,但是纳什的证明表示,非零和博弈同样也有平衡点。这是一个新的结论。

    • ⏱ 2023-06-07 21:11:21

佛勒德-德莱歇实验

  • 📌 记住,所谓平衡点解是指以马后炮方式博弈时,在其他参与者的选择已确定的情况下,没有任何参与者对自己选择的策略表示后悔时的结果。但是,这里可能存在这样的情况,即平衡点并非是一个好的结果

    • ⏱ 2023-06-07 21:17:04
  • 📌 但当双方都选其“较好”策略时,他们都只能获得比较差的结果。实际上,他们两个如果都选其“最差”策略,结果反而是比较好的

    • ⏱ 2023-06-07 21:18:04

塔克的逸事

  • 📌 两个犯人可以这样推理:“假如我做出不利于对方的证供,而对方却没有,那么我可以逍遥法外(不必受1年的囹圄之灾)。假如我做出不利于对方的证供,对方也这样做了,那么我将坐两年牢(而不是3年)。在这两种情况下,不管我那朋友怎么做,我做出不利于对方的证供都是有利的,都会少坐1年牢。”麻烦在于,另一个犯人可能正要做出完全相同的结论。如果双方都是理性的,那么双方都要做出不利于对方的证供,这样双方都要坐两年牢。但只要双方都拒绝做出对对方不利的证供,每个人都只坐1年牢。

    • ⏱ 2023-06-07 21:22:17
  • 📌 那么,在囚徒的困境中,我们到底该怎么做呢?总的来说,这仍然是一个无法解决的问题,也许永远也解决不了。博弈理论家R·邓肯·卢斯和霍华德·拉发在其1957年的《博弈和决策》一书中强调了囚徒的困境,他们写道:“在囚徒的困境这类博弈中,人们无望的感觉是不可能用‘理性’或‘非理性’来克服的——这是形势所固有的。”

    • ⏱ 2023-06-07 21:24:58

常识

  • 📌 囚徒的困境之所以难,原因在于它同常识推理相悖。

    • ⏱ 2023-07-18 22:31:07
  • 📌 记住,双方的选择是不能相互影响的。如果对方背叛,他输了,这是他自作自受,跟你的选择无关。不管什么时候出现相互背叛的情况,你都庆幸自己选择了背叛;如果你选了合作,你获得的是傻瓜回报,这才冤呢。

    • ⏱ 2023-07-15 09:46:35
  • 📌 你要鼓励相互合作,选择合作。即使这次你因选择合作受到了伤害,但就长远来说合作仍是最佳策略。”

    • ⏱ 2023-07-15 09:49:27

文献中的“囚徒的困境”

  • 📌 接近于发现囚徒的困境的是托马斯·霍布斯的《利维坦》。在霍布斯时代,君主被赋予天赐的权力进行统治。地位较低的那些人必须接受他们的状态,因为这是神的旨意。霍布斯在《利维坦》中的观点是:政府为实现社会的功能尽责是正当的,即使对于没有资源、没有神学的社会也是如此。法律和秩序通过阻止背叛对每一个人都有利,而不只是对那些有幸执行法律的人有利(这里用的是我们的术语,而不是霍布斯的术语)。霍布斯论证说,在没有法律的社会里,每一个人都面临着同其他所有人的战争,没有人能免受剥削。农民的庄稼可能会被偷走,因此他首先就缺乏积极性去播种庄稼。社会成员最好放弃他们掠夺(背叛)的权力,以求得安全,不至于成为牺牲品(奖励性回报)。

    • ⏱ 2023-07-15 09:50:56
  • 📌 普契尼的歌剧《托斯卡》中反复描写了一个鲜明的囚徒的困境,歌剧的情节来自萨多1887年的一个剧本。腐化堕落的警察长斯卡庇亚判托斯卡的情人卡瓦拉多西死刑。斯卡庇亚正在热烈追求托斯卡,因此许诺同她进行一笔交易,如果托斯卡答应他的追求,他就让行刑队用空包弹使卡瓦拉多西免于一死。托斯卡同意了。虽然她十分鄙视斯卡庇亚,但假装喜欢他以挽救自己心爱的人的性命总是值得的。托斯卡应该兑现这笔交易吗?交易的两个部分需同时生效:在斯卡庇亚发出不可更改的使用空包弹(或真子弹)的命令之前,托斯卡不必同他上床。故事以相互背叛结束——这是囚徒的困境中大多数戏剧性的结果。托斯卡背叛了斯卡庇亚:当他们拥抱在一起时,她用匕首刺进了他的胸膛;斯卡庇亚也背叛了托斯卡:行刑队用的是真子弹,卡瓦拉多西难逃一死。当警察赶来要以谋杀罪逮捕托斯卡时,她纵身一跃,从城墙上跳下。

    • ⏱ 2023-07-15 09:54:39

逃票的乘客

  • 📌 你逃一次票使地铁系统崩溃的概率有多大?显然是0。不管车厢是空的还是满的,反正列车要跑。多一名乘客绝不会使系统的运行成本增加1分钱。但是,如果每个人都这么想呢?

    • ⏱ 2023-07-15 09:56:14
  • 📌 如果没有留纸条,你就省了这笔修理费,修理费从肇事者身上转移到保险公司那儿去了。如果你认为这对保险公司太不公平了,你可得多想一想:保险公司太乐意去处理这种额外的业务了,因为它们是据此设定其保险费率的。保险公司付出了修理费,但它通过提高保险费率而赢得了利润。让我们来算一笔账吧:保险公司每支付1000美元的索赔,就要收取1500美元的保险费。因此,如果你没有留下纸条的话,你可以省下1000美元,但由于提高了保险费率,公众将为之付出1500美元的代价。

    • ⏱ 2023-07-15 09:56:42
  • 📌 通常,坐车不买票的现象也是反对莫尔的乌托邦和卡尔·马克思的社会主义的一个理由。如果每一个人都努力工作,物质分配也合理透明,就不会有人挨饿或缺乏基本生活用品。但与此同时,每一个人都可能受到诱惑,试图游手好闲,因为他知道自己这样做仍然有吃的,个别人逃避责任与义务不至于对集体造成太大威胁。但如果每个人都这么做,公社就将垮台,老百姓就会挨饿。

    • ⏱ 2023-07-15 12:41:56

7 1950年

  • 📌 1945年,莱斯利·格罗夫斯将军根据他在洛斯阿拉莫斯的经验,预计苏联要花15~20年才能造出原子弹。1946年时,范尼瓦尔·布什则猜测需要20年。回过头来看,这些估计都出奇的乐观,甚至对苏联过于轻蔑。为什么美国在3年内就做出来的东西,而苏联要花20年才能复制出来呢?苏联对原子弹的了解可能比美国还早,他们还可以从美国的原子弹所造成的放射性尘埃中获得制造原子弹的线索——更不要提从他们从成功的间谍活动中得到的秘密了。本国至上主义的美国领导人认为苏联在技术上是落后的:“他们甚至连像样的长柄有盖的深平底锅都不会做。”(说实话,苏联长期以来采取的骗人把戏也助长了这种态度。1946年,苏联驻联合国代表团曾自豪地宣称:在苏联,原子能只用于和平目的,诸如让河流改道、山脉迁移。)奇怪的是,在其后若干年已确实证明苏联有原子弹以后,杜鲁门仍长期怀疑这一点。在他卸任以后的回忆录《考验和希望的年代》(Years of Trial and Hope,1956)中,他写道:“我不相信苏联人有原子弹,我不相信苏联人已经掌握了把极其复杂的结构弄在一起成为原子弹的技术。”杜鲁门怀疑爆炸可能是意外事故——实验室爆炸,而非有计划进行的试验。很难说他的说法同1951年10月检测到的苏联的两次爆炸(一次在10月3日,一次在10月22日)这一事实是对得上号的。
    • ⏱ 2023-07-18 19:37:41

技术性突然袭击的性质

  • 📌 但原子弹似乎把政治手腕的这种作用一扫而光了。一个国家在不宣而战的毁灭性打击面前将显得无比脆弱,除非自己首先出击,否则就没有什么可靠的国防可言。在对同时做出的决定一无所知的情况下,你要在生或死之间做选择,战争的这种残酷性同博弈论不是一模一样吗?

    • ⏱ 2023-07-18 19:43:03
  • 📌 冯·诺依曼当时有一句名言——“同苏联人(交战)不是‘是否’的问题,而是什么时候的问题。”作为最强硬的战略家,他是拥护先发制人战争的少数科学家之一。1950年,他发表了著名的评论:“如果你问为什么明天不用原子弹去轰炸他们,我倒要问为什么不在今天就去轰炸呢?如果你说今天5点钟去轰炸,那么我倒要问为什么不在今天1点钟就去轰炸呢?”

    • ⏱ 2023-07-18 19:43:45
  • 📌 人们还进一步认识到,一场原子战争事实上必将同时是原子弹的交换。早在1945年关于珍珠港事件的听证会上,参议员布里恩·麦克马洪就说过:“如果当年的珍珠港事件中(日本人)使用了原子弹,那么就不会有什么由政治家组成的验尸陪审团留下来去讨论这件事了。”罗伯特·M·韦伯斯特少将则说:“我相信他们针对我们的任何攻击都将试图以最完全和最突然的方式进行。”

    • ⏱ 2023-07-18 19:45:15

致谢

  • 📌 兰德公司最早研究博弈论的许多小组成员仍然健在并继续活跃在该领域。
    • ⏱ 2023-07-18 22:32:41

读书笔记

本书评论

读完了,打赏休息一下吧。