MOOC笔记

介绍

将学过的MOOC整理在这里

  • 公正 Justice by Havard
  • 博弈论 Game Theory by Stanford

公正 / What’s the Right Thing to Do

Lecture 1

电车的例子,治病救人的例子。

后果/功利主义道德推理Consequentialist:一个道德的选择,取决于你的行为所导致的后果。所以结论是:牺牲一人保全五人是更好的选择。代表人:边沁。

绝对主义道德推理Categorical:是否道德取决于特定的绝对道德准则,取决于绝对明确的义务与权力,而不管后果如何。代表人:康德。

哲学就是让我们面对自己熟知的事物,引导并动摇我们原有的认知。这些让我们对熟知的事物变得陌生,不是通过提供新的信息,而是通过引导并激发我们用全新方式看问题,但这正是风险所在。一旦所熟知的事物变得陌生,它将再也无法回复到从前。自我认知就像逝去的童真,不管你有多不安,你已经无法回到过去了。

因为哲学使人疏离现实,甚至可能弱化行动力。追溯到苏格拉底时代,就有这样一段对话。古希腊哲学家卡里克利斯,试图说服苏格拉底放弃哲学思考,他告诉苏格拉底:如果一个人在年轻时代,有节制地享受哲学的乐趣,那自然大有裨益。但倘若过分沉溺其中,那他必将走向毁灭。听我劝吧,卡里克利斯说,收起你的辩论,学个谋生的一技之长,别学那些满嘴谬论的人。要学那些生活富足,声名显赫及福泽深厚的人。

面对上述的哲学风险,有一种典型的回避方式,怀疑论:既然大佬们都想不出来,我肯定也想不出来,干脆不想了。康德曾很贴切地描述了怀疑论的不足(参见康德的《纯粹理性批判》)理性自省,是以伺将来做出正确抉择的地方,但绝非理性的永久定居地。简单地默许于怀疑论,永远无法平息内心渴望理性思考之不安。

Lecture 2

边沁对于功利主义道德论的定义:最大化功利(Utility)

  • 也有时候被总结为一句口号:为最多的人谋求最大的幸福

功利主义认为快乐和痛苦都是可以计算的,功利 = 快乐 - 痛苦

课堂上举了达德利船长杀人案,产生了三个问题:

  1. 某些基本权利我们有吗?
  2. 只要程序公平就可以不论结果吗?
  3. 征得同意到底有何道德作用?

在飓风来临的时候,物价飞涨,那是否合理呢?自由市场自由贸易的人认为物价涨了之后可以吸引供应商把更多的东西运过来,是一件帮助恢复的好事。但是这样的话只有那批富人觉得OK,很多穷人的利益就被忽视了。资本主义也讲究一个社会整体福利。我们在计算社会整体福利的时候,不能忘记了那些基本生活必需品都拿不到的普通人。

In times of trouble, a good society pulls together. Rather than press for maximum advantage, people look out for one another.

To acknowledge the moral force of the virtue argument is not to insist that it must always prevail over competing considerations. What’s important to notice, is about cultivating the attitudes and dispositions, the qualities of character, on which a good society depends.

So you might say that ancient theories of justice start with virtue, while modern theories start with freedom.

Thinking about justice seems inescapably to engage us in thinking about the best way to live.

08年金融危机,170million的政府援助给AIG公司,最后160million分给了他的领导层。跟这次疫情期间简直一模一样。

Wall Street traders, bankers, and hedge fund managers are a hard-charging lot. The pursuit of financial gain is what they do for a living. Whether or not their vocation taints their character, their virtue is unlikely to rise or fall with the stock market. So if it’s wrong to reward greed with big bailout bonuses, isn’t it also wrong to reward it with market largess?

One obvious difference is that bailout bonuses come from the taxpayer while the bonuses paid in good times come from company earnings. This takes us to the heart of the complaint. The American public’s real objection to the bonuses—and the bailout—is not that they reward greed but that they reward failure.

We sometimes think of moral reasoning as a way of persuading other people. But it is also a way of sorting out our own moral convictions, of figuring out what we believe and why.

As we encounter new situations, we move back and forth between our judgments and our principles, revising each in light of the other.

Moral reflection is not a solitary pursuit but a public endeavor. It requires an interlocutor—a friend, a neighbor, a comrade, a fellow citizen.

  • 从我们的判断和原则这两方面来理清公正的问题。
  • 我们还需要以为可以一起讨论的朋友,防止我们关注公正的看法只是一种自我强化的偏见。

Lecture 3

功利主义逻辑现今的实践之一:成本效益分析(Cost-Benefit-Analysis)

反对功利主义的两点异议:

  1. 是否尊重了个体/少数人的权力?
  2. 整个功利求和的加总方式是不是合理的/可能的?
    • 男女同校的例子
    • 我们是否该考虑gaoji/低级快乐的区别

Bentham arrives at his principle by the following line of reasoning: We are all governed by the feelings of pain and pleasure. They are our “sovereign masters.” They govern us in everything we do and also determine what we ought to do. The standard of right and wrong is “fastened to their throne.”

  • 我们必不是我们情绪的奴隶,或者说本不应该。

All moral quarrels, properly understood, are disagreements about how to apply the utilitarian principle of maximizing pleasure and minimizing pain, not about the principle itself.

  • 自我为中心的想法。对这些人来说,信仰也只是满足自己的工具罢了。

Lecture 4

如何判断更高级别的快乐:穆勒:两种快乐都感受过的人,更偏好的就是高级快乐。

穆勒认为如果受到过培养、鉴赏和教育,不仅能够分辨出来两种快乐之间的差别,而且会真的偏好高级快乐:

  • 「当痛苦的人,胜过当快乐的猪」

穆勒认为公正就像是高级快乐,长远角度来说是更好的,不过这并没有逃出功利主义的思考方式。

Lecture 5

穆勒认为长远来看,基于功利主义的演算,道德上对的事都是有好处的。

  • 在摘除健康人器官的例子中,如果摘除了,可能会导致社会上的人不再敢去体检,带来长远的负面影响。不过,医生不摘除健康人的器官,仅仅是担心以后没人到医院体检了吗?还是有其他的原因…

自由主义:我们是独立存在的个体,我们享有自由的基本权利。我们有权自由选择,过自己喜欢的生活,只要尊重他人同等的权利。

自由主义下的政府错误行为:

  1. 家长式的立法,即制定保护人们免受自身行为伤害的法律:安全带,摩托车头盔。
    • 戴头盔也许是件好事,但是需要人们自己做主
  2. 道德式的立法:禁止同性恋行为。
    • 没人因同性恋行为而受到伤害,不该使徒立法弘扬道德。
  3. 任何为了劫富济贫,进行收入或财富再分配。
    • 相当于政府实行的盗窃,其对象是工作出色而赚得大钱的人

自由主义认为:你无法根据财富分配的结局来判断财富分配是否公平,应该按照过程:

  1. 最初占有的公正原则:人们是否公平的获得生产资料,如果厂房、土地都不是偷来的即可。
  2. 财富的分配是否基于自由达成的交易:分配的结果是出自于自由市场上个体的自由选择。

诺齐克的逻辑链:征税 -> 拿走了我的财富 -> 强迫义务劳动 -> 我变成奴隶 -> 我对我自己没有控制权 -> 征税不符合自由主义。

政府在制定反雇佣歧视法时,也同样侵犯了个人权利——歧视别人的权力

  • 乍一看挺合理,但是这其实有瑕疵…因为自由主义的一个根本点是尊重他人同等的权力。
  • 同样的例子还有强制退休金、最低工资标准、行业执照的要求…

关于乔丹的特殊例子:假设在乔丹离开NBA的第一年,芝加哥市政厅为了安抚芝加哥公牛球迷的心,而要求乔丹继续打下一个赛季1/3的比赛,大多数人会认为这样一个法律是不公正的,是对乔丹自由的一种侵犯。但是,如果国会不能强迫乔丹重返赛场,那么他又有什么权利强迫乔丹放弃他靠打篮球所得的1/3的收入呢?

Lecture 6

在一个社会下,我们是否真正的拥有自身呢?

三种不同的征兵制度:

  1. 征兵制
  2. 允许有偿替代者的征兵制(美国内战制度)
  3. 市场体制(志愿兵役制度:直接由政府从税收中出钱雇人)

一个无家可归的,睡在桥下的人,可能在某种意义上是选择了睡在桥下,可是我们未必会认为他的选择是一个自由的选择。我们也不会正当的认为,与睡在公寓里相比较,他肯定更加喜欢睡在桥下。为了弄明白他的选择是反映出他喜欢睡在户外,还是反映出他不足以支付得起一间公寓,我们就需要了解一下他所处的环境。

  • 事实上,征兵制和志愿兵制都是强迫:前者是法律的强迫,后者是经济需要的压力。
    • 霍,这个观点很有启发性。很多时候我们没有考虑到是不是每个人都有着同样的机会。那些看似公平/自由的决策实际上剥削了那些没什么选择余地的人。

志愿兵&雇佣军:人们有时候辩称,外国士兵会不如美国人忠诚。可是国籍来源并不能保证战场上的忠诚,而且部队征兵者可以审查外国应聘者以测定他们的忠诚程度。一旦你接受了“军队应当运用劳动力市场来扩军"的这一观念,那么,在原则上,你就没有理由将人选资格限定在美国公民之内——没有理由,**意即除非你相信军事服务毕竟是一种公民责任,是公民身份的体现。**可是,如果你相信这一点,那么你就有理由质疑这种市场解决之道。

我们在自由市场中所作出的选择到底有多自由?是否有一些特定的德行和更高的善是市场所不尊重的,并且是金钱所不能购买的?

Lecture 7

John Locke:自由并不是想做什么就做什么,自然状态下,受自然法支配

  • 提到了生命权不可放弃unalienable。就像一张不可转让的机票一样。所以我们充分拥有我们的生命就显得没那么充分了。

任何施加了我们劳动的无主物品,都是我们的财产。一个极端情况是,我们在一块无主之地耕作,那么不仅作物是我们的,这块地也变成了我们的。

伊曼纽尔·康德〈1724、18)为义务和权利提供了另一种可选的论证,这是迄今为止任何一个哲学家所给出的最强有力、最有影响力的论证之一。它并不依赖于“我们拥有自身”这样的观念,也不依赖于“我们的生命和自由是来自于上帝的礼物”这样的主张。相反,它依赖于这样一种观念——我们是理性的存在,值得拥有尊严和尊重。

1781年,在他57岁的时候,他发表了第一本著作 ——《纯粹理性批判》,该书对那种与大卫·休谟和约翰·洛克相联系的经验主义理论提出了挑战。四年之后,他发表了《道德形而上学基础》,这是他诸多著作中的第一本关于道德哲学著作。在杰里米·边沁的《道德与立法原理导论》发表五年之后,康德的《道德形而上学基础》对功利主义发起了一场猛烈的抨击。它认为,道德并不与使幸福最大化以及任何其他目的有关,而在于将人作为目的本身而加以尊重。

Lecture 8

自然状态有什么不便呢/为什么我们需要一个政府呢?

  • 因为自然状态下,人人都可以实施惩罚权。人们审理自己的案子时,往往会失去理智。
  • 人们会对于侵犯自己权利的行为过分敏感,防卫过当。导致了一种「先下手为强」的暴力行为。

脱离自然状态就显得很自然:你同意放弃你的执行权,建立一个共同体/政府。

财产权是自然的权力,但是什么是财产权,以及什么样的行为算是剥夺财产,这却是由政府定义的。

洛克反对专制政府,反对肆意挑选某个人去参军,但是如果经过一套合法的,大家都同意的方式去挑选一些人去参军,洛克认为是OK的。

那种试图从我们恰好具有的各种欲望来得出道德原则,是一种错误的思考道德的方式。仅仅因为某物给很多人带来快乐,并不能使它成为正当的。仅仅根据大多数人〈无论数量有多大)喜欢一种法律(无论有多强烈)的这样一个事实,并不能使这个法律成为正当的。

功利主义的幸福原则“对于确立道德而言毫无贡献,因为,使一个人幸福不同于使他变好;使一个人在追求自己的利益时变得审慎明智,不同于使他更有德性"。将道德建立在兴趣和偏好基础之上,就破坏了它的尊严。它并不教导我们如何区分对与错,而“只是更加工于计算"。

假设我正在试着决定买哪一种口味的冰激凌:我是应该买巧克力的呢,香草的呢,还是咖啡太妃糖颗粒的呢?我可能认为自己是在运用选择的自由,但是,我真正在做的就是在试着弄明白,哪一种口味能最好地满足我的偏好——那些我事先并没有加以选择的偏好。

根据康德的思想,自由地行动就是自律地行动,自律地行动就是根据我给自己所立的法则而行动一一而不是听从于本性或社会传统的指令。

  • 康德把自律的对面叫成「他律」,比如像苹果会落到地上,并不是自由的行动,而是受到了重力的影响。
  • 自由的行动,并不是为了给某种特定的目的选择最佳的方式,而是为了目的本身去选择目的。(巧克力冰淇淋)

“为了给伦理课写一篇好论文。”你回答道。
“可是为什么要写一篇好论文呢?”你的室友问道。
“为了获得一个好成绩。"
“可是为什么要在乎成绩呢?”
“为了在投资银行得到一份工作。
“可是为什么要在投资银行得到一份工作呢?”
“为了某天成为一名对冲基金经理。"
“可是为什么要成为一名对冲基金经理呢?”
“为了赚很多的钱。,
“可是为什么要赚很多的钱呢?"
“为了能够经常吃龙虾,我喜欢吃龙虾。毕竟,我是一个有感知的生
物。这就是我为什么熬夜思考失控电车的原因!”
这就是一个康德所说的“他律的规定性”事例——**做某事是为了其他事情,再为了其他事情,如此等等。**当我们他律地行动时,我们是为了某些外在于我们而给定的目的去行动,我们,是自己所追求的各种目的的工具,而非作者。

当我们自律的行动,我们做某事是为了其自身的目的,是作为目的本身。

根据康德的理论,一个行为的道德价值并不是由随之而来的结果所构成,而是由完成这一行为的意图所构成。重要的是动机,而且这种动机必须是特定种类的。重要的是,我们要因为一件事情是对的去做这件事,而并不是由于某些隐晦不明的动机去做它。

  • Yes!

如果我们是出于某些动机——如自我利益——而不是义务去行动的话,那么,我们的行为就缺乏道德价值,康德坚持认为这是真实的,这一点不仅仅是针对自我利益而言,也是针对所有的、企图满足我们的各种期望、欲求、偏好和渴望的尝试而言。康德将这样的动机一一他称之为“倾向的动机”与义务的动机作了对比,并且认为,只有出于义务动机的行为,才具有道德价值。

若干年以前,马里兰大学试图通过要求学生签署不作弊的保证书,以反对那种普遍存在的作弊问题。作为一种鼓励,那些签署保证书的学生得到了一张打折卡,他们凭这张卡在当地商店消费可以节省10%、25%的花费。8没有人知道,有多少学生是为了当地比萨店的折扣而承诺不作弊。可是,我们大多数人会同意,收买诚实这一行为缺少道德价值。(这些折扣可能成功地减少了作弊的发生率,也可能没有;然而,这里的道德问题是,被那种对折扣或物质奖励的欲求所推动的诚实,是否具有道德价值。康德对这一疑问的答案会是否定的。)

如果这个男孩说实话的唯一理由就是避免感到罪恶,或避免万一他的错误被发现后而导致的坏名声,那么,他说实话这一行为就缺乏道德价值。然而,如果他说实话的原因是他知道这是正当之事,那么,他的行为就具有道德价值,而不顾及那可能与之相随的快乐或满足。只要他是出于正当的理由而做了正当的事情,那么,对这件事情的良好感觉,就并没有诋毁它的道德价值。

Lecture 9

假言命令运用的是工具理性:如果你想要X,那么就做Y。

“如果一个行为,只是在作为一种达到其他事物的手段时才是好的,"康德写道,“那么,这一命令就是假言命令。如果这个行为本身就代表着善,并因此对意志——这种意志自身符合于理性——来说非常必要的话,那么这一命令就是绝对的。

康德关于绝对命令的几项标准:

  1. 我们应当仅仅依据那些我们可以使之毫无矛盾的普遍化的原则而行动。(就是说社会上每个人都这么做了,是不是OK)但是这种论述的方式,让康德陷入了结果主义的漩涡(他本来是从动机入手的)。
  2. 把人看作目的。
    • 对于康德而言,自杀的方式违背了绝对命令。如果为了逃避种痛苦的情形,我就结束了自己的生命,那么我就是将自己作为一种解脱痛苦的手段。然而康德提醒我们,一个人并不是一个东西,“不是被仅仅当做手段而加以利用的东西"。我没有权力舍弃那内在于自己的人性,就像我没有权力舍弃内那在于他人的人性一样。对于康德来说,自杀与谋杀之所以错误的原因是一样的。两者都是将人看做物而加以对待,都没有将人性作为目的本身而加以尊重。
    • 公正要求我们支持所有人的人权,无论他们生活在哪里以及我们与他们有多熟悉;仅仅因为他们是人类,具有理性能力,就因此而值得尊重。

要记住,康德承认我们不仅仅是理性的存在,我们不仅仅居住于理智世界。如果我们仅仅是理性存在,不受自然法则和自然需要的制约,那么,我们所有的行为“都将始终与自律的意志相一致"。32由于我们同时栖居于两种立场之中一一.一必需的王国和自由的王国.一所以在我们所做的与我们所应当做的之间,在事物所是的方式与它们所应当是的方式之间,就总是存在有一个鸿沟。

另一种表述这一要点的方式,就是认为道德不是经验性的,它总是与这个世界保持着一定的距离。它对这个世界进行评判。科学尽其所有的力量与洞见,都不能触及道德问题,因为它是在感知领域起作用。

  • 科学永远无法证明自由的存在性,因为科学是经验的,道德是先验的。

康德认为随意性行为是值得反对的,因为它完全是性欲的满足,而不是尊重伙伴的人性。

  • 卖淫也是这样,将人看作了工具而不是目的。因此而被称为不道德的行为。

你必须说真话的原因并不在于这个对象有权利得知真相,或者谎言会伤害他。而在于任何谎言,都损害了正当性的真正来源。因此,在所有的陈述中都要真实,是理性的一种神圣的,无条件的命令法则,他不允许有任何权宜之计。

比起谎言,康德认为一种具有误导性,然而却是真实的陈述更好。一个谨慎的听众总是有可能把他弄明白。

  • 害,我觉得误导也不是什么好行为。

Lecture 10

约翰罗尔斯的提出了无知之幕理论。

你和我做交易的这一事实,并不能使这项交易就是公平的。

同意不足以证明合同的公正/具有道德义务:

  • 芝加哥的老太太要为修理马桶付出5万美元
  • 一项不平衡的交易可能远没有达到相互获利

同意有时也是非必要的:

  • 这种思想基于:偿还一种利益的义务,可以不需要同意就能产生
  • 纽约的橡皮清洁工,强制清洗并收费

同意和互惠性的比较:假设你发现生活多年的妻子其实一直在和别人约会,你会感到愤怒,这种愤怒可能出自于:

  1. 同意:我们有过一个约定,你发过誓,你违背了承诺
  2. 互惠性:我对你一直如此忠诚,我应当得到比这更好的。这不是回报我忠诚的方式

罗尔斯怎么知道,在无知之幕的背后,人们不会赌一把,愿意选择一种高度不平等的社会以期处于社会顶层呢?

罗尔斯表明:一种绝对的平等,并不是精英统治的市场社会的唯一备选项。罗尔斯的备选项——他称之为差异原则——能纠正那种关于才能和天赋的不公平分配,而同时又不给那些有天赋的人设置障碍。如何能做到这一点呢?我们要鼓励那些有天赋的人发展并锻炼自己的才能,不过同时也要认识到,这些才能在市场中所获得的回报属于作为整体的共同体。我们不要给那些跑得最快的人设置障碍,让他们去跑并做到最好;但是要事先认识到,这些奖品并不只属于他们,而应当与那些缺乏这类天赋的人们共同分享。

当我的学生们在面对罗尔斯关于努力的论点时,他们中的许多人都竭力反对。他们认为自己的成就,包括进人哈佛,所反映出的是他们自己的努力,而不是那些超越于他们掌控的、具有道德任意性的因素。许多同学带有疑虑地看待任何一种这样的公正理论:即那种认为我们在道德上并不应得那些凭自己的努力所获得的回报的公正理论。

  • 罗尔斯有些极端,甚至觉得连自己的努力本身都不值得获得额外的回报,只因有的人没有努力的天赋。

让我们来考虑一下迈克尔“乔丹。他确实训练得非常辛苦,可是有些不太出名的篮球运动员甚至训练得更加辛苦。没有人会说,他们应得一份比乔丹更丰厚的合同,以作为对他们所付出的时间的一种奖励。因此,尽管精英统治者们谈论到了努力,可是他们却相信,其实是贡献或成就才值得奖励。无论我们的职业道德是不是自己的行为结果,我们的成就,至少在部分程度上,都取决于那些我们并不能心安理得地拥有的各种自然才能。

人们因为自己的才能而获得报酬,不仅是因为应该奖励这份才能,还源于当时所在的社会恰好喜欢具有这种才能的人。在一个精英统治的社会,大多数人都认为,世间的成就反映出我们所应得的。其实不然,有可能你是个天赋异禀的人,只是活在一个你的天赋不被认可的社会中。

事物所是的方式,并不决定他们应当所是的方式。

感觉罗尔斯的意思是,大佬可以获得高工资,除非是这种工资的差异最后能增加所有人的福祉。

第七章 反歧视行动之争

补偿性的理由将反歧视行动看做对过往错误的一种纠正。它认为少数民族的学生应该得到偏爱,以补偿那段将他们置于一种不公正的不利处境的歧视史。这一论点主要将录取看做接受者的一种利益,并且试图以一种补偿过往的不公正及其残留影响的方式,来分配这种利益。

可是这种补偿性的论证遇到了一种严峻的挑战:批评者们指出,那些受益人未必就是那些曾经的受害者;那些提供补偿的人,也很少是那些造成所纠正之错误的人。许多反歧视行动的受益人都是中产阶级的少数民族学生,他们并没有遭受贫民区中的那些年轻的非洲裔美国人以及拉丁美洲裔美国人所遭受的那些苦难。为什么一个来自于富裕的休斯敦郊区的非洲裔美国学生,应当比谢里尔.霍普伍德占有优势呢?后者可能实际上面临着一个更加严峻的经济困难。

支持反歧视运动的多样性理由,并不依赖于具有争议性的集体责任的观念;它也不依赖于证明,那些在录取时受到偏爱的少数民族学生本人遭受过歧视或阻碍。它并不将录取看做对接受者的奖励,而是看做一种促进社会上值得追求的目标的手段。

  • 为了实现某种多样性,为了使少数民族也能遍布在各行各业。

在反歧视行动的多样性理由的核心,存在着一种有争议但却深刻的主张:录取并不是一种授予最高美德或德性的荣誉。那些拥有最高考试分数的学生,以及来自于一个处于不利地位的少数民族团体的学生,在道德上都不应得录取资格。只要申请者对满足该大学的社会目的有所贡献,那么他的录取资格就是正当的,而并不是因为它奖赏学生们的那些被单独界定的优点与美德。德沃金的重点在于:录取中的公正并不是在奖赏优点与德性,只有当一所大学界定了自己的使命时,我们才能知道,什么才算是分配大学新生名额的公平方式。该使命界定了相关的美德,而不是相反。德沃金关于大学录取的论证,与罗尔斯关于收人分配的论证类似,它与道德应得无关。

  • 有点意思。如果一个学校目标就是消除人们对同性恋的偏见。那么他完全有权利拒绝录取所有不是同性恋的人。

拒绝承认道德应得作为分配公正的基础,这在道德上是有吸引力的,但同时也是令人不安的。它之所以具有吸引力,是因为它打消了存在于精英统治制度的社会中,为人们所熟悉的那种自鸣得意的妄想:成功乃美德之冠,富人之所以富有是因为他们比穷人更加应得。正如罗尔斯所提醒我们的:“没有人应得更好的自然能力,在社会中也不应得一个更好的起点。”我们居住于一个恰好奖励我们特殊强项的社会也并非自己所为,这是对我们好运气而非德性的一种衡量。

『工作与机会是对那些应得者的奖励』这一观念深人人心,可能在美国比在其他社会更加深人人心。政治家们经常宣称那些『努力工作并按规则行事』的人应当能够跻身于社会前列,并鼓励那些实现了自己美国梦的人将自己的成功看做其美德的折射。这一观念至多是一种混合性的鼓励,其持续性存在对于社会稔定性来说是一种障碍。我们越多地将自己的成功看做自己的行为结果,那么我们就越少地感觉到自己对那些落后者所负有的责任。

法学院发给霍普伍德的拒绝信:

亲爱的霍普伍德小姐:

我们很遗憾地通知你,你的录取申请被拒绝了。请你谅解,我们的决定丝毫没有冒犯之意。我们并没有蔑视你,事实上,我们甚至认为你跟那些被录取的学生同样应得。

你进入了一个碰巧不需要你所提供的各种才能的社会,这并非你的过错。那些取代你而被录取的人,并不应得一席之地,也并不因为那些使他们能够被最取的因素而值得表扬。我们仅仅是将他们一一和你一一作为一种满足更广阔的社会目的的工具来考量。

我们知道你会觉得这一消息是令人失望的。但是,你的失望不应当被这样一种想法所夸大,即,这种拒绝以某种方式反映出你的内在道德价值。我们在以下一种意义上对你表示同情:当你申请的时候,你恰好没有拥有社会所恰好需要的那些特征,这太糟糕了。祝你下次好运。

你真诚的,

那么,什么才是大学的目的呢?哈佛并不是沃尔玛,也不是布鲁明戴尔百货公司〈Bloomingdales)。其目的并不是要使财政收人最大化,而是要通过教学和研究而服务于共同善。教学和研究确实花销很大,各所大学也都投人了很大精力来筹集资金。但是,一旦挣钱的目标占据主导地位,直至影响到录取工作时,那么这所大学就远远偏离了学术和公民的善,而后者是其存在的首要原因。

  • 各个大学也不能随心所欲的定他们学校的目标。

第八章 谁应得什么?

博弈论

博弈有三部分构成:玩家,行为,收益
博弈论分为两种基本形式:

  • 范式博弈(Normal):假定所有玩家同时采取行动,
  • 展开博弈(Extensive):设计不同玩家之间的Timing&Information,一般用树模型。

n人的范式博弈:<N,A,μ>

  • N:1~n 表示了参与人数
  • Ai:Action Set行为集合
  • μi:效用函数utility/payoff Function

常用矩阵来描绘博弈:如果两个玩家的话,行是一个玩家,列是一个玩家,矩阵的元素是一个二维的向量,表示他们各自的收益

反抗政府的那个例子中我们发现,如果其他人的决策对个体的决策有影响的话,就不能用矩阵形式来表示了。

一个简单的常和博弈的例子——匹配硬币:pure competition 效用函数之和是0或是个常数

  • 两个人正反面相同:A给B一块钱

  • 两个人正反面不同:B给A一块钱

Pure cooperation:每个人的效用函数相同

夫妻两人看电影的例子:可以同时存在竞争和合作

纳什均衡考虑的步骤:

  1. 其他人会怎么做
  2. 我要如何来应对

纳什均衡就是每个人都作出最优解所形成的局面
纳什均衡是稳定的,因为不是纳什均衡的情况是不稳定的。(随着人们对问题的了解深入,他们会改变他们的主意)

凯恩斯的选美比赛(keynes’s beauty contest game):英国的报纸上,在几幅美女图片中,选出来你认为最受其他人欢迎的美女。这就是一种要考虑其他人行为而不是单单考虑自己行为的博弈。

又一个game:每个人说出一个1-100的数字,然后最接近大家平均数的2/3的那个人获胜,下面开始解题:

  1. 每个人猜平均是X,所以会出0.66X,但因为X<=100,所以每个人的数字不会超过67
  2. 所以平均会是67及以下,所以会出0.66*67,所以无限循环下去
  3. 纳什均衡告诉我们,每个人该出1!
  4. 最后结果第一轮是23胜出,又做了一遍是4,结果向着纳什均衡(1)在发展

我们将a(-i)定义为除了自己其他人的策略集,a定义为自己的最优策略,最优策略可以不唯一,但一定是出自最优对策集BR(Best response)。最优对策集的假设是其他所有人都会使用策略a(-i),那么BR的定义:
ai
∈ BR(a(-i)) iff 对任意ai∈Ai,Ui(ai*,a(-i))>=Ui(ai,a(-i))
Best response 不一定只有一个

<a1,…,an> is called a pure strategy Nash equilibrium iff 任意i,ai ∈ BR(a(-i))

Si Strictlly dominate/Very weakly dominate Si’: 对于其他人的任何行为S-i,U(Si,S-i) >(=) U(Si’,S-i) 如果有一个策略比任何其他策略都好,那么他叫dominant

纳什均衡:每个人都出自己的dominant

帕累托最优pareto optimality:

  • 因为在衡量全局好坏的时候,你不知道每个个体的效用函数是什么样子的,所以这就像你想提高你的回报,但是这回报是以一种你不知道汇率的不同外汇来分给每一个人。
  • 如果一个outcome O at least as good as O’ 并且对于某些agent,他们strictly prefer O。这时我们就可以说O pareto-dominates O’ 如果一个outcome O 不能再被其他 O’pareto-dominates,那么就称他为帕累托最优。

帕累托最优结果可能不唯一:可能有两个outcome谁也不比谁好
每个游戏至少有一个帕累托最优

mixed strategy:

  • idea:confuse the opponent by play randomly
  • 与pure strategy的区别就在于,同样是关于行动的分布,pure是只有一个行动的概率是1,其他都是零,而mixed则是有多个可能性大于0的行动
  • 此时效用函数变成了多个小部分效用函数的加权均值

纳什定律:Every Finite game has a Nash equilibrium. 有限的意思是总情况空间是有限的。有限的玩家*每人有着有限的行动集

mixed strategy equilibrium: 一个稳态,不过此时参与者并不是只选一种,而是按照某种概率选择多种方案。计算的方式是,先定其中一个人的概率,使得另一个人无论选哪种方案,都会得到一样的回报。(因为如果不一样的话,另一个人就没必要random,直接全部投入最优的解即可)解方程出来之后。再对剩下的人依次求解。最后获得一个平衡。

两个寻找纳什均衡的算法:

  1. LCP(Linear Complementarity) formulation(By Lemke-Howson)
  2. Support Enumeration Method

PPAD:Polynomial Parity Arguments on Directed graphs.
复杂度排序:P<PPAD<NP<NP-complete

开始对支撑集做假设的时候,我们假设两个选手的可能取值差不多。而不是一人有两个方案,一个人有十七个方案。

correlated equilibrium

Rationality: A basic premise: Players maximize their payoffs

如何检查纳什均衡:看看两个玩家在当前条件下有没有动力改变自己的决策。纳什均衡=每个人都没有profitable deviation

Iterative Removal:

删去被最好行动压制的其他行动

A strictly dominated(被动) strategy can never be a best play, so we can remove it.

但是删掉一个被dominate之后,剩下的里面会再出来一个新的dominated,所以我们要不断的iterate。

不仅可以被pure strategy打败 被mixed打败也可以。所以在没有单纯的strictly dominant的时候,我们可以用组合策略来删除

dominant solvability:可以被最小迭代变成一个pure

对于strictly dominant来说 删除的order并不重要

但如果是weak的话,可能会在删的过程中也删掉一些纳什均衡,这时候order重要,但至少有一个纳什均衡会被保留下来。

两只猪的游戏:用来论证事实上猪也会博弈论

maxmin strategy: maximize worst-case payoff.

Maxmin value(safety level): the minimum payoff guarenteed by maxmin strategy.

minmax strategy: minimize enemy’s best-case payoff. 在零和游戏中,损人=利己

correlated equilibrium:A randomized assignments of (potential related) action ecommandations to agents, such that nobody wants to deviate.

Extensive-Form

有时,时间也影响着决策。Game Tree:人们轮流采取行动,最后会终结在树的某一个节点上。

Perfect Information

  • 参数:N、A、H、Z、chi、rho、sigma、u
  • N:players。
  • A: Actions(这时每个人能采取的行动是一样的)
  • H:choice nodes: non-terminal
  • chi: Action-function 将H映射到2^A assign actions to each node
  • rho: Player-function: assign player to non-terminal node
  • Z: terminal nodes
  • sigma: sucessor function 将H*A 映射到H并Z
  • u: utility function. 对每一个Z映射一个得分

注意这棵树是单射。不存在多个节点或者一个节点的多个行为指向到同一个结果

在计算pure strategy 个数的时候,就连那些肯定到不了的节点也要算进去。因为博弈论认为到不了的A和到不了的B也是不一样的

定理:Every perfect information game in extensive form has a PSNE(Pure Strategy Nash Equilibrium)

Induced Normal Form

  • 将A与B的pure strategy做一个笛卡尔积。树的很多根节点被重复了多次,在树很大的时候会造成指数的数据上涨,不好
  • 并且我们一般不能把一个Normal Form Game变成一个Extensive Form Game。因为有时候Game就是需要两个人同时发出动作,但是Extensive是有先后顺序的

Subgame perfection

  • 在一个perfect information game 的某个纳什均衡决策中,所有的子决策族都没有profitable deviation。
  • Backward Induction: 在零和游戏中又被称为minimax。在每个节点处以自己孩子点中最大值作为自己的值
  • Ultimate Bargaining:举得例子是10份东西两个人分。A提出一个分法,B同意的话就按照这个方法分,B不同意的话两个人都是0。这种情况下A的最好策略应该是9/1 但事实上很多人选择了5/5。有可能是因为总体太小了。当研究人员把总体调的越来越大的时候,人们倾向于给对方更小的比例,并且对方也倾向于接受更小的比例

Imperfect Information

玩家不知道对手的全部行动

  • equivalence class:将不同的node分成几个类,这样虽然不知道具体是来自哪一个node,但是我们知道它们不来自于哪些nodes
  • 可以将IIEF-NF-IIEF:开始的IIEF可能会很深,但是变成Normal-Form在变回IIEF的时候,IIEF只有两层了。虽然两个IIEF可能长得不同,但是它们的行动空间是一样的。

Imperfect Recall

玩家无法回忆自己曾经选择的node具体是哪一个


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!