友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!
富士康小说网 返回本书目录 加入书签 我的书架 我的书签 TXT全本下载 『收藏到我的浏览器』

博弈生存-第7部分

快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部! 如果本书没有阅读完,想下次继续接着阅读,可使用上方 "收藏到我的浏览器" 功能 和 "加入书签" 功能!



发菜是宁夏“四宝”之一的“黑”宝,宁夏的农民为了多赚钱,大规模地采集发菜,以销往南方,以至于当地政府不得不明令禁止这种行为,并将发菜从宁夏“四宝”中去除。而在甘肃挖甘草已成致富之路,据估计每挖10公斤甘草要破坏5。3公顷~7。3公顷的草地。

这与哈定的公共资源悲剧何其相同,其原因就在于环境资源是大家的。

发展经济与对自然的破坏
现在各国都在发展经济,GNP(国民生产总值)或人均GNP是一国富裕程度的指标,或者说是国力强弱的指标,各个国家都在制订促使GNP增长的政策。然而,GNP的增长完全建立在对自然的破坏之上,可以这么说,GNP是对自然破坏的指标。

当然,有很多人不同意我这里的观点。为什么美国那么富裕,而对自然破坏得较少?美国的环境是保护得最好的。其实,这有三个原因:第一,美国的生产或消耗的原料有很大一  
部分来自于别国,如石油来自中东,美国GNP的增长建立在他国对自然的破坏之上;第二,美国的产品许多是高科技产品,高科技产品对自然的破坏较轻,但它会加大人类的破坏力量;第三,像美国生产的高科技产品往往难以被自然消解,自然对加工粗糙的产品的消解是容易的,而对用高科技制造出来的精巧的物品消解起来是缓慢的,但这种对自然的破坏不是那样直观,因此常被我们忽略。

可以这么认为,人类社会的发展对个人来说是没有选择的自由的。当周边国家进入工业社会,发展机器工业,可以在较短的时间生产出比农业社会更多的物资,并且可以生产出以前没有的东西,试想一想,有哪个国家看到这种情形还会无动于衷?并且重要的是,没有选择发展工业的国家面对周边国家的强盛,它的安全受到威胁,它除了被动地选择进入工业社会,别无其他选择。18世纪工业革命首先发生在英国,西方国家相继进入工业社会。而远东的中国,在距离上离发生工业革命的西欧较远,直到19世纪中叶才感受到工业革命的冲击——在列强枪炮的攻击下被动地接受工业化。20世纪的中国其实是被动地接受现代化的。在社会发展史上人们在很大程度上是没有多少选择余地的,这一点正如马克思所认为的,生产力是最具革命性的力量,它促进生产关系的发展。

我们这里要说的不是历史的发展规律问题,而是要表明:当前世界各国竞相发展经济、对自然进行破坏,是一个集体行动的悲剧。有读者可能无法理解:发展经济是好事,为什么能和哈定悲剧联系在一起?

发展经济对人类确实是好事,人类总不能生活得与动物世界一样。但问题是,当今经济的发展已经进入过渡时期,经济的发展造成了环境的破坏。

市场经济是竞争经济,在这样一个优胜劣汰的格局下,拼命地向自然索取或者说掠夺是现时代的特征。每个竞争者——可以小到个人,大到国家——都这样想:我不发展就有可能被淘汰出局。而经济的发展就是对自然的利用——无论这种利用是对自然中原始物的加工还是对中间产品的再加工,其结果都是自然被加速地破坏。这就是自然的生态状况愈来愈恶化的原因,其结果是人类的生存环境越来越恶劣。这也是囚徒困境。

许多人清楚人类目前的这种状况,但谁也没有良药,因为“破坏—发展”是占优策略,每个参与者采取“破坏—发展”成为集体行动的纳什均衡。这就是悲剧:大家都意识到问题所在,但大家都无能为力。

光天化日之下的违法
行为为什么总能成功?人类有许多关于猴子的故事,比如朝三暮四,杀鸡给猴看。其实猴子是没有思维的,它们有一定的群体意识,但没有社会意识,人们关于它们的故事其实是说人自己的。我们这里也讲一个猴子的故事。

在一个笼子里关了一群猴子,主人每过一天就打开笼子抓一只猴子去杀掉。每天主人来时,每个猴子都紧张,它们不敢有任何举动,怕引起主人的注意而被主人选中。当主人把目  
光落在其中一只猴子身上时,其余的猴子就希望主人赶快决定。当主人最终作出决定时,没有被选中的猴子非常高兴。那个被选中的猴子拼命反抗,其余猴子在一旁幸灾乐祸地观看,这只猴子被杀掉了。这样的过程日复一日地进行着,最终猴子全部被宰杀掉了。

如果这群猴子群起而攻之,有可能会逃掉。但每只猴子不知道其余的猴子是否会和它一起反抗,它怕自己的反抗会引起主人的注意而被主人选中宰杀掉。

在现实社会中,窃贼在公共场所比如公共汽车上偷东西时,车上的乘客看到了,但不敢吭声。没有被偷的人想,反正被偷的待宰猴群的结局人不是我,我反抗了,我得不到任何好处,反而遭到伤害;而不反抗虽不得益,但也不受损,我何必要反抗呢?这就是光天化日之下的偷窃行为为什么总能成功的原因。

窃贼在偷东西时发出这样的信号:如果谁反抗,将殴打谁。乘客想,窃贼的威胁是可信的:因为如果个别乘客反抗,而窃贼不殴打该乘客的话,就会有更多的乘客抓窃贼,窃贼将有可能被抓,因此窃贼必然欧打反抗的乘客。 乘客的策略及可能的支付为:反抗,有可能被殴打甚至受伤;不反抗,无所得也无所失。这一博弈过程为:

对于乘客来说,窃贼的威胁是可信的,因而乘客的最优策略是“不反抗”;而对于窃贼来说,乘客“不反抗”下的“不殴打”策略为最忧。

这一博弈的结果是,窃贼偷东西时“乘客不反抗,窃贼不敢打”,这是一“子精炼纳什均衡”。

这样一种群体不反抗的结果将使社会风气恶化,偷窃之风盛行。对个体来说,虽然这一次被偷的不是你,但下次你被偷的几率增加了。这使得我们都如同待宰的猴子,我们不知道什么时候轮到我们自己。这样,我们每个人的处境比以前更差。

如何从这种困境中摆脱出来?

我们看到,使乘客采取“反抗”策略,而非“不反抗”策略在于加大采取“反抗”策略的获益,而减少不反抗的获益。当“反抗”策略下的获益大于“不反抗”策略下的获益时,乘客就会采取“反抗”的策略。

加大道德宣传,培养人的道德感可以解决这个囚徒困境。增强人的道德观念就是加大“反抗”策略的获益,即:当反抗时,尽管有受伤的可能,但是道德荣誉感或道德满足感将使得乘客的心理有所补偿;而在窃贼行窃时,乘客如果不反抗,他的道德感将使得他为他的行为感到羞耻。上述博弈过程为这样,当小偷偷东西时,尽管乘客认为窃贼的威胁是可信的,但是如果乘客是道德感强的人,那么博弈结果是“乘客反抗,小偷殴打”,从而小偷有可能被抓住,这也是一“子精炼纳什均衡”。从全社会的角度来说,如果每个公民都有这样高的道德感,小偷成为过街老鼠,社会将从偷窃之风盛行的困境中解脱出来。并且小偷如果偷窃的话,他知道将会受到道德感强的公民的反抗,即支付函数成为公共知识,他偷窃的收益将很低,他很难再从事偷窃活动了。这使我们看到,此处道德是消除集体行动悲剧的一个良方。

这里,道德的人并不是不理性的,理性的人是计算的人,是对得与失作出充分计算后行动的人。这也是道德存在的科学解释,对此将在下一章作出分析。

博弈论对不合作的博弈结果的预测是令人悲哀的。但是,从这个例子我们看到,道德就是由群体实施的对所谓“非道德”的行为进行非强制性的惩罚机制,而法律及实施法律的国家的形成与改进就是建立一个对所谓“违法行为”实施的中心惩罚机制。这正是下一章要讨论的内容。

囚徒困境的消解与文明
文明和文化是什么,一直是思想家思考的问题。我们无法给文明和文化下一个明确的定义,但我们可以认为,文明及文化均是人类独有的现象。当然我们也在寻找地球外的文明,但是否有天外文明仍然是个谜。

20世纪80年代弗洛伊德的精神分析理论开始在中国流行,他对人类文明的独特见解曾迷倒许多莘莘学子。

 
他认为,文明是对人的本能的压抑,人的历史就是人的本能被压抑的历史。在他看来,人有“生的本能”和“死的本能”,前者称“性本能”或“爱的本能”,后者称“死亡本能”或“破坏本能”。本能的目的是满足,但是如果本能得到完全的满足,则没有了文明。人所追求的目标是各种需要的满足,而文明则是要人彻底抛弃这个目标的。因此在他看来,文明就是对本能的压抑与利用。

而在社会学大师韦伯看来,文明是对人的贪欲的压抑,社会的各种组织理性化就是为了压制和利用人的贪欲。

由此可见,要解释文明就是要解释利己的个体是如何得到约束的。下面将从博弈论的角度提出一个新的文明观:文明其实就是对集体行动悲剧的克服。

在囚徒困境中,每个参与者选择的占优策略是“招认”即“不合作”,如果对囚徒博弈在参与者之间进行重复博弈呢?试考虑这样一个非合作博弈:甲、乙两人博弈,两人各有两个策略。各策略下的支付矩阵为:

文明是对人的贪欲的压抑

甲乙不合作合作不合作(1,1)(5,0)合作(0,5)(4,4)

但是如果此时,两者的纳什均衡为(不合作,不合作)。

在第二阶段假设支付情况是这样的:当在第一阶段采取的是“合作”策略时,将有额外的收益3;如果采取“不合作”策略,则没有任何额外收益。即:在第二阶段额外的支付矩阵为:

甲乙不合作合作不合作(0,0)(0,3)合作(3,0)(3,3)

假设在第一阶段博弈双方知道这个两阶段博弈在各种策略下的结果,于是这个博弈可由上述两个矩阵相加得出:

甲乙不合作合作不合作(1,1)(5,3)合作(3,5)(7,7)

这两个阶段博弈其实是一阶段博弈。在这个博弈中(合作,合作)是纳什均衡,而这个结果就解开了囚徒困境。

这个例子的社会意义是什么?这里关键是对上面第二阶段的支付矩阵的解释。

一种解释是:如果第一阶段双方只要有人采取不合作的策略,那么以后双方便不能合作,以后的收益为0。这相当于在生意场上如果一方欺骗了一方,那么以后双方便不能合作。如果第一阶段采取了合作,那么双方在第二阶段没有理由不采取合作,这就等于说,第二阶段是第一阶段的自然结果。

其实,第二阶段的支付矩阵是赏罚矩阵,是对参与者第一阶段采取某种行动的“赏罚”。即:如果第一阶段双方采取了“合作”,那么将对双方奖励3;如果第一阶段有一方采取不合作,则收益变为0。

在这个例子中,奖惩矩阵是在参与者之间建立起来的。而一般来说,存在两种情况:一是参与者在博弈过程中自动建立起来的,这就是演进博弈研究的内容;第二种情况是非博弈第三方强加于参与者之上的赏罚矩阵,从而调节博弈结果。

摆脱囚徒困境的这个方法或者说模型对于社会有什么解释力呢?我们说,文明就是这个赏罚机制的建立,而道德与国家的目的就是建立这样的机制。

一个关于猴子的故事
这里再讲一个关于猴子的故事:

有一群猴子被关在笼子里,在笼子里的上方有一条绳子,绳子拴着一个香蕉,绳子连着一个机关,机关又与一个水源相连。猴子们发现了香蕉,有猴子跳上去够这个香蕉,当猴子够到时,与香蕉相连的绳子带动了机关,于是一盆水倒了下来,尽管够到香蕉的猴子吃到了香蕉,但其他猴子被淋湿了,这个过程重复着,猴子们发现,尽管有猴子吃到香蕉,但吃到  
香蕉的猴子是少数,而其余的大多数猴子都被淋湿。经过一段时间,有一伙猴子自觉地行动起来,当有猴子去抓香蕉时,它们便揍那个猴子。每当有猴子去取香蕉,就有其他的猴子因愤怒而自动地去撕咬那个猴子,久而久之,猴子们产生了合作,再也没有猴子敢去取香蕉了。

在这个故事里,猴子间产生了“道德”。如果这群猴子构成一个社会,它们也繁衍下一代,它们会将它们的经历告诉下一代,渐渐地猴子们便认为取香蕉的后果对其他猴子不利,从而认为去取这个香蕉是“不道德的”,它们也会自动地惩罚“不道德的”猴子。

当然这只是一个故事,这个故事反映了人类的道德的产生过程。

人天生是自私的,他努力使自己的利益最大。当然这不是对现实的人的看法,而是一个抽象的假定。但现实中的人为什么有道德呢?从自私的假定中怎么推出道德的人?

上述猴子的“道德”产生的故事可以用来解释博弈论专家对道德的阐述。

人类原初的状态就是囚徒困境
人类的天性是驱利避害的,从动物状态走出来时人是自私的。自私的人在交往中每个人为了自己的利益而产生的结果正是一种囚徒困境。

英国哲学家霍布斯假设了人类的原初状态,用他的话说,自然状态中人与人之间像狼与狼一样,是“每个人对每个人的战争”。在这种状态中,每个人都力图保护自己的利益,并企图占有别人的东西,此时,每个人是每个人的敌人。此时没有任何规则,没有财产,没有  
正义或不正义,只有战争。武力与欺诈是战争中的两大基本德性。

在自然状态下,霍布斯说,是没有工业、知识、艺术、社会的一点余地的。

霍布斯对自然状态的假定,目的是要引申出他的政治主张。他认为,在这种状态下人的生活是悲惨的。为了摆脱这种状态,人们便汇聚起来,建立契约,同意确立一个权力者或权力团体,这就是利维坦,这个拥有巨大权力的利维坦对人们使用权力,以结束每个人对每个人之间的混战。这就是霍布斯的社会契约论的思想。

在“霍布斯模型”中,国家以法律条文规定对某种行为如“战争”采取惩罚措施,但是如果惩罚措施不力,即使扣除惩罚的成本,行动者从“战争”行动中获取的好处大于他采取“和平”策略所带来的好处,那么国家的法律措施是无效率的或者说是低效率的。因此国家法律的制定应以抑制对他人的危害行动为原则。这就是法律制定的第一条原则:效率原则。

效率原则是从对社会的整体考虑分析得出的,从这个意义上讲,法律越严格越好,越严格越有效率。但是,严格的法律对犯法者公平吗?这就涉及法律制定的第二条原则。

第二条原则是,法律对犯法者的惩罚应以与犯法者给社会或他人造成的危害相等为原则,这就是公平原则。从这个意义上讲,法律惩罚太重,对犯法者不公平;而太轻,对社会或他人不公平。

效率原则与公平原则是很难统一的,法律的制定既要考虑效率原则,又要考虑公平原则,但往往两者难以兼顾。在不同的国家以及在同一个国家的不同时期,对这两个原则的侧重点是不同的。

更为基本的道德调节
与国家一样,道德也是对某些不合作行动的惩罚机制。这种机制的出现(当然还有国家)使得人类从囚徒困境中走出来。

道德调节的第一个特点是,道德是先于国家产生的。根据历史记载,国家的出现在人类历史上是很晚的事情,而在国家出现以前,人类已经经过很长一段历史。

 
在国家出现以前,以某种权力组织来调节群体是可能的,如部落的存在。然而更为基本的是道德的调节作用。道德先于国家而存在,在上面的例子中,非洲的努埃尔人没有国家,但也调节得很好,这便是道德的作用。

人的正义和非正义的概念与财产权的概念分不开,没有明确的财产权的地方是不可能有正义的,因而在人类的早期,正义的观念与财产权的观念几乎是同时产生的。

人的正义与非正义的观念产生了道德感,无论是霍布斯还是休谟都这么认为。道德的产生先于国家,而它们的作用都是区分或调节正义与非正义的行为的。

英国著名哲学家休谟在《人性论》中认为,人存在着先天的不足。狮子勇猛、敏捷,羊、牛虽不具备这些条件,但它们食量也不大,而人身体软弱但需求很大,为了弥补这个不足,只有依赖于社会。在社会中人有了力量、能力和安全。但是社会是如何合作的?休谟叙述了从两性的吸引到亲情关系,再到道德感的产生。道德感自然地使得人们对不道德的或不正义的行为谴责或者对不道德的人不采取合作,从而使得不道德的人遭受损失。这样,社会上不道德的行为就会受到抑制。

因此只要社会形成了道德或不道德,或者正义或非正义的观念,就自动地产生了调节作用。我们说,这种调节机制是非中心化的,即它不是通过某个建立起来的中心化的组织来实施的。

道德调节无须成本,这是道德调节的第二个特点。道德感是存在于每个人心中的,它无须成本维持。对不道德行为的谴责也是不花成本的。

道德调节的第三个特点是,道德的调节存在着局限。它对不道德的行为的抑制是有限度的,当不道德的行为带来的利益大于道德的满足时,道德的作用便失效。捡到别人掉的东西还给失主是道德行为,一方面捡到者有道德满足感,另一方面会受到社会的表扬;如果不送回失主并被发现的话,则会受到谴责。但是如果捡到的是一大笔钱,捡到者对是否还回给失主将有所疑虑,因为他道德的满足感或可能承受的谴责小于他捡到这笔钱的获利。另外一个例子是,自古有杀人者死,伤人者刑,然而这与法律的实施相联系,在没有国家、没有组织的原始社会,我们假定这时是单个人的社会,如果有力量的人杀了人,有谁对其惩罚呢?人们可以谴责这种行为,认为它是不道德的,但没有力量对之惩罚。因此从社会发展的角度来看,社会发展到一定程度,便需要强有力的政府产生,以弥补道德调节的不足。

哪种策略更能赢?
假定我们的社会已经形成约束行动者的道德规范。如果对不道德的行为不能产生即时的惩罚,不道德的行为在社会中往往能给行为者带来好处。这表现在一次性的非合作的博弈中,行为者理性地选取对自己有利的行动。但是,如果存在重复博弈,参与者之间对不合作行为就会形成惩罚机制。

对囚徒困境进行无限次的重复博弈,什么样的策略会赢?

 
甲乙不合作合作不合作(1,1)(4,0)合作(0,4)(2,2)

假定第一步双方均采取合作的策略,第二步有人采取不合作策略,而对方采取合作策略,采取不合作策略的人将有支付4,采取合作策略的人将有支付0。采取合作策略的人感觉自己不合算,他在第三步也会采取不合作策略。此时双方有可能进入均采取不合作策略的重复性的囚徒困境。因此,在第二步,采取不合作策略的人会考虑这样的结果。

这里涉及参与者以什么样的态度对待对方的不合作策略。在博弈论里,有两个著名的策略。

如果一方采取不合作的策略另一方随即也采取不合作策略并且永远采取不合作策略,在博弈论里面称之为触发策略,或称冷酷策略,英文叫trigger strategy。

如果对方知道你的策略是触发策略,那么对方将不敢采取不合作策略,因为一旦他采取了不合作策略,双方便永远进入不合作的困境。因此,只要有人采取触发策略,那么双方均愿意采取合作策略。但是这个策略面临着这样一个问题:如果双方存在误解,或者由于一方发生选择性的错误,这个错误是无意的,那么结果将是双方均采取不合作的策略。也就是说,这种策略不给对方一个改正错误或解释错误的机会。

第二种策略是,若你采取不合作策略,我也采取不合作策略,但是如果你采取了合作策略,我也采取合作策略。这叫“一报还一报”策略,或者称之为“针锋相对”,英文叫titfortat。美国密执安大学的罗伯特·埃克斯罗德(Robert Axerold)主持了一次计算机比赛,看谁写出来的程序能够赢。参加者有政治学家、数学家、经济学家、社会学家,他们都详细研究过囚徒困境。获胜者是加拿大多伦多大学的拉波波特写出的titfortat策略。这个程序非常简单:第一步采取合作,接着对方采取什么策略,他便跟着做什么。

当然有多种策略,如对方采取了不合作,但自己永远采取合作策略,这个策略可以叫做“以德报怨”策略。这个策略对行动者最为不利,因为对方知道你采取这种策略,他会永远采取不合作的策略,因而理性的人是不会采取这种“以德报怨”策略的。然而,极端道德的人是超越理性的限制的,此时他会采取“以德报怨”策略。佛说:“我不入地狱,谁入地狱?”基督说:“爱你的敌人。”他们爱一切人而不会计算他爱的行动会给他带来利益或灾难,而是希望他的行动感化众生。

如果是有限次的囚徒困境,那么情况就不同于上述无限次的囚徒困境的重复博弈。当临近博弈的终点时,采取不合作
返回目录 上一页 下一页 回到顶部 0 0
快捷操作: 按键盘上方向键 ← 或 → 可快速上下翻页 按键盘上的 Enter 键可回到本书目录页 按键盘上方向键 ↑ 可回到本页顶部!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!