囚徒困境下的决策选择

来源 :跨世纪·学术版 | 被引量 : 0次 | 上传用户:zt20032053
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  决策从狭义上而言,意为选择、确定策略,是一个动态的过程。在这一过程中,个体需要运用自己的感知觉、记忆、思维等认知能力,对情境作出判断与选择。美国决策研究专家黑斯蒂给决策下了一个概括而全面的定义:判断与决策是人类(及动物或机器)根据自己的愿望(效用、个人价值、目标、结果等)和信念(预期、知识、手段等)选择行动的过程。广义的决策包含判断与决策两个部分。判断主要研究人们推知或知觉尚不清楚事件及其结果或后果的过程。一个好的决策是在确定或不完全确定的条件下有效选择手段以达到目的决策。博弈论中的囚徒困境下的决策选择是一个很有代表性的决策理论,它反映了现代社会下人性的基础以及在理性条件下人与人之间的关系。
  
  一、囚徒困境简介
  
  囚徒困境也称社会两难情境,是博弈论中的一个经典案例,也是目前学界注意力的焦点所在。它是指有两个嫌疑犯被警察抓到,但警方没有掌握确切的证据,聪明的警察就分别找他们谈话:“如果你们都不认罪的话,我们将让你们都入狱一年;如果一个认罪,另一个不认罪的话,那么我们将判不认罪的那个十年的徒刑,认罪的将无罪释放;如果两人都认罪的话,我们将基于你们的诚实把每个人的徒刑降为五年,请你们各自权衡。”
  在这种情形下,两个疑犯都将面临着一个具有决定意义的两难选择,他们需要综合考虑所有的因素,以确定自己的最佳选择。
  
  二、囚徒的传统策略
  
  亚当·斯密(Adam Smith)曾提出了理性经济人的假设:一是经济人是自私自利的,即个体行为的根本目的是追求自身利益;二是经济人的行为是理性,即他们根据处境来判断自身的利益,从而追求个人利益尽可能最大化。在一个标准的囚徒困境中,我们可以用下列这个矩阵来表示:
          罪犯B
          认罪  不认罪
  罪犯A 认罪  (5、5) (0、10)
      不认罪 (10、0) (1、1)
  可以看出两个囚犯如果想得到最大的利益,都面临着同样的选择——无论同伙选择什么,他们最好都选择认罪,因为,如果同伙不认罪,那么他们就无罪释放,否则,他们起码会被判十年徒刑。在一般情况下,假定每个囚徒都是理性的,他们的选择通常会出现以下两种可能情形:以A为例,第一种可能的情形是:B认罪,这时如果A也认罪,那么他们都要入狱5年;如果A不认罪,则A将被判十年,B无罪释放,两相比较下,对于A来说,认罪显然是最优策略;第二种情形是:B不认罪,这时如果A认罪,那么B将被判十年,A将无罪释放,如果A也不认罪,那么他们都将被判一年,这种情形下,A的最优策略也是认罪。由此可见,对双方而言,每一个囚犯从个人利益出发,不考虑他人,他们都将选择认罪。因为认罪都意味着较轻的处罚,即无论对方采取什么策略,认罪较不认罪策略,个人的收益值会更高。我们将这一策略,即无论对方如何选择,对自己最有利的策略称为占优策略。
  在本案中,占优策略都将是认罪,可是一旦双方都认罪(对个人来讲是占优策略),等待他们的将是五年的审判;而如果双方都不认罪(对集体来讲是占优策略),那么等待他们的将是一年的牢狱之苦。也就是说,对个人最有利的认罪策略,却不是集体的最佳策略。换句话说,对于两个都追求个人利益最大化的理性人来说,其结果将是只能获得不是最优而只是次之的策略。这里所揭示的正是囚徒困境中理性人所追求的个人利益最大化的困难所在。
  
  三、囚徒困境的人性基础
  
  囚徒困境中个人的理性选择却是集体的非理性选择,如果从另一个角度——人性的角度来分析,我们就会发现其中包含着人性恶的倾向。
  首先,如果A是善的,那么会出现两种情况,第一种情况是,A坚持不认罪也不供出B,B同样也是坚持不认罪也不供出A,那么两人都将只受到一年的牢狱之苦;第二种情况是,A坚持不认罪,B认罪,那么B将无罪释放,而A要受十年的重刑,对于A来说,反正自己也有罪,坐十年牢也没什么,如果他能这样想的话。
  其次,如果A是恶的,这里也会出现两种情况,第一种情况是A认罪也供出B,而B不认罪,那么A将无罪释放,B将坐十年的牢,第二种情况是A认罪也供出对方,B也认罪且供出对方,那么两人都将受到五年的刑罚,这样大家同时坐牢双方心里也没有什么不平衡的了[2]。
  但这里的不同之处是,A从善的角度来说,得到了两种不同的结果,最好的(1年)和最糟的(10年);而从恶的角度来说,也得到了两种结果,最好的(0年)和最糟的(5年)的中等处罚。但不管怎样,A从恶的角度较之善的角度,所获得的利益都是最大的,那么B也将会出现上述的考虑。所以在种情况下,A、B双方都从自己的利益角度来考虑的话,选择恶的可能性会更大些。由此从囚徒困境中我们可以看到了人性恶的倾向。
  但实际上,肯定地说双方都会选择恶也是不对,因为这中间还有一个双方是否相互熟悉、相互了解的问题,如果双方都比较熟悉,且相互了解,那么他们的选择也许会出现一些偏转。即如果A知道B为人讲义气,出了事绝对不会连累同伙的话,那么A有很大的可能会选择不认罪;如果A知道B不可靠的话,那么A也许为了追求个人利益的最大化则很有可能选择认罪;还有第三种情况那就是A、B之间相互不了解,这种情况下,他们的选择就像赌博,但赌博的风险太大,那么在这种情况下双方都有可能都选择认罪。容易看出,对于每个囚徒而言,无论对方选择什么策略,认罪都是自己的最优策略。
  
  四、囚徒困境中的理性信任观
  
  信任的理性观点最早起源于古典经济学。从理性选择理论出发,信任被个体视为规避风险、减少交易成本而进行的一种理性计算。他们会权衡计算背叛和合作哪一个更有利可图,对于信任双方而言,追求个人利益最大化是终极目标。因此在制定决策时,理性人具有完全一贯的偏好,一旦发现哪种信任决策可以带来偏好的满足,就会毫不犹豫的做出反应。
  囚徒困境的模型尽管是一个假想,但它所提示的困境却并非是想像的幻影。我们不仅会经历一次简单博弈条件下的囚徒困境,在更多的情况下,还要面对的是一种集体条件下的困境——重复的囚徒困境,即博弈的双方并不一定是单独的个人,也可能是两大集团或更多的人。在这种情况下,相同的博弈者可能会不断地重逢,即要不断地重复面对相似的困境。在这种重复性的囚徒困境条件下,“有条件的合作策略”将可能是理性经济人的最优策略。
  重复为博弈产生了新的动力结构。在重复性囚徒困境下,理性博弈者将会考虑,如果自己拒绝合作,不断背叛,为了减少损失对方也将会不断地背叛。通过重复,博弈者就可能按对手以往的选择而决定当前的选择。例如,存在一种所谓的“一触即发”策略,即“只要你背叛,我随后将永远背叛”。当双方保持背叛的状态时,就失去了双方获益的机会,而如果双方合作,那就可能争取到双方获益的结果,但合作的前提是双方的相互信任。此外,还存在另一种所谓的“一报还一报”的策略,即以合作开始,然后模仿对方上一步选择的策略。该策略源于信任,它以信任开始,决不首先背叛,因为时间嵌入性理论表明,今天的行为是合作还是背叛,将影响再次相遇时所受到的信任还是报复。对未来频繁互动的预期决定了建立关系的重要,信任是使关系更持久、更稳固的最优选择。
  
  五、现实中的囚徒困境及其应对策略
  
  囚徒困境在社会上也是广泛存在的,而且情形要复杂得多。生物学家加勒特·哈丁所命名的“共有地悲剧”就是一个很好的例子。一个放牧部落使用公共牧场来放养牲畜,渐渐的,牛的数量达到了土地承载能力的极限。此刻,增加一头牛对放牧人的效用有两个方面——正面和负面的效用。正面效用为增加一头牛所带来的收益,这个收益归增加这头牛的放牧人。负面效用则是增加一头牛所导致的过度放牧,这个成本完全归属于部落所有的放牧人来共同承担,并且对每个放牧人来说,可以忽略不计,结果就产生了一个两难困境——每一个人都从增加一头牛中获益,但是对个人利益的追求导致了一个不尽如人意的结果。
  此外,如汽车尾气与空气清洁的关系,还有多子多福与人口膨胀,上车不排队挤车的问题等,我们时刻都被这种选择困境所困扰。
  要想克服重复条件下的囚徒困境,就要从集体成员的主观条件入手,使成员在新的基础上做出最优决策,打破原有的纳什均衡,建立新的有价值的纳什均衡。(Nash均衡是由经济学家纳什提出,其意为,若有N个人参加博弈,那么在给定他人战略的情况下,在每一个参与人选择的最优战略所形成的战略组合中,没有任何一个参与人有积极性选择其他战略,也没有任何人有积极性打破这种均衡)为此可以采取以下措施:
  1.利用强化的作用。重复条件下的囚徒困境,对决策者的一次决策的正强化或负强化,都可能影响到决策者下一次的选择,当对决策者的一次对个人最优的策略采取负强化时,这个策略在决策者的心目中的权重将会有所降低。而当决策者采用对集体是最优、可以形成最优纳什均衡的策略时,提供正强化,则会大大提高该策略在集体成员心中的权重。
  由此,我们可以制定规则或提供奖惩措施,通过正强化的作用,引导决策者改变自己的原有的决策偏好,向着有利于集体利益的方向发展,打破原有利益的纳什均衡,做出对集体而言的最优策略,重新建立有利于集体所有成员的新的纳什均衡。
  2.创造良好的文化氛围。囚徒困境说到底其实也是一种道德困境。由于决策者只考虑到自己利益的最大化,从而做出只对自己有利的选择。因此要解决这种道德困境,还是要从最根本的入手,改变全体成员的价值观和主观偏好,让成员明白最有利于自己的选择不是绝对的利己主义而是个人理性和集体理性相一致的选择。
  因此,对个人来言,要宽宏大度,真诚友善;对整个社会而言,要提倡容忍,友爱,团结合作。要达到这个标准,就要求全社会能形成一种良好的社会文化氛围,人人都能从全局的利益出发,不计个人得失,能够团结合作,共同努力,共谋发展,打破固存的、陈旧的纳什均衡,使全社会建立起一种新的有利于全体成员的有价值的纳什均衡。正如,我国现在所提倡的和谐社会的建设一样,人人迈出一小步,全社会就会迈出一大步。
其他文献
一、一校多区和高校后勤社会化带来的巨大变革    (一)一校多区和高校后勤社会化的改革浪潮  高校为了适应新世纪我国高等教育发展的需要,突破了单一校区的发展模式,出现了高校合并和一校多区的新现象。2001年是全国高校合并最多的一年,浙江大学、扬州大学、北京大学、武汉大学等都进行了高校合并。建立新校区则在20世纪末就开始了规划和建设,河海大学、南京大学、东南大学等都建立了新校区。无论是高校合并还是建
期刊
会计信用缺失已成为严重危害市场经济秩序的一个“毒瘤”。诚信建设迫在眉睫,加强职业道德教育,健全各项监督处罚力度,会计从业人员要按照“诚信为本、操守为重、坚持准则、不做假账”的要求,做好会计工作,才能重塑会计形象。现笔者就引起会计人员诚信欠缺的原因及对策方面谈一点看法。    一、会计人员诚信缺失的原因    会计人员诚信缺失的原因非常复杂,但归纳起来,主要表现在以下几方面:  1.会计学自身的局限
期刊
通过深入学习十六大报告,特别是其中对“三个代表”重要思想的论述,通过回顾总结新建公司党建成功经验,通过展望公司未来发展远景,联系公司实际,用“三个代表”重要思想指导党的建设,我认为:    一、重点是要解决好世界观和方法论两个问题    (一)学习贯彻“三个代表”重要思想,要树立起符合时代发展要求的世界观  (二)必须树立坚定的发展观,推进公司的大发展,做现代城市发展和先进生产力的促进者  “三个
期刊
随着经济的迅速发展和人际社会关系的复杂化,不少人在物资财富的追逐中失去了方向。会计人员身处财政大权的关键地位,在一些不健康的消极因素的影响下,价值观念不可避免地受到冲击,出现这样那样的问题,表现为会计信息严重失真,假账盛行,不少会计人员贪污舞弊、滥用职权。两千多年前,孔夫子为后世留下了“人而无信,不知其可也”的悟世之道;中华人民共和国第五任总理朱镕基在上海国家会计学院揭幕仪式上,奋笔写下了“不做假
期刊
摘要:在十七大报告中,针对当下社会收入分配存在的问题,胡锦涛同志谈到:“初次分配和再分配都要处理好效率和公平的关系,再分配更加注重公平。”在初次分配中要“处理好效率和公平”的提法,颇为新颖,且针对性强。以往在初次分配中更多的强调“效率”,由此产生了一些公平问题。而在初次分配中同样强调“公平”,则意味着诸多利益关系能得到更为妥善的安排,有利于从源头上实现收入分配体制的合理化。  关键词:社会公平 效
期刊
一、行政不作为理论在司法实践中的定性    行政行为,是整个行政法学的核心内容。从学理上讲,行政行为同时包括了行政作为行为和行政不作为行为。理论界长期以来对行政作为比较重视,比如行政处罚、行政强制、行政许可等皆是研究的重点。对行政不作为的研究却不够充分和细致。许多学者对行政行为进行分类时,多注重行政行为的抽象与具体之分、依职权与依申请之分等,却很少谈起行政行为的作为与不作为之分,更无专门系统的介绍
期刊
概要:全球语言不断交叉和融汇的时代,翻译领域不断发展和扩大,尤其是科技翻译过程中烦琐的工作;在此过程中,依靠人工参与的计算机辅助翻译系统 (Computer Aided Translation, CAT) 开始大行其道,成功得以应用,并在今日的本地化领域及其他翻译领域成为主流的翻译工具。    CAT 的基本概念就是“翻译记忆”(Translation Memory,TM)。TM 的原理很简单,就
期刊
金融衍生品结算组织是指金融衍生品交易达成后负责实施清算交收使交易最终得以完成的结算机构。金融衍生品结算组织的设立、业务范围的确定以及内部运作机制的安排等因素是否合理,是决定金融衍生品结算体系能否实现安全、高效、低成本运行目标的重要环节。  金融衍生品的交易有场内和场外之分,前者由衍生品交易所组织,后者则在银行间市场进行。就场内交易的金融衍生品而言,在我国其交易和结算目前都是由期货交易所组织和实施的
期刊
反诉制度作为民事诉讼中一项特有的重要制度,在现代各主要国家的民事诉讼法中都有所体现。但是反诉制度在我国的现行民事诉讼法中仅有原则性规定,并无太多涉及。理论上对反诉制度也众说纷纭,在司法实践中问题更是层出不穷。这就使得有必要对反诉制度进行反思、探究,以期对反诉制度的完善有所裨益。    一、反诉制度的历史概况    反诉制度始于古罗马法,由罗马法中的民事诉讼抵销抗辩制度发展而来。但罗马法在设立的初期
期刊
创新是发展的动力,创新是科学发展的重要内容。创新必须坚持实事求是,从实际出发,因地制宜,因时制宜。工会工作创新的出发点不是为了创新而创新,而是为了发展而创新;不是为了形式的新颖而创新,而是为了取得实效而创新。工会工作创新要将着眼点和工作重心放在建立长效机制上,要将临时性的创新工作在总结经验的基础上转变为日常性的专项工作,最终实现工作领域的拓宽和工作内容的丰富。  随着全国交通形势的飞速发展,工会的
期刊