有限理性实现程度中时间因素的扩展

来源 :经济研究导刊 | 被引量 : 0次 | 上传用户:konashu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:在已有的有限理性实现程度模型的基础上,通过考虑本次决策前相似决策的经验因素,提出与有效思考时间相对的学习累积时间,将原有模型中的时间因素的内涵进行扩展和一定的具体化。此后用两个进化博弈的例子讨论了特殊情况下不同学习累积速度的博弈方的博弈过程。
  关键词:有限理性;实现程度;时间因素;进化博弈
  中图分类号:F12文献标志码:A文章编号:1673-291X(2010)22-0008-03
  
  引言
  经济学关于选择行为的理性或非理性属性的解释,可以概括为完全理性、有限理性、非理性三大类型。完全理性即是作为传统理性决策理论基石存在的“有序偏好+效用最大化”。非理性则不包含半点自身对信息环境的认知,纯粹依靠人类与生俱来的本能反应。有限理性介于完全理性与非理性之间。总的来说,以完全理性为前提的效用最大化决策显得精致严谨,但却不符合现实。而彻头彻尾的非理性行为相对较为少见,且无太多经济理论意义。正因如此,从赫伯特西蒙创立有限理性学说以来,有限理性的分析运用逐渐成为经济学研究的焦点。虽然如何将抽象的理性程度具体化一直是难点,但学术界普遍认同的是,思考决策的理性程度和效用类似,用序数而非基数来判定其高低更为合适。
  一、有限理性实现程度中时间因素的扩展
  1.问题的提出。这里,我们的基本前提基于何大安教授2004年以决策过程时间为主要影响因素对有限理性实现程度的划分,即潜在有限理性(充分思考理性实现程度的最大值),即时有限理性(瞬时思考理性实现程度的最小值),实际有限理性(现实中一定时间思考所实现的理性程度)。实际有限理性的理性实现程度介于即时有限理性和潜在有限理性之间。
  考虑到思考时间不能仅用自然尺度(年月日等)来衡量,还必须包含行为人在单位时间内对影响决策的不确定因素的思考和分析程度,我们可将该时间看成是一次决策前的外显的有效思考时间。本文尝试在上文的基础上,将行为人该次决策之前由于做过相似决策而累积在人理性思维效率中的学习经验因素考虑进来,与外显的有效思考时间相对,提出内化的学习累积时间,以期能通过扩大决策过程的时间因素的内涵来完善有关有限理性实现程度的理论。
  2.经验作为内化的学习积累时间对时间因素的纵向扩展。如果只考虑一次决策前的有效思考时间,我们很难区分理性程度很低但仍含有一定理性程度的即时有限理性和不包含一丝理性认知的完全非理性。新老司机在遇到紧急情况下往往作出截然相反的决策,虽然两者都是在极短的时间下作出的即时决策,理性程度显然不同。这说明仅依靠有效思考时间还不足以决定行为人的有限理性实现程度。而认识理解即时有限理性中所包含的非理性所没有的理性内容有助于我们找到影响有限理性实现程度的另一个重要因素——内化在行为人理性思维效率中的经验。对比非理性和是有限理性,彻头彻尾的非理性行为可以从未曾接触外界环境的新生儿行为中窥见一斑,如果行为人作出的即时决策在其刚出生时就会作出同样的反应,那么我们认为这样的决策就是非理性的,控制该行为的是人类与生俱来的由大脑脊柱控制的本能反应,不含一丝理性认知。而即时有限理性行为表面上类似于完全非理性的瞬时决策,其实质包含有过往相似决策而自觉学习到的经验。例如,手接触到火会回缩我们认为属于非理性行为,而看到手边起火立刻将手移开则属于即时有限理性行为。因为前者由于疼痛刺激神经反射完成,后者是之前的行为经验内化在瞬时思考之中:被火烧到会痛。
  事实上,行为经验也可以与外在的有效思考时间一起归结到时间因素中去。
  如果将行为人一次决策的完整过程简单看成是思考—决策(行为)—结果
  那么试错学习时间的提出实质是上把一次决策所包含的历史因素囊括进来,即
  ……思考—决策(行为)—结果—思考—决策(行为)—结果
  思考—决策(行为)—结果……
  将结果—思考这一过程从上述行为人决策链中单独提出并进行放大,两者联系的具体环节由试错学习模仿等积累的经验构成,即结果—对比结果与预期—学习模仿—经验积累内化—思考。
  行为经验来自于之前相似决策过程事前事后的思考,而思考时间的长短也直接影响经验的累积。所以,与外在的有效思考时间相对,我们可以把经验称为内化的学习累积时间,该时间取决于之前相似决策的有效思考时间,之前有效思考时间越长,学习累积的时间也就越长。有效思考时间与学习累积时间两者共同构成影响有限理性实现程度的时间因素。即将时间变量t具体化为t-ta+tb,其中,ta代表有效思考时间,tb代表学习累积时间。
  再进一步讨论ta、tb的内在关系,显然学习累积时间是之前所有n次相似决策的有效思考时间的函数和。
  tb=fk ta(k)(1)
  其中,ta(k)表示最近第k次相似决策的有效思考时间,ta=ta(0)。
  二、学习累积因素影响决策理性的博弈例子
  基于在有限理性和我们刚引入的学习进化假设上的共同性,我们可以引入进化博弈来分析某些有关学习累积时间对有限理性实现程度的影响。
  1.政府支持下有限理性企业之间的进入决策博弈
  任意两企业的对称静态博弈的得益矩阵如上,其中A代表进入,B代表不进入。基于政府支持行业具有规模经济及政策优惠的前提,可以假设两企业都进入的收益大于都不进入的收益(Y>y);而若仅有一家进入,则该行业因为没有足够的规模经济而收益为0,选择不进入的企业在其原有行业投资获得报酬P,但P  显然两个纳什均衡(A,A)和(B,B)中前者无论对于政府还是企业都是最好的结果。但在如此大规模的投资下,规避风险的天性使得风险上策均衡(B,B)很大概率上成为最终结果,这相当于政府投资导向政策的失败。现在考虑现实中进入企业的有限理性和学习模仿能力,假设博弈方企业虽然缺乏完全理性分析能力,但是马上能对上一阶段的博弈结果进行总结,即上文所述的学习累积。
  假设 N个待进入企业,位置在一个圆周上均匀分布。这些企业仅仅能知道位置与其相近的相邻两企业的决策,并以此来调整自己的决策。
  不失一般性,我们仅考察一个博弈方i的决策行为。令Xi(t)为在t时期博弈方i的邻居中采取B策略的数量,Xi(t)∈(0,1,2)。则博弈方i选择策略A和B的期望得益如下:
  πA=0+ [2-Xi(t)]Y
  πB= Xi(t)y+[2-Xi(t)]P
  所以,当πA>πB,即•xi(t)<时,i选择进入该行业;当πA<πB,即•xi(t)>时,i选择不进入该行业。
   10若Y-P>y,即1<<2,考虑Xi(t)的整数取值,则只有i的两个邻居都选择不进入,i才会选择不进入。此时,不难看出(1)当所有企业的初始选择都是不进入时,所有企业选择不进入是一种均衡;(2)当仅有一家企业选择进入,且企业个数N为偶数时,所有企业的选择随时间t呈现进入与不进入交替的不稳定状态;(3)类似这样最终导致不稳定状态的情况还有企业个数为偶数时,选择进入的企业两两关于圆心对称。除了上述三种情况以外,在企业根据邻居选择调整自己策略的过程下,每一个初始的企业选择集合最终都会达到所有企业进入的均衡,且这样的均衡是稳定的,也就是说,个别企业偏离其最佳选择的扰动并不改变所有企业选择进入的最终均衡结果。而显然(1)、(2)、(3)三种小概率的例外情况并不稳定。
   20若Y-P  对比1、2两种情况,对于政府希望鼓励企业进入某行业的政策建议如下:(1)要使企业进入该行业达到规模经济后的得益Y足够大;(2)在某些希望其进行升级进入新产业的企业,对其原有的生产经营加以限制,降低其原有得益P或y;(3)政府之前的产业投资导向政策要有连贯性和实效性,不然若干次投资导向政策被证明失败后,对企业会形成不信任政府的第一印象,导致所有企业的初始选择都是不进入政府鼓励行业的极端情况。
  1.即时有限理性下政府宏观调控与小企业投资决策的博弈
  这里我们把注意力集中在即使有限理性条件下的博弈过程。与上例不同的是,这里的小企业数量众多且平均理性程度相对较低,其学习过程不是类似上例的一次性调整,而是表现为向优势策略转变的一个渐进过程。根据政策对象的应变结果,政府(假设为独裁者)也会站在自身利益的角度调整自己的策略。双方博弈的得益矩阵如下:
  其中,t为政府税收;c为政府宏观调控成本;a一方面表示政府由于宏观调控失败而遭受的损失,另一方面表示政府由于宏观调控成功而额外的收益;I为企业投资得益;b为企业在政府抑制的产品市场投资所遭受的额外损失;(a>c,(1-t)I  则政府选择抑制或者不干预的期望得益u1y和u1n分别为:
  u1y=y(tI-c-a)+(1-y)(a-c)
  u1n=ytI
  政府平均得益u1=xu1y+(1-x)u1n=x(a-c)+ytI-2xya
  同理小企业选择投资或者撤出的期望得益u2y和u2n分别为:
  u2y=x[(1-t)I-b]+(1-x)(1-t)I
  u2n=0
  小企业平均得益u2=y{x[(1-t)I-b]+(1-x)(1-t)I}=y(1-t)I
  -yxb
  两个博弈方选择策略比例的复制动态方程为:
  =x(u1y-u1)=x(1-x)(a-c-2ay)
  =y(u2y-u2)=y(1-y)[(1-t)I-bx]
  (1)政府选择策略概率的渐进稳定
  显然,y>时x趋向于0;y<时x趋向于1。
  即初始小企业选择向该产品市场投资的概率大于,则政府选择抑制政策的概率将逐渐趋于0;反过来,初始小企业选择向该产品市场投资的概率小于,则政府选择抑制政策的概率将逐渐趋于1。
  (2)小企业选择策略概率的渐进稳定
  当x>时,与上同理,y趋向于0。当x<时,与上同理,y趋向于1。即初始政府选择对该产品市场投资进行抑制的概率大于,则小企业选择投资的概率趋向于0;反过来,初始政府选择对该产品市场投资进行抑制的概率小于,则小企业选择投资的概率趋向于1。
  (3)博弈均衡的不稳定性
  将政府和小企业选择策略概率的渐进稳定综合来看可以发现整个博弈过程没有均衡状态,也就是说,在理性程度极低的即时有限理性条件下,政府和小企业仅依靠学习经验来逐渐调整自己的选择概率会导致整个社会的不稳定,造成政策朝令夕改人民不信任政府等大量负外部性。
  结束语
  本文虽然将学习累积时间引入到决策过程中的时间因素中,使得这个影响有限理性实现程度最主要的方面更为完整和具体。但就实践运用而言,无论是有限理性实现程度还是其内含的主要影响因素——决策时间都仍然是抽象的,仍无法通过数据计量的手段来具体估算。后续两个博弈的例子也仅从最优反应动态和进化稳定分别讨论特殊情况下低理性博弈方的学习累积过程,无法与(1)式中的变量或函数产生直接关联。不过本文的贡献在于提供了一种融合进化博弈和学习累积经验来具体化有限理性实现程度的思路,这也是笔者以后的研究目标。
  
  参考文献:
  [1]何大安.行为经济人有限理性的实现程度[J].中国社会科学,2004,(4).
  [2]何大安.理性选择向非理性选择转化的行为分析[J].经济研究,2005,(8).
  [3]赫伯特•西蒙.西蒙选集[M].北京:首都经济贸易大学出版社,2002:245-269.
  [4]贝克尔.人类行为经济分析[M].上海:上海三联书店,1996.
  [5]张维迎.博弈论与信息经济学[M].上海:上海人民出版社,2004.
其他文献
本文所探讨的双金属复合结构深孔精镗刀杆,主要由厚壁无缝钢管车制的“竹节”中空杆芯及与杆芯铸造熔合为一体的铸铁外壁两部分构成.主要借助于精镗刀杆内外两层金属材质各自
历史上,东亚地区因其所处的独特地理环境而成为一个相对独立、封闭的区域。对于东亚地区国家关系名词表述较多,有"宗藩""朝贡""职贡"等词汇,但"宗藩体系"一词在其演变过程中,
针对传统落料线上高速喂料辊打滑、定尺不准、辊印等问题,通过TOPOCROM毛化工艺在高速喂料辊上的应用,解决了落料线上亟待解决的问题。结果表明TOPOCROM毛化喂辊优于其他传统
城市轨道线网规划对优化城市社会、经济、生态环境,实现城市生态环境可持续发展有着至关重要的作用。文章通过熵值法与属性识别模型相结合,建立了基于熵权的属性识别模型,用该方
试验用不同浓度的锌溶液模拟污水,浸种后用水培法培养小麦,全面观察研究不同浓度的锌对小麦种子萌发、幼苗生长过程中的形态和生理生化指标的影响以及相同浓度的锌溶液对不同