囚徒困境与学习型组织

作者:苏辉 | 原创 | 2007-03-10 20:03 | 投票

从上述内容可看出,在这种非合作的情况下,管理者和员工最好的结果就是纳什均衡,而且是帕累托次优的。这说明这种非合作的学习型组织并没有达到最初的愿景。当然,在此模型中还存在另一种情况,即(“不坦白”,“不坦白”),而且在直观上看这一结果明显是最好的,但这是一种在合作的条件下的。确实,这一结果是最好的,它可说是一种帕累托最优的。然而在此模型的条件限制下这一结果不能达到的。在这里,这种学习型组织好像表现出来的双方并不是在进行一种能提高效益的学习,反而只是试图去提高个人的效益,不是去学习怎样合作,而是在进行一种非合作。也即是说,如果在该学习型组织下管理者与员工不是基于一个共同愿景的话,尽管双方都是在不断地学习,或许可以提高自身的某些能力,但是这种学习活这些自我提升的能力却并没有转化为对整个企业来说是有益的东西,它反而只会消耗企业在双方所谓的学习上投入的成本,只会增加企业的负担。

 

二.无限次重复的囚徒困境

由于上述的“囚徒困境”模型是属于一种非合作博弈,且是一阶段博弈的,即只进行一次博弈就结束了,故管理者和员工就会采取上述的不合作的即不能达成一致愿景的策略。     

但很明显,在现实中进行的博弈并不是严格一次性的,也就是说,各个行为主体之问进行的是重复博弈活动。同样在一个企业中,管理者与员工不可能就只相互接触一次就再也不接触了。也就是说,管理者与员工不是单纯的一次博弈,而是可重复的无限次博弈,是有无限次相互接触机会的,故可以运用无限次重复的囚徒困境来进一步解释其实质。由于这样的重复博弈活动又具有特定的动态特征,即每个博弈参与人都可以观察到其他参与人过去的行动策略决策并利用这些与博弈历史有关的信息进行现期决策,囚而使得重复动态博弈模刑对现实生活中的真实博弈行为具有更强的解释能力。其实从重复动态博弈理论的不断深化研究中,更深刻揭示了无限重复动态博弈与静态或有限次博弈的根本区别。考虑无限重复博弈纳什均衡情况的无名氏定理表明,在无限次的重复动态博弈过程中,如果博弈参与人有足够的耐心,他可能会在重复进行的博弈过程中为着长远利益的获得而牺牲短期利益,从而选择能够实现帕累托改进的其他可行策略。正因此,管理者与员工会抛弃前述非合作的“囚徒困境”中出于个人的利益而选择了(不一致,不一致)的策略,转而选择上述模型中的(一致,一致)的策略,因为后一个策略能给双方带来更大的利益。

 [1] [2] [3] [4] 
个人简介
Baidu 广告
Google 广告