您的当前位置:首页演化分析框架下企业学习模型的比较与构建

演化分析框架下企业学习模型的比较与构建

2020-04-13 来源:爱问旅游网
维普资讯 http://www.cqvip.com

上海理工大学学报 第28卷第2期 J.University of Shanghai for Science and Technology Vo1.28 No.2 2006 文章编号:1007—6735(2006)02—0184—05 演化分析框架下企业学习模型的比较与构建 陆 瑾 (上海理工大学商学院,上海200093) 摘要:从演化角度探讨传统主流经济模型的局限,比较分析基于不同角度的学习模型.在此基础 上,构建一个基于一定“噪声”条件的随机学习模型,旨在说明建立在学习基础上的企业决策行为的 概率演化动态过程.结果表明,演化路径具有复杂系统演化的一般特征,但"3-系统演化能达到稳定 状态时,可以求得一个均衡的决策行为概率分布,这一均衡分布可以作为纳什均衡的随机扩展. 关键词:演化分析框架;学习模型;概率演化;纳什均衡的随机扩展 中图分类号:F 062.2 文献标识码:A Comparison and building of firms learning models under evol utionary analytical framework LU Jin (College ofCommerce,University ofShanghai.forScience and Technology,Shanghai200093。Ckina) Abstract:Based on the comparison of the related learning theories from different angles,the paper em phasizes on the different categories of learning process and compares different learning models,includ ing Bayesian learning models,stochastic learning models,artificial adaptive agent models and models in organization learning theory.On the above basis,the paper models a stochastic learning process of finns,which describes an evolutionary dynamic process of the decision making actions of firms on the probability leve1.Meanwhile,with the system approaching a stable state,an equilibrium decision making probability density can be derived out,which can be taken as a stochastic generalization of Nash equilibrium. Key words:evolutionary analytical framework;learning models;probability evolution;stochastic extension of Nash equili61 ium 当企业与其所处环境之间存在诸如信息不对 建、更新其组织知识和惯例(routine)的过程,这一过 称、缺乏对环境结构的足够了解、以至无法处理随时 程是增强企业面临不确定和竞争环境的适应性,并 可能出现的新情况,或者甚至根本无法界定其所要 取得成功的必要前提.但在以理想化的静态均衡假 达到的目标时,学习就可能出现甚至成为必要.在一 设为前提的主流经济模型,如理性预期模型、经典博 个复杂的经济系统中,企业个体必须具备学习的基 弈均衡模型中,学习如同知识一样,是不被加以考察 本特性.按照文献[1]的观点,学习过程可被描述为 的,因此,这些传统模型有效解释经验现实的能力被 企业围绕它们各自的竞争能力和所处的环境进行构 大大削弱了.针对传统主流经济模型的局限,本文将 收稿日期:2005一O7一O7 作者简介:陆瑾(1975一),女,讲师 维普资讯 http://www.cqvip.com

第2期 陆瑾:演化分析框架下企业学习模型的比较与构建 185 在演化分析的框架下,比较分析不同角度的学习模 型,包括贝叶斯模型、随机学习模型、人工适应主体 学习模型、组织理论中的学习模型等. 1有关学习的模型分析与比较 1.1根据学习过程状态空间的开放与封闭性所构 建的学习模型 由于学习过程本身的复杂性,没有任何一个单 一模型能对学习过程的所有维度进行全面解释.按 照文献[2]的阐述,至少可将学习模型分为两类,即 在封闭概率空间中的搜索学习和在开放空间对新的 对象(如新的产品、新的生产工艺流程等)的搜索学 习.前一类学习过程可概括为在所有可能状态都已 知的条件下(对应的是概率风险),主体进行相应的 搜寻和适应性学习过程.后一类则是在考虑到可能 存在的创新使得相应的状态空间具有开放性后动态 的学习过程.由此,学习过程模型也分别具有“封闭 空间——静态”和“开放空间——动态”的特征.如果 学习过程的可能状态在初始条件下就已知,对应的 就是贝叶斯学习(如经典博弈论下的选择和适应过 程).贝叶斯学习模型要求学习主体具备完全的初始 先验知识,这一假设与某些以个体完全理性为假设 前提的学习过程模型内涵一致.它是一类假设状态 空间固定的演化学习模型.在这一类学习过程的假 设框架下展开的主要学习模型有推断学习模型,它 属于贝叶斯学习范畴,是不同学习个体(如企业等) 依据贝叶斯更新过程对最优决策规则进行识别的过 程.其显著特征是假设不同个体之间拥有共同的知 识,因此具有一个事先给定的状态空间. 推断学习模型中事先给定的状态空间假设受到 了第二类学习模型(如新Schumpeter类模型)的挑 战.他们对前述模型提出的最主要质疑是,虽然个体 被假设为有界理性的,但由于只在封闭的空间中搜 索学习,因此面临的仅仅是对不完全信息的处理和 概率风险,并且没有考虑到新奇性和由于状态空间 开放所带来的复杂性这些演化应有的基本特征.该 类模型认为,在一个有持续创新可能的学习过程中, 会不断涌现出新奇和不确定性,从而使状态空间的 划分变得困难,因此贝叶斯意义上的概率更新学习 就不再适合.开放性、动态性是此类学习过程模型所 具有的特点.因此,对封闭空间的突破是此类模型的 基本特征,他们给行为个体赋予了在已有状态的基 础上探索未知空间的能力. 1.2随机学习模型 这类学习模型可简化为在某些给定的有限可能 行动(策略)集合中的选择过程,演化博弈论(参见文 献E3,4])就属于这一类.选择可发生在个体层次,也 可发生在群体层次.学习主体可以没有认知能力,但 一般被赋予两个基本特征:复制能力,即复制某些行 动策略的能力;变异能力,即某种随机变异的能力. 这两个基本特征是演化博弈框架下的“演化稳定策 略”(ESS)的行为前提.标准的演化博弈选择过程最 早见文献[4]的生物学著作中,后来,由文献[4,5]应 用到经济演化的选择学习分析中.学习过程在此类 模型中体现为有小概率随机变异的群体选择过程. 在这个过程中,某些个体受随机因素的作用,会以一 个小概率改变其策略. 选择学习研究的进一步深入是对选择过程表现 出的演化特征的考察.文献[5]提出了一个经典复制 动力学过程的随机版本:某一行动会依据个体在过 去某一段时间内的收益状况按某种随机过程扩散. 另外,在协调博弈的演化模型中,文献[6]证明了在 系统中引人小的随机变异因子,会使策略演化的结 果不被“锁定”在非帕累托最优的纳什均衡上(如“囚 徒困境”中的“背叛纳什均衡”策略).文献[7]探讨了 “噪声”条件下的纳什均衡问题.加入“噪声”扰动的 探讨,还有诸如文献[8]、文献[9]等的研究.同时,还 有其他加入行动个体“记忆”能力的模型,如根据自 身和交易对手过去结果来调整现期行动,表现出某 种“认知”特征.此时的学习过程可解释成对能就相 应策略作出最佳反应的行动选择过程.在这样的选 择过程中,某种稳定下来的行动类型,就成了主体所 遵循的行为准则.这可在一定程度上解释制度的“内 生性”. 本文第二部分将探讨一个基于特定随机过程假 设的企业学习模型.在该模型中,企业被赋予具有学 习与较高预期收益相对应的行动能力,即被假设为 企业会沿着更高的预期收益方向不断调整行动.而 在计算采取行动的预期收益时,由于主观、心理、能 力等因素的限制,可能会出现判断失误,失误用随机 扰动来表达.对模型均衡状态的考察可作为纳什均 衡的一个随机一般化. 1.3人工适应主体的学习模型 人工适应主体的学习模型(artificial adaptive agent,A )与前述学习过程状态空间开放性模型 维普资讯 http://www.cqvip.com

上海理工大学学报 2006年第28卷 类似,这类模型是对上述模型中关于个体先验的被 赋予已知行动集的假设的放松.个体的学习是对未 知的探索,能发现并修正行动.个体被赋予了某种程 度上的认知能力,并加入了一定心理因素的作用,是 人工智能在经济领域中的应用.学习的演化动态过 程都是开放的,这种开放性使学习过程不仅仅局限 于选择机制的作用,而是加入更多的新奇、创新、新 的行为方式等变异机制,使得学习的演化轨迹不再 仅仅局限于达到均衡点或极限均衡状态.其次,由于 加人了个体的认知、心理因素的作用,个体体现出诸 如个体行为类型、个体预期、学习曲线等方面的异质 性和交互作用的复杂性,学习过程中达到的均衡往 往是不稳定的,细小的扰动即可以非线性的“自增 强”机制破坏均衡.因此,AAA学习模型是对经典演 化博弈学习等模型的拓展,它使得演化建模处于可 能呈现多样性的开放空间,而不是一个给定状态可 能性的概率空间.考察的重点也就转向了探讨在这 些多样化、新奇和创新作用下可能涌现出的集总层 次上的规律性和稳定性,或其他复杂系统所表现出 的混沌、分形等特性. 1.4组织理论中的学习模型 组织学习模型用来抽象地描述组织学习的过 程,是组织学习理论的一部分.与上述演化学习模型 关注形式化建模的风格不同的是,这类组织学习模 型更多是描述性的.最早也是最具有代表性的组织 学习模型是Argyris和Schon于1978年提出的四阶 段模型.它由发现(discovery)、发明(invention)、执行 (production)和推广(generalization)4个阶段构成, 并且是一个线性、静态、无反馈式的学习过程模型. : 』 l};} j {Lilll ulI};}i |!文献[10]在此基础上对模型进行了改进,在改进后 的模型中体现了学习的反馈性和学习的累积特征. 首先,加入了反馈过程,使原先的开环学习过程变为 闭环学习过程.其次,通过“知识流”的作用体现了学 习的累积特性. 2一个随机学习模型的构建——纳什 均衡的随机一般化 通过一个具有随机扰动项的动态学习模型的构 建,对经典确定性纳什均衡解的结果进行初步拓展. 模型与其他学习模型的区别在于可描述学习决策行 为的复杂性和动态性,以及经典纳什均衡结果不能 有效解释的经验事实 在符合一定的个体“有界理 性”和具备学习、适应等特征的假设条件下,本校型 描述了一个决策行为的概率演化动态过程.演化路 径具有复杂系统演化的一般特征,但是当系统演化 能达到稳定状态时,可以得出一个均衡的决策行为 概率分布,这~均衡分布可以作为纳什均衡的随机 扩展. 模型假设:企业进行连续型决策,新决策会随着 预期是否能带来更高的收益而进行调整(这与演化 博弈论中“具有较高收益的策略能被更多模仿与采 用”逻辑一致).也就是说,决策过程具有学习性、动 态性和一定的认知能力,这可表示为一个带有漂移 的随机微分方程.企业假设按一定的漂移率(drift rate)采取新的决策,决策同时受随机因素(变异)的 影响,在模型中表示为一定的扩散率(diffusion rate),并假设变异的产生是由于企业以一定的概率 发生决策失误造成的.上述这些假设符合企业决策 的经验事实.在任一时刻t,系统的状态由行动决策 在£时刻的概率分布来表征.这样,如果存在稳定的 决策状态,决策演化的最后结果不再是确定性的,而 可能是一个具有稳定状态的概率分布. 假设存在”个企业,在连续的时间里进行连续 决策.在时刻 ,企业i选择行动a ( )∈[a,卢], 1,2,…,”.由于受随机项的影响,企业行动以概率 分布的形式来表示.设F1(“,t)为概率分布函数,即 企业i在£时刻选择行动值小于等于n的概率,则 其密度函数为 (口, ):Fi(盘,t) . 设"一1维变量岛 一(t)为其他"一1个企业所 选择的行动, 一(a ,£)为其他企业选择行动的概 率分布.决策具有学习性和交互性,因此假设企业i 在f时刻的预期收益E( )由其在t时刻采取的行 动a (£),以及其他企业行动的概率分布F 一(&卜, }”llll}lf}|¨_ ; I:t)共同决定,即 }一}{、{ E[( (a (t)),t)]= l(仍(a (t))r ,& 一(t))dFi一(盘 t)(1) J 同时,企业被赋予具有学习与较高预期收益相 对应的行动能力,在模型中可假设为企业会沿着更 高的预期收益方向不断地调整行动.而在计算采取 行动的预期收益时,由于主观、心理、能力等因素的 限制,企业行动策略可能会出现判断失误,失误用随 棚 扰动来表达.将这样两个过程形式化为随机微分 方程 d& (t):E[( (盘 ( )),t)] d + 毫dw,(t) i=1,2,… (2) 武(2)右边第一项为确定项(漂移项,漂移率为 {i; 维普资讯 http://www.cqvip.com

第2期 陆瑾:演化分析框架下企业学习模型的比较与构建 187 边际期望收益值E[(仍(n (t)),t)] ,边际期望收 益越大,企业调整行动的意愿越强,行动调整速度越 快).第二项为随机项(扩散项),表示可能的决策失 误所引起的随机扰动,扩散率为毛.训 (t)为独立同 分布的标准Wiener过程,训 (t)服从正态分布N (0,v厂 ). 的选取具有任意性,为使表达清晰,去 掉上式中的下标i,因此 da(t):E ( (a(t)),t)] d£+ d训(t) 考察&时间间隔,上式改写为 (t)=a(t+&)一n(t)= E[( (a(t)),t)] £+ (t)+0( £) 0( )为&的高阶无穷小+ 引入任意函数g(n),考察该函数在&时间间 隔后的期望值 E[g(口(£+&))]:f (口),(口,£+&)d口: E[g( (t)+a(t))]≈ g(a(t)+ E[( (“(t)),t)] &+ (t))] (3) 设z= (t)的密度函数为 ( ),由 E(z);0,E(z0)= & 可得 E[g(a(t+&))]= E[( If(a,t)'7(z)dnd =j.:三 {g(口)+ g (Ⅱ)[E[( (n),t)] &+ ]+ s g (n)[E[( (n),£)] +z] + o( )}f(“,£) ( )d“dz: f ( ) (“,£)d + &Ir口  g (n)E[( (口),£)] ’(n,£)da+ 8£等f (口) (a,t)dn+。(&)≈ f ( ),(n,£)dn一 &f (n){E[( (口),£)] (n,t)l d口+ &譬j.: ( )厂(丑, )d口 (4) 由式(3)和式(4)得 j. (口),(口, +&)d口一j. (口) (日, )d“: 一& (圳E[( )] d口+ 譬j.:g(n) (日, )dn= & (口){一{E[( ) 十 .厂( : ± 2二 ! 一 ! ! 2 & 一 a£ 一{E[( ( ),t)] ’(n,t)} + 厂(n,t) 左右两边积分得 兰 :一E[( (口), )] (a,t)+等厂(口,£) 重新引入下标,可得任意企业i满足以下非线 性偏微分方程 :~E E( (“),£)] ( )+ 詈 (口,t) i:1,2,…,卵 (5) 式(5)表示任意企业i的决策概率分布随时间t 变化而具有非线性特征的系统演化过程.演化过程 按不同的设置可表现为不同的复杂性.考察该方程, 可得出较为直观的结论是,首先,一E[( (a),t)] (n,t)项表明:a.企业决策向着具有更高预期收 益的方向移动,并且,更大的预期边际收益导致更快 的移动速率,当与行动a对应的收益增加时,采取 与更低收益对应的行动概率降低,因而会降低 (a,t)的值;b.决策调整速度与企业在t时刻采取 行动a的概率密度成正比.其次,( 2 /2) (a,t)项 表示“学习噪声”的影响. 当£=0时,在E[( (“),t)] (“,t)=0的 条件下,a (a,t)/a£=0,这是决策概率分布函数 的稳定状态,而E[( ( ),t)] ( ,t)=O正是纳 什均衡的必要条件. 当e—o。时,式(5)可近似表达为,a (丑,t)/at =(g/2) (Ⅱ,t)=(舅/2) (n,t)/ ̄a ,i=1,2, …, ,系统演化的稳定状态条件为 (n,t)=0. 现在对决策概率分布函数的演化稳定状态作进 一步分析. 由a (“,t)/'dt 0,据式(5),可得 维普资讯 http://www.cqvip.com

188 上海理工大学学报 2006年第28卷 (口,£)=2E[( (n),t)] (n,£) 由于过程达到稳定状态,因此,上式可改写为 (a):2E[(仇(n))] (n)/ 当 一o。时,., ;(a)-*0,该微分方程的解可表 示为 (n)=7exp(2E[( i(n))]/髫) (6) r臼 限制系数y的取值,以满足I (Ⅱ)da=1的条件. J D 3结论 a.式(6)是Fi(a,£)演化到稳定状态时,其概 率密度所具备的均衡条件,可将其称为密度均衡值. 从该条件可以看出,采取决策“的概率受到与其他 决策相对应的决策收益的影响,并且是其预期收益 的递增指数函数.当£— o。时, (以)-+0.则 (a) 为常数,决策a服从均匀分布,决策选取具有完全 随机性而不受期望收益值高低的影响.这表明,当学 习噪声过大时,企业决策会受到过大的干扰而表现 出随机特眭,决策失误增加,决策的结果也可能无法 预测.只有当邑逐渐变小时,从式(6)可知,采取特 定行动的概率中对行动期望收益的依赖才会不断增 加,企业决策才能表现出较强的理性,而较少地受到 随机干扰因素的影响,学习和适应能力才能得到较 大的发挥. b.在现实中,企业决策环境既不是毫一o。,也 不是 -*0,而是表现为具有一定程度的决策噪声 e的学习和适应过程.这一过程的演化达到稳定状 态时的值是概率密度均衡值,而不再是标准意义上 的纳什均衡值. c.模型的结果显示,降低“噪声”有助于提高企 业决策的适应能力以及决策的理性程度.因此,企业 应该不断地学习,积累经验,以不断降低决策的失误 度和“噪声”的干扰程度.与企业学习的现实环境相 结合,可见,进入20世纪90年代后,随着信息技术 的发展和网络时代特征的呈现,企业学习越来越表 现出网络学习的特征.网络学习的内涵是网络内企 业问基于共享的社会文化氛围和制度环境,在解决 共同面对的问题时能协调行动并产生知识积累.网 络固有的“协同效应”使得学习的“噪声”和干扰程度 能有效降低,其结果表现为网络整体知识基础的拓 展和企业竞争能力的提升. 参考文献: [1]NELgq ̄N R R,WINTER S G.An evolutionary theory of economic change[M]."Cambridge:Cambridge Uni— verslty Press,1982:14—20. 【2]DOSI G,MARSILl 0,ORSENIC_X9 L,et al Lex ̄fing, market selection and the evolution of industrial strue— turse[J].Small Business Economics,1995,7:411—436. [3 1 MAYNARD S J.Evolution and the theory of games 【M].Cambridge,MA:Cambridge University Prem, 1982:89—110. [4]WFABULL J.Evolutionary game theory[M].London: MIT Press,1995:80—120. [5]YOUNG P,The evolution of conventions[J].Economet— rica,1993,61:57~84, [6]KANDORI M,MAILATH G J,ROB R、Learning,mu— tation,and long run equilibria in gam ̄[J],Econometri一 (丑,1993,61:1 019~1 045, [7] MCKELVEY,RICHARD D,TH0MAS R P.Quantal response equilibria for nonn ̄form games[J].Games and Economic Behavior,1995,10(1):6—38. [8]FOSTER D,YOUNG H_Stochastic evolutionary game dynamic ̄[J].Theoretical Population Biology,1990,38: 219—232, [9] BINM0RE K,SAMUEI. ̄ON L,VAUGHN R.Musical chairs:modeling noisy evolution[J].Games and Eco— nomic Behavior,1995,11,1—35. [10]陈国权,马萌.组织学习的过程模型研究[j].管理科 学学报,2000,3:15—16. 

因篇幅问题不能全部显示,请点此查看更多更全内容