支付矩阵

支付矩阵,也称“赢得矩阵”、报酬矩阵、收益矩阵、得益矩阵,是指从支付表中抽象出来由损益值形成的矩阵,用来描述两个人或多个参与人的策略和支付的矩阵。不同参与人的利润或效用就是支付。在实验心理学的信号检测论中,指在一定的信号和噪音出现的先定概率条件下,对被试判断结果的奖惩办法。

中文名:支付矩阵

外文名:Pay-off matrix

领域:运筹学

属性:由损益值组成的矩阵

别称:赢得矩阵、得益矩阵等

相关名词:收益矩阵

支付矩阵,也称“赢得矩阵”,是指从支付表中抽象出来由损益值形成的矩阵,用来描述两个人或多个参与人的策略和支付的矩阵。不同参与人的利润或效用就是支付。在实验心理学的信号检测论中,指在一定的信号和噪音出现的先定概率条件下,对被试判断结果的奖惩办法。

支付矩阵(pay-off matrix)是包含备择行动方案、自然状态和损益值(或效用值)的矩阵。备择行动方案是满足决策目标的n个可行的备择方案。它们彼此独立。所有方案的集合A:{a}称为行动空间或决策空间。自然状态是各种行动方案可能遇到的状态。它们往往是随机的,可以用概率表示。所有状态的集合E:{e}称为状态空间。各自然状态出现的概率P建立在主观观测与经验估算的基础上,为主观概率。所有概率及其状态构成概率空间。对应于的损益值(或支付值),是行动方案在自然状态e条件下所产生的收益值(正值)或损失值(负值),其集合为效用值域为、其中。

价格战中,企业竞争者之间是一种非合作博弈关系。在博弈过程中,企业和竞争者都有两种策略选择:降价和不降价。假定在某一产业中形成了寡头市场结构,有两个企业A和B生产同一类产品。他们共同分享同一市场,在降价前各自获得的收益相等均为R;当采取价格战时,一个企业认为先通过降价可以获得较高的市场份额,由此可使得收益增加为,相对于另一个企业不降价因此而损失的收益:如果另一个企业也同样采取降价策略,那么面对既定的市场,两个企业会因价格下降而带来损失,损失都为(且)。这样就形成了下表的博弈支付矩阵:通过比较支付矩阵参数的收益支付水平可以看出:在给定A企业时,B企业选择降价策略都比不降价策略好,也就是说降价策略是B的最优策略:同样给定B企业的策略时,A的最优策略也是降价策略。于是(降价,降价)构成了一个博弈的纳什均衡,也就是相应的均衡收益。

继续采用上面的假设,现在来分析下面情况,既然双方降价与谁都无利,那么当一个降价,另一个不降价而采用其他价格竞争策略(比如搞好售后服务等)时,会出现不同情况,由于采用某种策略适应了社会需求,受到消费者的普遍赞同,从而吸引了大量的顾客,会产生新的收益分配的格局,形成了下面的支付矩阵:该支付矩阵尽管是将表一中右上角和左下角对调,但却有着不同的经济含义和博弈后果。同样可以得到:不管B采取降价与不降价策略,A都会采取不降价策略:而对于B而言,也会是同样的抉择。因此,(不降价,不降价)变成了该支付矩阵的纳什均衡。这样,双方达成了一种默契和共识——合作。通过上面的分析不难看出,采取合作的态度比起双方采用降价竞争的策略有利多了,显然是一种较为良性的状态。但它并非是理想的均衡状态,如果仅仅是维持现状,满足现存的收益水平,那么整个行业乃至社会将不思进取,也将不会有经济社会的繁荣

1.刘卫朋,周磊,白慧英.基于方向凸序下的随机支付矩阵[J].河北工业大学学报,2008,37(4):113-116.

请输入您的评论. 可以使用维基语法:
V U O Y​ V