差别

这里会显示出您选择的修订版和当前版本之间的差别。

到此差别页面的链接

后一修订版
前一修订版
支付矩阵 [2017/12/05 15:17]
JOINERGY_AI 创建
支付矩阵 [2019/01/06 08:59] (当前版本)
行 1: 行 1:
  
 ====== 支付矩阵 ====== ​ ====== 支付矩阵 ====== ​
-本词条由“科普中国”百科科学词条编写与应用工作项目审核。支付矩阵,也称“赢得矩阵”、报酬矩阵、[[收益矩阵]]、[1]得益矩阵,是指从支付表中抽象出来由损益值形成的矩阵,用来描述两个人或多个参与人的策略和支付的矩阵。不同参与人的利润或效用就是支付。在实验心理学的信号检测论中,指在一定的信号和噪音出现的先定概率条件下,对被试判断结果的奖惩办法。中文名支付矩阵外文名Payoffmatrix领    域运筹学属    性由损益值组成的矩阵别    称赢得矩阵、得益矩阵等相关名词收益矩阵 +支付矩阵,也称“赢得矩阵”、报酬矩阵、[[收益矩阵]]、得益矩阵,是指从支付表中抽象出来由损益值形成的矩阵,用来描述两个人或多个参与人的策略和支付的矩阵。不同参与人的利润或效用就是支付。在实验心理学的信号检测论中,指在一定的信号和噪音出现的先定概率条件下,对被试判断结果的奖惩办法。 
-===== 目录 ===== + 
 +中文名支付矩阵 
 + 
 +外文名:Pay-off matrix 
 + 
 +领域运筹学 
 + 
 +属性由损益值组成的矩阵 
 + 
 +别称赢得矩阵、得益矩阵等 
 + 
 +相关名词收益矩阵 
  
-   - 简介 
-   - 新产品价格竞争中的支付矩阵 
 ===== 支付矩阵简介 =====  ===== 支付矩阵简介 ===== 
-支付矩阵,也称“赢得矩阵”,是指从支付表中抽象出来由损益值形成的矩阵,用来描述两个人或多个参与人的策略和支付的矩阵。不同参与人的利润或效用就是支付。在实验心理学的信号检测论中,指在一定的信号和噪音出现的先定概率条件下,对被试判断结果的奖惩办法。支付矩阵(pay-offmatrix)是包含备择行动方案、自然状态和损益值(或效用值)的矩阵。备择行动方案是满足决策目标的n个可行的备择方案。它们彼此独立。所有方案的集合A:{a}称为行动空间或决策空间。自然状态是各种行动方案可能遇到的状态。它们往往是随机的,可以用概率表示。所有状态的集合E:{e}称为状态空间。各自然状态出现的概率P建立在主观观测与经验估算的基础上,为主观概率。所有概率及其状态构成概率空间。对应于的损益值(或支付值),是行动方案在自然状态e条件下所产生的收益值(正值)或损失值(负值),其集合为效用值域为、其中。+支付矩阵,也称“赢得矩阵”,是指从支付表中抽象出来由损益值形成的矩阵,用来描述两个人或多个参与人的策略和支付的矩阵。不同参与人的利润或效用就是支付。在实验心理学的信号检测论中,指在一定的信号和噪音出现的先定概率条件下,对被试判断结果的奖惩办法。 
 + 
 +支付矩阵(pay-off matrix)是包含备择行动方案、自然状态和损益值(或效用值)的矩阵。备择行动方案是满足决策目标的n个可行的备择方案。它们彼此独立。所有方案的集合A:{a}称为行动空间或决策空间。自然状态是各种行动方案可能遇到的状态。它们往往是随机的,可以用概率表示。所有状态的集合E:{e}称为状态空间。各自然状态出现的概率P建立在主观观测与经验估算的基础上,为主观概率。所有概率及其状态构成概率空间。对应于的损益值(或支付值),是行动方案在自然状态e条件下所产生的收益值(正值)或损失值(负值),其集合为效用值域为、其中。 
 ===== 支付矩阵新产品价格竞争中的支付矩阵 =====  ===== 支付矩阵新产品价格竞争中的支付矩阵 ===== 
-在[[价格战]]中,[[企业]]和[[竞争者]]之间是一种[[非合作博弈]]关系。在[[博弈]]过程中,企业和竞争者都有两种策略选择:降价和不降价。假定在某一产业中形成了[[寡头市场]][[结构]],有两个企业A和B[[生产]]同一类[[产品]]。他们共同分享同一[[市场]],在降价前各自获得的[[收益]]相等均为R;当采取价格战时,一个企业认为先通过降价可以获得较高的[[市场份额]],由此可使得收益增加为,相对于另一个企业不降价因此而损失的收益:如果另一个企业也同样采取降价策略,那么面对既定的市场,两个企业会因价格下降而带来损失,损失都为(且)。这样就形成了下表的博弈支付矩阵:通过比较支付矩阵参数的收益支付水平可以看出:在给定A企业时,B企业选择降价策略都比不降价策略好,也就是说降价策略是B的最优策略:同样给定B企业的策略时,A的最优策略也是降价策略。于是(降价,降价)构成了一个博弈的[[纳什均衡]],也就是相应的均衡收益。继续采用上面的假设,现在来分析下面情况,既然双方降价与谁都无利,那么当一个降价,另一个不降价而采用其他[[价格竞争]]策略(比如搞好[[售后服务]]等)时,会出现不同情况,由于采用某种策略适应了社会需求,受到[[消费者]]的普遍赞同,从而吸引了大量的顾客,会产生新的[[收益分配]]的格局,形成了下面的支付矩阵:该支付矩阵尽管是将表一中右上角和左下角对调,但却有着不同的[[经济]]含义和博弈后果。同样可以得到:不管B采取降价与不降价策略,A都会采取不降价策略:而对于B而言,也会是同样的抉择。因此,(不降价,不降价)变成了该支付矩阵的纳什均衡。这样,双方达成了一种默契和共识——合作。通过上面的分析不难看出,采取合作的态度比起双方采用降价竞争的策略有利多了,显然是一种较为良性的状态。但它并非是理想的均衡状态,如果仅仅是维持现状,满足现存的收益水平,那么整个行业乃至社会将不思进取,也将不会有经济社会的[[繁荣]]。[2]+在[[价格战]]中,[[企业]]和[[竞争者]]之间是一种[[非合作博弈]]关系。在[[博弈]]过程中,企业和竞争者都有两种策略选择:降价和不降价。假定在某一产业中形成了[[寡头市场]][[结构]],有两个企业A和B[[生产]]同一类[[产品]]。他们共同分享同一[[市场]],在降价前各自获得的[[收益]]相等均为R;当采取价格战时,一个企业认为先通过降价可以获得较高的[[市场份额]],由此可使得收益增加为,相对于另一个企业不降价因此而损失的收益:如果另一个企业也同样采取降价策略,那么面对既定的市场,两个企业会因价格下降而带来损失,损失都为(且)。这样就形成了下表的博弈支付矩阵:通过比较支付矩阵参数的收益支付水平可以看出:在给定A企业时,B企业选择降价策略都比不降价策略好,也就是说降价策略是B的最优策略:同样给定B企业的策略时,A的最优策略也是降价策略。于是(降价,降价)构成了一个博弈的[[纳什均衡]],也就是相应的均衡收益。 
 + 
 +继续采用上面的假设,现在来分析下面情况,既然双方降价与谁都无利,那么当一个降价,另一个不降价而采用其他[[价格竞争]]策略(比如搞好[[售后服务]]等)时,会出现不同情况,由于采用某种策略适应了社会需求,受到[[消费者]]的普遍赞同,从而吸引了大量的顾客,会产生新的[[收益分配]]的格局,形成了下面的支付矩阵:该支付矩阵尽管是将表一中右上角和左下角对调,但却有着不同的[[经济]]含义和博弈后果。同样可以得到:不管B采取降价与不降价策略,A都会采取不降价策略:而对于B而言,也会是同样的抉择。因此,(不降价,不降价)变成了该支付矩阵的纳什均衡。这样,双方达成了一种默契和共识——合作。通过上面的分析不难看出,采取合作的态度比起双方采用降价竞争的策略有利多了,显然是一种较为良性的状态。但它并非是理想的均衡状态,如果仅仅是维持现状,满足现存的收益水平,那么整个行业乃至社会将不思进取,也将不会有经济社会的[[繁荣]]。 
 ===== 参考资料 =====  ===== 参考资料 ===== 
-1.收益矩阵.baike.baidu.com[引用日期2017-09-02]2.刘卫朋,​周磊,​白慧英.基于方向凸序下的随机支付矩阵[J].河北工业大学学报,​2008,​37(4):​113-116.+1.刘卫朋,​周磊,​白慧英.基于方向凸序下的随机支付矩阵[J].河北工业大学学报,​2008,​37(4):​113-116.