博弈论答案

合集下载

博弈论答案(Gametheoryanswer)

博弈论答案(Gametheoryanswer)

博弈论答案(Game theory answer)Game theory, exercises, reference answers (second assignments)First, the multiple-choice question1.B,2.C,3.A,4.A,5.B,6.ABCD7.C 8.B 9.CTwo, judge and explain the reason1.F best balance is an equilibrium more rigorous than the Nash equilibrium2.T best balance is an equilibrium more rigorous than the Nash equilibrium3.T game types are divided into single game, double game and multiplayer game according to the number of players in the gameUnder the condition that both sides of the 4.F game have different preferences, there may be 2 Nash equilibria in a game model, such as the sex war5.T zero sum game refers to the participation of all parties in the game, under strict competition, one side of revenue is equal to the other party's loss, the sum of gains and losses of the game is always zero, so there is no possibility of cooperation between the two sides6.T is strictly dominated equilibrium through the worstelimination method (excluding repeat decision) the dominant strategy, there is only one Nash equilibrium7.F Nash equilibrium is a collection of best policies, which means that in the case of a given strategy, the game side always chooses a relatively large strategy, and does not guarantee the outcome to be the best.In the 8.F game, people always choose their own strategies to maximize their interests and not aim at the change of the other's earnings9.T Nash equilibrium is a collection of best policies, which means that when given someone else's strategy, no one changes his strategy to reduce his earningsIn the 10.F game, people always choose their own strategies to maximize their interests and not aim at the change of the other's earningsIn the 11.F game, people always choose their own strategies to maximize their interests and not aim at the change of the other's earnings12.T although Berg Stagg model profit is less than the sum of the Cournot model, but the profit model of high Bigunuo leaderThree, calculation and analysis questions1, (1) draw A, B two enterprise profit and loss matrix.B enterpriseAdvertise without advertisingA enterprises advertise 20, 825, 2No advertising 10, 1230, 6(2) pure strategy Nash equilibrium.(advertising, advertising)2, draw two enterprise profit and loss matrix, seek Nash equilibrium.(1) draw the profit and loss matrix of A and B two enterprisesPepsi ColaOriginal price increaseCoca-Cola's original price is 10, 10100, -30Price increases -20, 30140, 35(2) seeking Nash equilibrium.Two: (the original price, the original price), (prices, prices)3, suppose the payoff matrix of a game is as follows:Methyl ethylLeft and rightOn a, B, C, DNext, e, F, G, H(1) if (on, left) is the best balance, then, a>, b>, g<, f>?Answer: a>e, b>d, f>h, g<c(2) what inequalities must be satisfied if (upper, left) is the Nash equilibrium?Answer: a>e, b>d4, answer: (1) this market is represented by the game of prisoner's dilemma.Northern AirlinesCooperative competitionXinhua Airlines cooperation 500000500000090000Competition 900000, 06000060000(2) explain why the equilibrium result may be that both companies choose competitive strategies.Answer: if Xinhua chooses "competition", then the north will choose "60000>0"; if Xinhua chooses "cooperation", the north will still choose "900000>500000".If the North chooses "competition", Xinhua will choose "60000>0"; if the North chooses "cooperation", Xinhua will still choose "900000>0".Because the competition is the dominant strategy of both sides, the equilibrium result is that both companies choose competitive strategy.5. The payoff matrix of the game is shown as follows:BLeft and rightA, a, B, C, DNext, e, F, G, H(1) if the (top, left) is the dominant policy equilibrium, what relation must be satisfied between a, B, C, D, e, F, G, and H?Answer: starting from the definition of dominant strategy equilibrium:For the one, the strategy "g" (a) is better than "C" (E);For B., the policy "left" (B, f) is superior to the policy"right" (D, H).So the conclusions are: a>e, b>d, f>h, c>g(2) if the (upper, left) is Nash equilibrium, what relation must be satisfied in (1)?Answer: Nash equilibrium only needs to meet: a>e, b>d,(3) if the (top, left) is the best balance, then is it necessarily a Nash equilibrium? Why?Answer: the equilibrium of dominant strategy must be Nash equilibrium, because the equilibrium condition of dominant strategy contains the condition of Nash equilibrium.(4) under what circumstances does the pure strategy Nash equilibrium exist?A: when each of these strategies does not satisfy the Nash equilibrium, the pure strategic Nash equilibrium does not exist.7, seek the Nash equilibrium.PigPress waitBig pigs press 5, 14, 4Wait 9, -1 0, 0The Nash equilibrium is: big pig, press, pig, etc., namely (press, etc.)6,BLow priceA low price of 10080050, 50High priced -20, -30 900600(1) what are the results of Nash equilibrium?Answer: (low price, low price), (high price, high price)(2) what is the result of the cooperation between the two firms?Answer: (high price, high price)8. The pure Nash equilibrium of the following games is obtained by using the reaction function method and the marking method.Participants 1 participants 2A, B, C, DingA, 2,3, 3,2, 3,4, 0,3B, 4,4, 5,2, 0,1, 1,2C, 3,1, 4,1, 1,4, 10,2D, 3,1, 4,1, -1,2, 10,1Participant 1's response function:R1 (2) =B, if 2 chooses a=B, if 2 chooses B.=A, if 2, choose C=C or D, if 2, choose DingParticipant 2's response function:R2 (1) = C, if 2, select A= a, if 2, select B= C, if 2, select C= C, if 2, select DFor the common set, the pure strategy Nash equilibrium is (B, a) and (A, c)9, the following game Nash equilibrium (including pure strategyand mixed strategy).Methyl ethylL RU 5,0 0,8D 2,6 4,5Solution: (1) pure strategy Nash equilibrium: we can see from the scratch method that there is no pure strategy Nash equilibrium in the matrix game.(2) mixed strategy Nash equilibriumThe probability of setting a "U" is P1, and the probability of "D" is 1-P1B. the probability of selecting "L" is P2, and the probability of "R" is 1-P2For a, the best policy is to choose "U" and "D" by a certain probability, so that the second choice of "L" and "R" is equal to the expected valueThat is, P1*0+ (1-P1), *6=, P1*8+ (1-P1), *5Xie P1=1/9That is, (1/9,8/9) Nash policy is chosen according to 1/9probability, U and 8/9 probability, and D is chosen as a mixed strategyFor B, the best strategy is to choose "L" and "R" by a certain probability, so that the second is equal to the expected value of "U" and "D"That is, P2*5+ (1-P2), *0=, P2*2+ (1-P2), *4Xie P2=4/7That is, (4/7,3/7) according to the probability of 4/7, "L", "3/7", "R" is chosen as "B", the mixed strategy Nash equilibrium10, answer the question according to the profit and loss matrix of two player game:Methyl ethylLeft and rightGo to 2,3 0,0Lower 0,0 4,2(1) write out all the strategies of the two men.Answer: all strategies: (upper, left), (upper, right), (lower, left), (lower, right)(2) find all the pure strategy Nash equilibrium of the game.A: by the scratch method, we can see that the matrix game is purely strategic and the Nash equilibrium is(upper, left) and (lower, right) two(3) the mixed strategy Nash equilibrium of the game is obtained.Solution: the probability of setting a "up" is P1, and the probability of selecting "down" is 1-P1B. the probability of "left" is P2, and the probability of "right" is 1-P2For a, the best strategy is to choose "upper" and "lower" according to a certain probability, so that the left and right of the second are equal to the expected valueThat is, P1*3+ (1-P1), *0=, P1*0+ (1-P1), *2Xie P1=2/5That is, (2/5,3/5) a mixed strategy Nash equilibrium based on the "2/5 probability", "upper", "3/5" probability, and "next"For b.,The best strategy is to choose "left" and "right" according to a certain probability, so that the candidate's "upper" and "lower" expectations are equalThat is, P2*2+ (1-P2), *0=, P2*0+ (1-P2), *4Xie P2=2/3That is, (2/3,1/3) Nash policy is chosen by the 2/3 probability "left" and "1/3", and the "right" is b11, an oligopoly market has two manufacturers, the total cost is 20 times the output of their own, the market demand letterThe number is Q=200-P.Answer: (1) if two manufacturers decide the output at the same time, how much is the output?(2) if the two firms reach an agreement to monopolize the market and arrange production together, what about their respective profits?(3) use the case to explain the prisoner's dilemma.Answer: (1) by the known conditions Q=200-P, P=200-QTC1=20q1, TC2=20q2, q1+q2=QThe profit functions obtained by 1,2 manufacturers are:K1=Pq1-TC1= (200- (q1+q2)) q1-20q1=180q1-q12-q1q2K2=Pq2-TC2= (200- (q1+q2)) q2-20q2=180q2-q22-q1q2The dK/dq1=0's 1 response function is 180-2Q1-Q2=0,The dK/dq2=0's 2 response function is 180-Q1-2Q2=0,The joint solution can be obtained by q1=q2=60K1=K2=3600(2) by the known condition Q=200-P, P=200-QTC=TC1+TC2=20q1+20q2 =20QThe total profit function of the 1,2 manufacturer is:K=PQ-TC= (200-Q) Q-20Q=180Q-Q2Order dK/dQ=0, Q=90, q1=q2=45K=PQ-TC= (200-Q) Q-20Q=180Q-Q2=8100K1=K2=4050(3) q1=45, q2=60 and q1=60, q2=45, respectively, into the profit function of 1,2 manufacturersThe profits of the 1,2 manufacturers are:K1 (q1=45, q2=60) =Pq1-TC1= (200- (q1+q2))q1-20q1=180q1-q12-q1q2=3375K1 (q1=60, q2=45) =Pq1-TC1= (200- (q1+q2))q1-20q1=180q1-q12-q1q2=4500K2 (q1=45, q2=60) =Pq2-TC2= (200- (q1+q2))q2-20q2=180q2-q22-q1q2=4500K1 (q1=60, q2=45) =Pq1-TC1= (200- (q1+q2))q1-20q1=180q1-q12-q1q2=3375Vendor 2Cooperation (q2=45), non cooperation (q2=60);Vendor 1 Cooperation (q1=45) 4050405033754500Non cooperative (q1=60) 4500337536003600According to the marking method, the best way for the manufacturer is 1.2 (non cooperation, non cooperation), that is, (36003600)The profits of both sides were lower than (cooperation, cooperation). (40504050) obviously it belonged to the prisoner's dilemma"13, consider the following (market deterrence) a dynamic game: first of all, the potential in a market entrants to choose whether or not to enter, and then on the market for enterprise (incumbent) is selected to compete with the new enterprise. The incumbent may have two types of gentle type (left) and cruel type (right), answer the following questions..Left: gentle right: cruel type(1) find the corresponding Nash equilibrium for two types of incumbent, and the sub game perfect Nash equilibrium(1) the Nash equilibrium of the gentle type of incumbent is (access, acquiescence)The Nash of the cruel type is balanced (not entering, entering, struggling)(2) when the existing enterprise is tender, at least how many times will the new enterprise be willing to enter?Four. Discussion questions1, explain the prisoner's Dilemma and explain the business case.(1) assumptions for example: two prisoners were accused of a crime is an accomplice. They were kept in separate cells, unable to communicate information. Prisoners are required to confess crimes. If two prisoners confess, each shall be sent to prison for 5 years; if two men do not confess, two prisoners may expect to be sent from prison to prison for 2 years; if a prisoner confesses, another prisoner does not confess,Frankly, the prisoner will only go to prison for 1 years, and the prisoner without confession will be sentenced to 10 yearsin prison.(2) the strategy matrix of prisoners' dilemma. Each prisoner has two strategies: to confess or not to confess. The numbers in the table represent the benefits of prisoner a and B.Prisoner BConfessPrisoner frank, -5, -5, -1, -10Don't confess, -10, -1, -2, -2(3) analysis: through the marking method, we can see that in the model of prisoner's dilemma, Nash equilibrium is that both sides confess". Given a frank case, the best strategy for B. is to confess; the optimal policy given by B. is also frank. And here both sides confess, not only is the Nash equilibrium, but also is a best balance, that is, regardless of how the other side of the choice, the individual's best choice is to confess. As a result, both sides confess.(4) business cases: oligopoly firms often find themselves ina prisoner's dilemma. When the oligarchic manufacturer chooses the output, every manufacturer can gain more profits if the oligopoly firms combine to form cartels and choose monopoly profits to maximize the output. But the cartel agreement is not a Nash equilibrium, because given both comply with the agreement, each firm to increase production, the result is that each vendor has only been Nash equilibrium yield profits, itis far less than the yield of profit under the cartel.2. Explain and discuss the Nash equilibrium of Cournot duopoly model. Why is balance a prisoner's dilemma?See class notesOr calculation questions eleventh3, use the game of thief and guard to explain the paradox of encouragement (regulation)".(1) assume the conditions for example: stealing and preventing theft is a game between thieves and guards. The guard can sleep or sleep. Thieves can take two tactics: stealing and stealing. If the thief knows that the guard is sleeping, his best bet is to steal. If the guard doesn't sleep, he'd better not steal. For the doorman, if he knows the thief wants to steal, his best choice is not to sleep, and if the thief take it without stealing, he'd better go to sleep.(2) the payment matrix of the thief and the doorman (assuming that the thief must have succeeded in stealing when the guard sleeps, and that the thief will be caught when the guard does not sleep.):GuardGo to bed without sleepThieves steal 1, -1 -2, 0Do not steal 0, 20, 0(3) analysis: through the marking method, we can see that there is no Nash equilibrium in this game. The thieves do not steal, do not sleep, neither gains nor loss; the guard did not sleep, the thief, because the job is not to reward, the thief was sentenced to 2 unit failure loss; guard sleeping, thieves do not steal, the sleeping happily get 2 utility unit, the thief did not return no loss of sleep; the guard, the thief, the guard was punished because of dereliction of duty and his failure in 1 units, 1 units of utility thieves to steal success.(4) "incentive (regulatory) paradox" shows: in reality, we can see that when the doorman without sleep, stealing a crackdown of the convergence of molecules; time, molecular theft began to make waves, the thief can not tolerate when too rampant, the guard had to begin again. The more the thief, so the guard will not sleep more, steal the thief less, not sleeping guard will be less; in turn, the more don't sleep, steal the thief less, do not sleep the less, the more the thief stole. If you steal group selection is out in force, so the guard all don't sleep, but the once all don't sleep, the best choice not to steal all the thief, the thief stole all the guard once chose not to, all the best choose to sleep.(5) conclusion: increasing penalties for thieves can not prevent theft in the long run (but only to make the guard lazy); Aggravating Punishment, dereliction of duty is just to reduce the probability of theft. This game of gatekeeper and thief reveals that the unexpected relationship between policyobjectives and policy outcomes is often called the paradox of motivation".。

大学博弈论试题及答案

大学博弈论试题及答案

大学博弈论试题及答案一、选择题(每题2分,共20分)1. 在博弈论中,非合作博弈是指:A. 参与者之间可以达成协议B. 参与者之间不能达成协议C. 参与者之间必须达成协议D. 参与者之间只能通过合作达到目标答案:B2. 纳什均衡是博弈论中的一个概念,它描述了一种情况,即:A. 所有参与者都处于最优策略B. 至少有一个参与者处于非最优策略C. 所有参与者都处于非最优策略D. 至少有一个参与者可以单方面改变策略以获得更好的结果答案:A3. 囚徒困境中,如果两个参与者都选择合作,那么:A. 他们都将获得最大收益B. 他们都将获得最小收益C. 他们都将获得中等收益D. 他们中的一个将获得最大收益,另一个获得最小收益答案:C4. 零和博弈是指:A. 一个参与者的收益等于另一个参与者的损失B. 参与者的总收益为零C. 参与者的总损失为零D. 参与者的总收益和总损失相等答案:B5. 在博弈论中,策略是指:A. 参与者的行动计划B. 参与者的收益C. 参与者的损失D. 参与者的支付结构答案:A6. 博弈论中的“混合策略”是指:A. 参与者随机选择策略B. 参与者总是选择相同的策略C. 参与者的策略是固定的D. 参与者的策略是预先确定的答案:A7. 博弈论中的“支配策略”是指:A. 无论对手选择什么策略,都是最优的策略B. 只有在特定情况下才是最优的策略C. 只有在对手选择特定策略时才是最优的策略D. 参与者总是选择的策略答案:A8. 博弈论中的“重复博弈”是指:A. 博弈只进行一次B. 博弈进行多次,但每次都是独立的C. 博弈进行多次,且参与者的记忆会影响后续决策D. 博弈进行多次,但参与者不能记住之前的决策答案:C9. 在博弈论中,如果一个策略在任何情况下都不是最优的,那么这个策略被称为:A. 支配策略B. 支配策略的反面C. 支配策略的替代D. 非支配策略答案:B10. 博弈论中的“共同知识”是指:A. 所有参与者都知道的信息B. 只有部分参与者知道的信息C. 参与者之间的秘密D. 参与者之间共享的信念答案:A二、填空题(每题2分,共20分)1. 在博弈论中,如果一个策略在任何情况下都不是最优的,那么这个策略被称为________。

大学mooc博弈论(首师大)满分章节测验答案

大学mooc博弈论(首师大)满分章节测验答案

第一讲认识博弈论1单选(10分)博弈论的基本要素以下内容,除了()。

A.策略与策略集B.均衡C.支付与支付函数D.局中人正确答案:B你选对了2单选(10分)博弈论的基本假设是强调()。

A.均衡状态B.利益最大化C.个人理性D.集体理性正确答案:C你选对了3单选(10分)哪种表述模型更适合表示二人博弈()。

A.特征函数式B.标准式C.扩展式D.以上都不适合正确答案:B你选对了4单选(10分)根据人们行动为相互作用时,参与人能否达成一个具有约束力的协议,可将博弈分为( )。

A.静态博弈与动态博弈B.常和博弈与非常和博弈C.完全信息博弈与不完全信息博弈D.合作博弈与非合作博弈正确答案:D你选对了5单选(10分)“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解”出自哪位诺贝尔经济学奖获得者的名言( )。

A.1994年诺贝尔经济学奖获得者John·NashB.2012年诺贝尔经济学奖获得者Lloyd S. ShapleyC.2005年诺贝尔经济学奖获得者Robert·AumannD.1970年诺贝尔经济学奖获得者Paul A. Samuelson正确答案:D你选对了6多选(15分)博弈论的研究特点包括()。

A.博弈论存在信息的对称性B.博弈论涉及的决策者至少为两人C.博弈论存在信息的不对称性D.博弈论需要考虑其他决策者的决策对自身利益的影响正确答案:B、C、D你选对了7多选(15分)“囚徒困境”反映了()。

A.“看不见的手”是有力的,但不是万能的B.个人理性通过市场机制导致社会福利最优的结论并不总是成立的C.个体理性与集体理性的冲突D.以自我利益为目标的“理性”行为,最终导致了两个囚徒得到相对较劣的收益正确答案:A、B、C、D你选对了8判断(5分)博弈论是一种以数学为基础、研究发生对抗与冲突时如何选择最优策略的一门学问。

正确答案:√你选对了9判断(5分)博弈论是单向的理性决策。

博弈论 课后习题答案

博弈论 课后习题答案

博弈论课后习题答案第四部分课后习题答案1. 参考答案:括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙的得益,而b表示甲的得益。

在第三阶段,如果,则乙会选择不打官司。

这时逆推回第二阶段,甲会选择a,0不分,因为分的得益2小于不分的得益4。

再逆推回第一阶段,乙肯定会选择不借,因为借的最终得益0比不借的最终得益1小。

在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是(a,b)。

a,0逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为(a,b)。

b,2在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0),当a,1时乙肯定会选择借,最后双方得益为(a,b)。

在第二阶段如果,则甲会选择a,1b,2分,此时双方得益为(2,2)。

再逆推回第一阶段,乙肯定会选择借,因为借的得益2大于不借的得益1,最后双方的得益(2,2)。

根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况:(1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0得益(1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益(a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。

要本博弈的“威胁”,即“打”是可信的,条件是。

要本博弈的“承诺”,即a,0“分”是可信的,条件是且。

a,0b,2注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。

不过最终的结果并不会超出上面给出的范围。

2. 参考答案:静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。

博弈论试题及答案

博弈论试题及答案

博弈论试题及答案【正文】博弈论试题及答案一、选择题1.博弈论是研究:A. 地理分布B. 人类视力C. 决策制定D. 古典文学答案:C2.下列哪个不是博弈论中常见的概念?A. 纳什均衡B. 优势策略C. 输家效应D. 零和博弈答案:C3.描述纳什均衡的最佳方式是:A. 所有参与者都达到最佳策略B. 至少有一个参与者达到最佳策略C. 所有参与者都达到次优策略D. 至少有一个参与者达到次优策略答案:A4.下列哪个案例体现了零和博弈的情况?A. 两国签订贸易协定B. 赌徒在赌博中争夺赌注C. 两家公司合作推出新产品D. 好友一起玩棋盘游戏答案:B5.下列哪个不是博弈论的应用之一?A. 经济决策B. 政治博弈C. 生物进化D. 音乐创作答案:D二、填空题1.博弈论最早由_____________等人于20世纪40年代提出。

答案:冯·诺依曼(John von Neumann)2.博弈论是研究参与者间的_____________和_____________的学科。

答案:互动行为;决策制定3.零和博弈是指参与者的利益总和恒为_____________。

答案:零4.博弈论中的最佳策略指的是在其他参与者采取某个策略时,使某一参与者的_____________最大化的策略。

答案:利益5.斯坦福大学的_____________教授以其对博弈论的突出贡献而获得2005年诺贝尔经济学奖。

答案:约翰·纳什(John Nash)三、简答题1.简要解释博弈论中的纳什均衡。

答:纳什均衡是博弈论中的一个重要概念,指的是在参与者选择自己最佳策略的情况下,不存在任何一个参与者可以通过单独改变自己的策略来获得更好收益的状态。

简言之,纳什均衡是一种理性选择下的稳定状态。

2.举例说明博弈论在实际生活中的应用。

答:博弈论在经济学、政治学、生物学等领域中都有广泛应用。

例如,在贸易谈判中,两个国家之间的博弈就是典型的博弈论应用。

博弈论考试题及答案

博弈论考试题及答案

博弈论考试题及答案一、选择题(每题2分,共20分)1. 博弈论中的“囚徒困境”是指什么?A. 两个囚犯相互合作B. 两个囚犯相互背叛C. 两个囚犯中一个合作一个背叛D. 两个囚犯相互猜疑答案:B2. 以下哪个不是博弈论中的基本概念?A. 策略B. 收益C. 公平D. 纳什均衡答案:C3. 在零和博弈中,一个玩家的损失等于另一个玩家的收益,这意味着:A. 总收益为零B. 总收益为正C. 总收益为负D. 总收益不确定答案:A4. 博弈论中的“混合策略”是指:A. 玩家随机选择策略B. 玩家固定选择一种策略C. 玩家根据对手的策略选择策略D. 玩家不使用策略答案:A5. 以下哪个是博弈论中的“完全信息”博弈?A. 拍卖博弈B. 石头剪刀布C. 桥牌D. 信息不对称博弈答案:C6. 博弈论中的“重复博弈”指的是:A. 博弈只进行一次B. 博弈进行多次C. 博弈进行无限次D. 博弈进行有限次但次数未知答案:B7. 以下哪个是博弈论中的“动态博弈”?A. 零和博弈B. 非零和博弈C. 同时博弈D. 顺序博弈答案:D8. 在博弈论中,如果一个策略组合是纳什均衡,那么:A. 每个玩家都有动机单方面改变策略B. 每个玩家都满足于当前策略C. 至少有一个玩家不满意当前策略D. 所有玩家都不满意当前策略答案:B9. 博弈论中的“合作博弈”是指:A. 玩家之间可以形成联盟B. 玩家之间不能形成联盟C. 玩家之间只能通过竞争来获得收益D. 玩家之间只能通过合作来获得收益答案:A10. 以下哪个是博弈论中的“公共知识”?A. 每个玩家的收益函数B. 每个玩家的策略选择C. 每个玩家的偏好D. 每个玩家的个人信息答案:A二、简答题(每题10分,共30分)1. 简述博弈论中的“纳什均衡”概念。

答案:纳什均衡是指在一个博弈中,每个玩家都选择了自己的最优策略,并且没有玩家能够通过单方面改变策略来提高自己的收益。

在纳什均衡状态下,每个玩家的策略是对其他玩家策略的最优反应。

博弈论

博弈论

博弈论[单项选择题]1、博弈论中,局中人从一个博弈中得到的结果常被称为()。

A.效用B.支付C.决策D.利润参考答案:B[单项选择题]2、博弈中通常包括下面的内容,除了()。

A.局中人B.占优战略均衡C.策略D.支付参考答案:B[单项选择题]3、在具有占优战略均衡的囚徒困境博弈中()。

A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了参考答案:C[单项选择题]4、在多次重复的双头博弈中,每一个博弈者努力()。

A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大参考答案:D[单项选择题]5、一个博弈中,直接决定局中人支付的因素是()。

A.策略组合B.策略C.信息D.行动参考答案:A[单项选择题]6、对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。

A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡参考答案:C[单项选择题]7、在囚徒困境的博弈中,合作策略会导致()。

A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜参考答案:A[单项选择题]8、在什么时候,囚徒困境式博弈均衡最可能实现()。

A.当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D.当一个寡头行业进行一次博弈时参考答案:D[单项选择题]9、一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。

A.主导策略B.激发策略C.一报还一报策略D.双头策略参考答案:C[单项选择题]10、关于策略式博弈,正确的说法是()。

A.策略式博弈无法刻划动态博弈B.策略式博弈无法表明行动顺序C.策略式博弈更容易求解D.策略式博弈就是一个支付矩阵参考答案:B[单项选择题]11、下列关于策略的叙述哪个是错误的()A.策略是局中人选择的一套行动计划;B.参与博弈的每一个局中人都有若干个策略;C.一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D.策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。

博弈论复习题及答案

博弈论复习题及答案

博弈论复习题及答案1. 博弈论中,非合作博弈与合作博弈的主要区别是什么?答案:非合作博弈是指参与者之间没有约束性协议的博弈,每个参与者都独立地选择自己的策略以最大化自己的利益。

而合作博弈则允许参与者之间形成具有约束力的协议,共同合作以达到共同的目标。

2. 什么是纳什均衡?答案:纳什均衡是指在一个博弈中,每个参与者都选择了最优策略,并且考虑到其他参与者的策略后,没有参与者有动机单方面改变自己的策略。

3. 零和博弈与非零和博弈有何不同?答案:零和博弈是指博弈中所有参与者的收益总和为零,即一个参与者的收益必然导致另一个参与者的损失。

非零和博弈则是指参与者的收益总和不为零,参与者之间可能存在合作共赢的情况。

4. 如何判断一个博弈是否存在纯策略纳什均衡?答案:可以通过构建博弈的收益矩阵,然后寻找每个参与者在其他参与者策略给定的情况下的最佳响应策略。

如果存在一组策略,使得每个参与者在其他参与者策略不变的情况下,都没有动机改变自己的策略,那么这个策略组合就是一个纯策略纳什均衡。

5. 混合策略纳什均衡与纯策略纳什均衡有何不同?答案:纯策略纳什均衡是指参与者在均衡状态下选择的策略是确定的,而混合策略纳什均衡则是指参与者在均衡状态下选择的策略是随机的,每个策略都有一定的概率被选择。

6. 什么是支配策略?答案:支配策略是指在博弈中,无论其他参与者选择什么策略,某个参与者选择该策略都能获得比其他策略更好的结果。

7. 博弈论中的“囚徒困境”说明了什么?答案:“囚徒困境”说明了即使合作对所有参与者都有利,但由于缺乏信任和沟通,参与者可能会选择对自身最有利的策略,导致集体结果不是最优的。

8. 什么是博弈论中的“倒后归纳法”?答案:“倒后归纳法”是一种解决动态博弈的方法,通过从博弈的最后阶段开始,逆向分析每个阶段的最优策略,直到博弈的初始阶段。

9. 博弈论在经济学中的应用有哪些?答案:博弈论在经济学中的应用非常广泛,包括但不限于市场结构分析、拍卖理论、合同理论、产业组织、宏观经济政策分析等。

博弈论习题与参考答案

博弈论习题与参考答案

1.假设古诺寡头模型中有n 个企业,令i q 代表企业i 的产量,且1n Q q q =++表示市场总产量,假设需求函数为()p Q a Q =-(其中Q a <)。

假设企业i 的成本函数为()i i i C q cq =,即没有固定成本,且边际成本为常数c ,我们假设c 小于需求函数中的常数a 。

根据古诺模型,所有企业同时做出产量决策。

求纳什均衡。

当n 趋于无穷时,将会出现什么情况? 【参考答案】第i 个企业的利润最大化问题为:**Max (,)()i i i i i i i q q a q q q cq π--=---,其中*i q -表示所有其他企业的产量之和。

注意这个式子利用了纳什均衡的定义。

由一阶条件0iiq π∂=∂,可得 **2i ia q c q ---=(1)将(1)式两侧同乘以2,再减去*i q 可得:***()i i i q a q q c -=-+-注意,在上式中***=i i q q Q -+,因此,我们有**i q a Q c =--(2)由此可知,每一个企业的最优产量都相等,因此**=i Q nq ,代入(2)式可得:*1()1i q a c n =-+ 由此可得()**1i nQ nq a c n ==-+ *11a n p c n n =+++ 因此,当n →∞时,*=p c ,即均衡价格等于边际成本,市场为完全竞争市场。

作业1 .P(q)=120-q, q=q1+q2, Ci(qi)=0, i=1,2 用反复删除严格劣势求古诺均衡。

2. 找出BOS 博弈的混合策略均衡。

r D 1-r Z3.某产品市场中只有三个企业,市场的需求函数为()p Q a Q =-,其中123Q q q q =++。

每一个企业的的成本函数为()i i i C q cq =,其中c 为常数,1,2,3i =。

企业的产量决策顺序为:(1)企业1先选择自己的产量1q ;(2)企业2和企业3观察到1q ,并同时选择2q 和3q 。

博弈论练习与答案

博弈论练习与答案

目录~、单选题 ............................................. 1.二、多选题 (19)三、 ................................................ 判断题26 .....................................................四、 ................................................ 填空题32 .....................................................五、 ................................................ 主观题32 .....................................................-、单选题1•人与人之间的博弈是什么关系?(B)A. 只胃缰台作关粟压既可雄盍争关察r也可li區合作关索D.只能是竞争关豕2•如果博弈前的损益总和与博弈后的损益总和相等,该博弈称为(D)。

九员和博弈B非合作博弈C-合作博弈D.零和博奔3.囚犯困境的根本原因在于(B)。

2人的理性选择B-私人咸本与社会成本的差异匚人的自私自利D-坦日从窝\抗拒城严花游映则4•“好货不便宜、便宜没好货”其实是一个“智猪博弈”,这是因为(D)。

A-懂行的人占了不懂行的人的便宜吐卖差货的人占了卖好货的人的便宜匚卖好货的人占了卖连货的人的便宜D-不懂行的人占了懂行的人的便宜5•以下哪些博弈不属于竞争关系?(C)A.美国总统竞选$小区偉牟占位C.同学聚会0两个大学生竞聘同一个工作尚位6•以下是某教授和学生张三之间的策略表达式:请问,教授选择发过该学生的概率是多少?(D)A* 25%B. 0%C. 75%0 50%7•以下是某教授和学生张三之间的策略表达式:请问,张三选择平时勤快的概率是多少?( B)九50%B T 20%C. 0%D・ 100%8.用X表示参与者1所得的份额,(1 一X)为参与者2所得的份额。

博弈论十五道题以及答案

博弈论十五道题以及答案

博弈论十五道题以及答案1.博弈理论在哪些方面扩展了传统的新古典经济学?2.法律和信誉是维持市场有序运行的两个基本机制。

请结合重复博弈理论谈谈信誉机制发生作用的几个条件。

3.经济发展史表明,在本来不认识的人之间建立相互之间的信任关系是经济发展的关键。

为什么?4.在传统社会中,即使没有法律,村民之间也可以建立起高度的信任。

请结合博弈理论解释其原因。

5.在旅游地很容易出现假货,而在居民小区的便利店则很少出现假货,请结合博弈论的相关理论进行解释。

6.你如何理解“Credible threats or promises about future behavior can influence current behavior”这句话的?7.有效的法律制度对经济发展具有什么作用?请结合博弈理论谈谈你的理解。

8.试用博弈理论解释家族企业为什么难以实行制度化管理?9.固定资产投资为什么可以作为一种可置信的承诺?10.以汽车保险为例谈谈因为信息不对称所可能产生的道德风险问题,并提出一种解决道德风险的方案。

11.以公司为例,谈谈所有者与经营者的分离可能产生的道德风险问题。

12.在波纳佩岛上,谁能种出特别大的山药,谁的社会地位就高,谁就能赢得人们的尊敬并可担任公共职务。

请结合信号传递模型谈谈波纳佩岛上的这种奇异风俗。

13.一位男生在女朋友过生日时送给女朋友三百元人民币,他的女朋友往往感觉受到了侮辱。

而他女朋友可能会欣然接受父母亲的现金礼物。

请解释其中可能的原因。

14.<圣经>(旧约)中记载了两个母亲争夺一个孩子的故事。

一次,两个女人为争夺一个婴儿争扯到所罗门王殿前,她们都说婴儿是自己的,请所罗门王作主。

所罗门王稍加思考后作出决定:将婴儿一刀劈为两段,两位妇人各得一半。

这时,其中一位妇人立即要求所罗门王将婴儿判给对方,并说婴儿不是自己的,应完整归还给另一位妇人,千万别将婴儿劈成两半。

听罢这位妇人的求诉,所罗门王立即作出最终裁决——婴儿是这位请求不杀婴儿的妇人的,应归于她。

博弈论题目和参考答案

博弈论题目和参考答案

博弈论题目(参考答案)
题目:
一、两个人分蛋糕,怎么样才可以分得公平?
答案:一个先切,另一个先拿。

二、合伙人在一起做生意,为什么生意做的越好,利润越高,公司做得越大,越容易闹矛盾,甚至分家?
答案:人们对于利益分配的敏感性(收益的期待和对于损失的恐惧)会随着数额的增大而增大。

三、为什么说谈恋爱,陷入的越深,分手的代价越大?
答案:合作的收益和机会成本都会随着时间的推移而不断加大。

合作持续越长彼此投入的时间和机会成本就会越多。

博弈论考题与答案

博弈论考题与答案

一、假设市场上有三个垄断企业,企业无生产成本,问达到纳什均衡时的产量为多少?假设市场的价格和数量之 间 P=a — b*Q解:二、 什么是纳什均衡,你是如何理解纳什均衡的?答:纳什均衡指的是这样一种战略组合,这种战略组合由所有参与人的最优战略组成,也就是说,给定别人战略 的情况下,没有任何单个参与人有积极性选择其他战略使自己获得更大利益,从而没有任何人有积极性打破这种 均衡。

当然,“纳什均衡”虽然是由单个人的最优战略组成,但并不意味着是一个总体最优的结果。

如上述, 在个人理性与集体理性的冲突的情况下,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人 都不利的结局。

三、 构建一个博弈,说明如何杜绝学生考试作弊现象(参考高薪养廉博弈)答:四、 给出该博弈的纳什均衡,并用消除劣势战略法,找出(R1, C3)这个纳什均衡。

C1 C2 C3 R12,12 1,10 1,12 R20,12 0,10 0,11 R3 0,12 0,10 0,13五、两个老朋友在一起喝酒,每个人有四个纯战略:杠子、老虎、鸡和虫子,输赢规则是:杠子降鸡,鸡吃虫子, 虫子降杠子,两人同时出令。

如果一个打败另一个,赢的效用为 1,输的效用为-1,否则效用为0,写出这个博弈 的支付矩阵,计算其混合战略纳什均衡。

答:设S 为棒子T 为老虎C 为鸡W 为虫子,则其支付矩阵为:设1、2出STCW 的概率分别为P1P2P3P4和Q1Q2Q3Q4,贝U 矩阵达到均衡时,2的期望收益必须满足:0*p1 — 1*p2+0*p3+1*p4=1*p1+0*p2 — 1*p3+0*p4=0*p1+1*p2+0*p3 — 1*p4= — 1*p1+0*p2+1*p3+0*p4整理为 一p2+p4=p1 — p3= — p1+p3由于上式为对称的,所以,p 仁p2=p3=p4,又 p1+p2+p3+p4=1,可得 p 仁p2=p3=p4=0.25.同理 q 仁q2=q3=q4=0.25 综上所述,混合战略的纳什均衡为: A1 (0.25,0.25,0.25,0.25 A2 (0.25,0.25,0.25,0.25六、5个海盗抢到了 100颗宝石,每一颗大小和价值都一样他们决定这么分:抽签决定自己的号码(1、2、3、4、5)。

“博弈论”习题参考附标准答案

“博弈论”习题参考附标准答案

《博弈论》习题一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为()。

A. 效用B. 支付C. 决策D. 利润2.博弈中通常包括下面的内容,除了()。

A.局中人B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中()。

A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力()。

A.使行业的总利润达到最大B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是()。

A. 策略组合B. 策略C. 信息D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。

A.囚徒困境式的均衡B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。

A.一报还一报的策略B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致()。

A.博弈双方都获胜B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。

A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D. 当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。

A.主导策略B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈,正确的说法是()。

A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的():A. 策略是局中人选择的一套行动计划;B. 参与博弈的每一个局中人都有若干个策略;C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。

(完整版)上海商学院---博弈论习题参考答案(Part.Ⅰ)

(完整版)上海商学院---博弈论习题参考答案(Part.Ⅰ)

《博弈论》习题参考答案(Part.Ⅰ)一、选择题1.B2.C3.A4.A5.B6.ABCD7.C 8.B 9.C二、判断正误并说明理由1.F 上策均衡是比纳什均衡更严格的均衡概论2.T 上策均衡是比纳什均衡更严格的均衡概论3.T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈4.F 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在2个纳什均衡,如性别战5.T 零和博弈指参与博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与损失之和恒为零,所以双方不存在合作可能性6.T 上策均衡是通过严格下策消去法(重复剔除下策)所得到的占优策略,只能有一个纳什均衡7.F 纳什均衡是上策的集合,指在给定的别人策略情况下,博弈方总是选择利益相对较大的策略,并不保证结果是最好的。

8.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标9.T 纳什均衡是上策的集合,指在给定的别人策略情况下,没有人会改变自己的策略而减低自己的收益10.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标11.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标12.T 虽然斯塔格伯格模型各方利润总和小于古诺模型,但是领导者的利润比古诺模型时高三、计算与分析题1、(1)画出A、B两企业的损益矩阵。

B企业做广告不做广告做广告20,825,2 A企业不做广告10,1230,6(2)求纯策略纳什均衡。

(做广告,做广告)2、画出两企业的损益矩阵求纳什均衡。

(1)画出A、B两企业的损益矩阵百事可乐原价涨价原价10,10100,-30可口可乐涨价-20,30140,35(2)求纳什均衡。

两个:(原价,原价),(涨价,涨价)3、假定某博弈的报酬矩阵如下:乙左右甲上a,b c,d下e,f g,h(1)如果(上,左)是上策均衡,那么,a>?, b>?, g<?, f>?答:a>e, b>d, f>h, g<c(2)如果(上,左)是纳什均衡,上述哪几个不等式必须满足?答:a>e, b>d4、答:(1)将这一市场用囚徒困境的博弈加以表示。

“博弈论”习题及参考答案

“博弈论”习题及参考答案

《博弈论》习题一、单项选择题1.博弈论中,局中人从一个博弈中得到的结果常被称为( )。

A.效用B.支付C.决策 D.利润2.博弈中通常包括下面的内容,除了( )。

A.局中人 B.占优战略均衡C.策略D.支付3.在具有占优战略均衡的囚徒困境博弈中( )。

A.只有一个囚徒会坦白B.两个囚徒都没有坦白C.两个囚徒都会坦白D.任何坦白都被法庭否决了4.在多次重复的双头博弈中,每一个博弈者努力( )。

A.使行业的总利润达到最大 B.使另一个博弈者的利润最小C.使其市场份额最大D.使其利润最大5.一个博弈中,直接决定局中人支付的因素是( )。

A. 策略组合 B. 策略C. 信息 D. 行动6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时的博弈具有()。

A.囚徒困境式的均衡 B.一报还一报的均衡C.占优策略均衡D.激发战略均衡7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。

A.一报还一报的策略 B.激发策略C.双头策略D.主导企业策略8.在囚徒困境的博弈中,合作策略会导致( )。

A.博弈双方都获胜 B.博弈双方都失败C.使得先采取行动者获胜D.使得后采取行动者获胜9.在什么时候,囚徒困境式博弈均衡最可能实现()。

A. 当一个垄断竞争行业是由一个主导企业控制时B.当一个寡头行业面对的是重复博弈时C.当一个垄断行业被迫重复地与一个寡头行业博弈时D.当一个寡头行业进行一次博弈时10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种( )。

A.主导策略 B.激发策略C.一报还一报策略D.主导策略11.关于策略式博弈,正确的说法是( )。

A. 策略式博弈无法刻划动态博弈B. 策略式博弈无法表明行动顺序C. 策略式博弈更容易求解D. 策略式博弈就是一个支付矩阵12.下列关于策略的叙述哪个是错误的( ):A. 策略是局中人选择的一套行动计划;B.参与博弈的每一个局中人都有若干个策略;C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的;D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。

博弈论各章节课后习题答案

博弈论各章节课后习题答案

9. 求如图所示完全信息动态博弈的子博弈完美纳什均衡(图中数字(a,b,c)分别表示局中人 1、
2、3 的 收 益 )。
1
A1
A2
3
2
C1
C2
B1
B2
(4,2,3)
(1,7,8) 3
C1
C2 C1
3
C2
(5,4,3) (7,6,6) (2,1,9) (0,4,2)
答:局中人 1 采取 A2 行 动 ,局中人 2 采取行动 B1 时,局中人 3 必然采取 C2 行 动( 因为 3<6), 因而该博弈的顶点只能是(7,6,6)。同样对于局中人 3 右边一个子博弈,必然采取 C1 行动 (9>2),因而该博弈的顶点只能是(2,1,9)。进而原博弈简化为:
的定价,qi是企业i的需求量。假设企业生产没有固定成本,并且边际成本为常数c,c<a.假定博弃 重复无穷多次,每次的价格都立即被观察到,企业使用触发策略。求使垄断价格可以作为完美 均衡结果出现的最低贴现因子δ,并解释δ与n的关系。
分以下几个步骤进行。
1)计算纳什均衡 当企业 i 选择价格 pi,其它企业选择价格 pj(j=1,2,…,n,j≠i)时,企业 i 的利润为: πi = (pi − c)qi = (pi − c)(a − pi + b(p1 + p2 + ⋯ + pi−1 + pi+1 + ⋯ + pn )) ,i=1,2,…,n
∂π2 ∂q 2
= a − q1
− 2q2
− q3
−c=0
∂π3 ∂q3
=
a
− q1
− q2
− 2q3
−c
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
K1(q1=60,q2=45)=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2=4500
K2 (q1=45,q2=60)=Pq2-TC2=(200-(q1+q2))q2-20q2=180q2-q22-q1q2=4500
K1(q1=60,q2=45)=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2=3375
(4)商业案例:寡头垄断厂商经常发现它们自己处于一种囚徒的困境。当寡头厂商选择产量时,如果寡头厂商们联合起来形成卡特尔,选择垄断利润最大化产量,每个厂商都可以得到更多的利润。但卡特尔协定不是一个纳什均衡,因为给定双方遵守协议的情况下,每个厂商都想增加生产,结果是每个厂商都只得到纳什均衡产量的利润,它远小于卡特尔产量下的利润。
(2) 找出该博弈的全部纯策略纳什均衡。
答:由划线法可知,该矩阵博弈全部纯策略Nash均衡为
(上,左)和(下,右)两个
(3) 求出该博弈的混合策略纳什均衡。
解:设甲选择“上”的概率为P1,则选择“下”的概率为1-P1
乙选择“左”的概率为P2,则选择“右”的概率为1-P2
对甲而言,最佳策略是按一定的概率选“上”和“下”,使乙选择“左”和“右”的期望值相等
(2)囚徒困境的策略矩阵表。每个囚徒都有两种策略:坦白或不坦白。表中的数字分别代表囚徒甲和乙的得益。
囚徒乙
坦白 不坦白
囚徒甲 坦白 -5, -5 -1, -10
不坦白 -10, -1 -2, -2
(3)分析:通过划线法可知:在囚徒困境这个模型中,纳什均衡就是双方都“坦白”。给定甲坦白的情况下,乙的最优策略是坦白;给定乙坦白的情况下,甲的最优策略也是坦白。而且这里双方都坦白不仅是纳什均衡,而且是一个上策均衡,即不论对方如何选择,个人的最优选择是坦白。其结果是双方都坦白。
解得 P2=4/7
即(4/7,3/7)按4/7概率选“L”、3/7概率选“R”为乙的混合策略Nash均衡
10、根据两人博弈的损益矩阵回答问题:
甲 乙
左 右
上 2,3 0,0
下 0,0 4,2
(1) 写出两人各自的全部策略。
答:全部策略:(上,左),(上,右),(下,左),(下,右)
10.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标
11.F 局中人总是以自己的利益最大化选择自己的策略,并不以对方收益的变化为目标
12.T 虽然斯塔格伯格模型各方利润总和小于古诺模型,但是领导者的利润比古诺模型时高
三、计算与分析题
1、 (1)画出A、B两企业的损益矩阵。
答:a>e, b>d
4、答:(1)将这一市场用囚徒困境的博弈加以表示。
北方航空公司
合作 竞争
新华航空公司 合作 500000,500000 0,900000
竞争 900000,0 60000,60000
(2)解释为什么均衡结果可能是两家公司都选择竞争性策略。
答:若新华选择“竞争”,则北方也会选择“竞争”(60000>0);若新华选择“合作”,北方仍会选择“竞争”(900000>500000)。
若北方选择“竞争”,新华也将选择“竞争”(60000>0);若北方选择“合作”,新华仍会选择“竞争”(900000>0)。
由于“竞争”为双方的占优策略,故均衡结果为两家公司都选择竞争性策略。
5、博弈的收益矩阵如下表:

左 右
甲 上 a,b c,d
下 e,f g,h
(1)如果(上,左)是占优策略均衡,则a、b、c、d、e、f、g、h之间必然满足哪些关系?
即 P1*3+(1-P1)*0= P1*0+(1-P1)*2
解得 P1=2/5
即(2/5,3/5)按2/5概率选“上”、3/5概率选“下”为甲的混合策略Nash均衡
对乙而言,最佳策略是按一定的概率选“左”和“右”,使乙选择“上”和“下”的期望值相等
即 P2*2+(1-P2)*0= P2*0+(1-P2)*4
《博弈论》习题参考答案(第2次作业)
一、选择题
1.B 2.C 3.A 4.A 5.B 6.ABCD
7.C 8.B 9.C
二、判断正误并说明理由
1.F 上策均衡是比纳什均衡更严格的均衡概论
2.T 上策均衡是比纳什均衡更严格的均衡概论
(1)假设条件举例:两囚徒被指控是一宗罪案的同案犯。他们被分别关在不同的牢房无法互通信息。各囚徒都被要求坦白罪行。如果两囚徒都坦白,各将被判入狱5年;如果两人都不坦白,两囚徒可以期望被从轻发落入狱2年;如果一个囚徒坦白而另一个囚徒不坦白,坦白的这个囚徒就只需入狱1年,而不坦白的囚徒将被判入狱10年。
(3)如果(上,左)是上策均衡,那么它是否必定是纳什均衡?为什么?
答:占优策略均衡一定是纳什均衡,因为占优策略均衡的条件包含了纳什均衡的条件。
(4)在什么情况下,纯策略纳什均衡不存在?
答:当对每一方来说,任意一种策略组合都不满足纳什均衡时,纯战略纳什均衡就不存在。
7、求纳什均衡。
小猪
(1)找出给定在位者的两种类型所分别对应的纳什均衡,以及子博弈精炼纳什均衡
(1)温柔型在位者的纳什均衡为 (进入, 默认)
残酷型在位者的纳什均衡为 (不进入, (进入,斗争))
(2)已有企业为温柔型的概率至少多少时,新企业才愿意进入?
四、论述题
1、解释“囚犯困境”,并举商业案例说明。
K2=Pq2-TC2=(200-(q1+q2))q2-20q2=180q2-q22-q1q2
令dK/dq1=0 得厂商1的反应函数为180-2Q1-Q2=0,
令dK/dq2=0 得厂商2的反应函数为180-Q1-2Q2=0,
联解可得q1=q2=60
K1=K2=3600
厂商2
合作(q2=45) 不合作(q2=60)
厂商1 合作(q1=45) 4050,4050 3375,4500
不合作(q1=60) 4500,3375 3600,3600
根据划线法,可得厂商1.2的上策是(不合作,不合作)即(3600,3600)
双方利润均低于(合作,合作)(4050,4050)显然它属于“囚徒困境”
(3)用该案例解释囚徒困境。
答:(1)由已知条件 Q=200-P,P=200-Q
TC1=20q1,TC2=20q2 q1+q2=Q
可得1,2厂商的利润函数分别为:
K1=Pq1-TC1=(200-(q1+q2))q1-20q1=180q1-q12-q1q2
即 P1*0+(1-P1)*6= P1*8+(1-P1)*5
解得 P1=1/9
即(1/9,8/9)按1/9概率选“U”、8/9概率选“D”为甲的混合策略Nash均衡
对乙而言,最佳策略是按一定的概率选“L”和“R”,使乙选择“U”和“D”的期望值相等
即 P2*5+(1-P2)*0= P2*2+(1-P2)*4
答:(高价,高价)
8、用反应函数法结合划线法,求出下列博弈的所有纯策略纳什均衡。
参与人1 参与人2
甲 乙 丙 丁
A 2,3,1 1,2
C 3,1 4,1 1,4 10,2
D 3,1 4,1 -1,2 10,1
参与人1的反应函数:
13、(市场威慑)考虑下面一个动态博弈:首先,在一个市场上潜在的进入者选择是否进入,然后市场上的已有企业(在位者)选择是否与新企业展开竞争。在位者可能有两种类型,温柔型(左图)和残酷型(右图),回答下面问题。
.
左图:温柔型 右图:残酷型
答:从占优策略均衡的定义出发:
对甲而言,策略“上”(a,c)优于策略“下”(e,g);
对乙而言,策略“左” (b,f)优于策略“右”(d,h)。
所以结论是:a>e, b>d, f>h, c>g
(2)如果(上,左)是纳什均衡,则(1)中的关系式哪些必须满足?
答:纳什均衡只需满足:a>e, b>d,
(2)求纳什均衡。
两个:(原价,原价),(涨价,涨价)
3、假定某博弈的报酬矩阵如下:
甲 乙
左 右
上 a,b c,d
下 e,f g,h
(1)如果(上,左)是上策均衡,那么,a>?, b>?, g<?, f>?
答:a>e, b>d, f>h, g<c
(2)如果(上,左)是纳什均衡,上述哪几个不等式必须满足?
3.T 博弈类型按局中人数多少分为单人博弈、双人博弈和多人博弈
4.F 博弈双方偏好存在差异的条件下,一个博弈模型中可能存在2个纳什均衡,如性别战
5.T 零和博弈指参与博弈各方在严格竞争下,一方收益等于另一方损失,博弈各方收益与损失之和恒为零,所以双方不存在合作可能性
6.T 上策均衡是通过严格下策消去法(重复剔除下策)所得到的占优策略,只能有一个纳什均衡
按 等
大猪 按 5,1 4,4
等 9,-1 0,0
纳什均衡为:大猪“按”,小猪“等”,即(按,等)
6、

低价 高价
甲 低价 100,800 50,50
高价 -20,-30 900,600
(1)有哪些结果是纳什均衡?
答:(低价,低价),(高价,高价)
(2)两厂商合作的结果是什么?
B企业
做广告 不做广告
相关文档
最新文档