您所在位置: 网站首页 / 07第七章 对策论.pdf / 文档详情
07第七章 对策论.pdf 立即下载
2024-11-18
约2.2万字
约13页
0
举报 版权申诉
预览加载中,请您耐心等待几秒...

07第七章 对策论.pdf

07第七章对策论.pdf

预览

免费试读已结束,剩余 8 页请下载文档后查看

10 金币

下载文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第七章对策论

§1引言
社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾,应用科学的方法来
解决这样的问题开始于17世纪的科学家,如C.,Huygens和W.,Leibnitz等。现代对
策论起源于1944年J.,VonNeumann和O.,Morgenstern的著作《TheoryofGamesand
EconomicBehavior》。
对策论亦称竞赛论或博弈论。是研究具有斗争或竞争性质现象的数学理论和方法。
一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。对策论发展
的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常
生活等有着密切的联系,并且处理问题的方法又有明显特色。所以日益引起广泛的注意。
在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为。具有竞争或对
抗性质的行为称为对策行为。在这类行为中。参加斗争或竞争的各方各自具有不同的目
标和利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并
力图选取对自己最为有利或最为合理的方案。对策论就是研究对策行为中斗争各方是否
存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。

§2对策问题
对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的
努力而是各方所采取的策略的综合结果。
先考察一个实际例子。
例1(囚徒的困境)警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大
量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个
人都知道:如果他们双方都不供认,将被以持有大量伪币罪被各判刑18个月;如果双
方都供认伪造了钱币,将各被判刑3年;如果一方供认另一方不供认,则供认方将被从
宽处理而免刑,但另一方面将被判刑7年。将嫌疑犯A、B被判刑的几种可能情况列
于表1。
表1
嫌疑犯B
供认不供认
供认(3,3)(0,7)
嫌疑犯A
不供认(7,0)(1.5,1.5)

表1中每对数字表示嫌疑犯A、B被判刑的年数。如果两名疑犯均担心对方供认并希
望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。
从这一简单实例中可以看出对策现象中包含有的几个基本要素。
2.1对策的基本要素
(i)局中人
在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局
中人。通常用I表示局中人的集合.如果有n个局中人,则I={1,2,L,n}。一般要求
一个对策中至少要有两个局中人。在例1中,局中人是A、B两名疑犯。
(ii)策略集
一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参

加对策的每一局中人i,i∈I,都有自己的策略集Si。一般,每一局中人的策略集中
至少应包括两个策略。
-154-
(iii)赢得函数(支付函数)

在一局对策中,各局中人所选定的策略形成的策略组称为一个局势,即若si是第i
个局中人的一个策略,则n个局中人的策略组

s=(s1,s2,L,sn)
就是一个局势。全体局势的集合S可用各局中人策略集的笛卡尔积表示,即

S=S1×S2×L×Sn
当局势出现后,对策的结果也就确定了。也就是说,对任一局势,s∈S,局中人

i可以得到一个赢得Hi(s)。显然,Hi(s)是局势s的函数,称之为第i个局中人的赢
得函数。这样,就得到一个向量赢得函数。
H(s)=(H1(s),L,Hn(s))
本节我们只讨论有两名局中人的对策问题,其结果可以推广到一般的对策模型中
去。
2.2零和对策(矩阵对策)
零和对策是一类特殊的对策问题。在这类对策中,只有两名局中人,每个局中人都
只有有限个策略可供选择。在任一纯局势下,两个局中人的赢得之和总是等于零,即双
方的利益是激烈对抗的。
设局中人Ⅰ、Ⅱ的策略集分别为
,
S1={α1,L,αm}S2={β1,L,βn}

当局中人Ⅰ选定策略αi和局中人Ⅱ选定策略βj后,就形成了一个局势(αi,βj),可见

这样的局势共有mn个。对任一局势(αi,βj),记局中人Ⅰ的赢得值为aij,并称

⎡a11a12La1n⎤
⎢⎥
a21a22La2n
A=⎢⎥
⎢LLLL⎥
⎢⎥
⎣am1am2Lamn⎦
为局中人Ⅰ的赢得矩阵(或为局中人Ⅱ的支付矩阵)。由于假定对策为零和的,故局中
人Ⅱ的赢得矩阵就是−A。

当局中人Ⅰ、Ⅱ和策略集S1、S2及局中人Ⅰ的赢得矩阵A确定后,一个零和对策
就给定了,零和对策又可称为矩阵对策并可简记成

G={S1,S2;A}。

例2设有一矩阵对策G={S1,S2;A},其中S1={α1,α2,α3},

S2={β1,β2,β3,β4},
⎡12−630−22⎤
A=⎢1421810⎥
⎢⎥
⎣⎢−60−1016⎦⎥

从A中可以看出,若局中人Ⅰ
查看更多
单篇购买
VIP会员(1亿+VIP文档免费下)

扫码即表示接受《下载须知》

07第七章 对策论

文档大小:

限时特价:扫码查看

• 请登录后再进行扫码购买
• 使用微信/支付宝扫码注册及付费下载,详阅 用户协议 隐私政策
• 如已在其他页面进行付款,请刷新当前页面重试
• 付费购买成功后,此文档可永久免费下载
全场最划算
12个月
199.0
¥360.0
限时特惠
3个月
69.9
¥90.0
新人专享
1个月
19.9
¥30.0
24个月
398.0
¥720.0
6个月会员
139.9
¥180.0

6亿VIP文档任选,共次下载特权。

已优惠

微信/支付宝扫码完成支付,可开具发票

VIP尽享专属权益

VIP文档免费下载

赠送VIP文档免费下载次数

阅读免打扰

去除文档详情页间广告

专属身份标识

尊贵的VIP专属身份标识

高级客服

一对一高级客服服务

多端互通

电脑端/手机端权益通用