商务与经济统计课件 (2)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
接下来计算误差边际 1 95%, z /2 1.96
z z z / 2 x1x2
/ 2 x1 x2
/2
s12 s22 n1 n2
1.96 92 122 4.06 36 49
得到总体均值之差的95%的置信区间为5±4.06 即(0.94,9.04)岁
左侧检验
H0 H
: :
1 1
2 2
0 0
右侧检验
H0 H
: :
1 1
2 2
0 0
双侧检验
STAT
2、确定检验统计量(Z统计量)
Z (x1 x2 ) (1 2 )
12
2 2
n1 n2
3、根据给定的显著性水平,查标准正态分布表得临界值
s2( 1 1 ) n1 n2
先计算方差 2的合并估计值:
s2 (n1 1)s12 (n2 1)s22 11 402 11 442 1768
n1 n2 2
22
STAT
t (x1 x2 ) (1 2 )
s2( 1 1 ) n1 n2
STAT
假定现在抽取了6个工人组成一个简单随机样本,每个工 人都提供一对数据值如下表:
工人
1 2 3 4 5 6
第一种方法
6.0 5.0 7.0 6.2 6.0 6.4
第二种方法
5.4 5.2 6.5 5.9 6.0 5.8
完成时间差异d
0.6 -0.2 0.5 0.3
0 0.6
我们想检验两种方法的完成时间有无差异,实际上就等同于检 验上表第三列数据(完成时间差异)的均值是否等于0,若等于 0即没有差异,若不等于0,就有差异。
例:为了评价某种新软件包的优点,随机抽取24个系统分析人 员组成样本,要求其中的12个分析人员用现有的技术来开发该 信息系统,另外12个分析人员使用新的软件包来开发该信息系
统。假定表示 1 是使用现有技术的系统分析人员完成项目所需 要的平均时间, 2 是使用新软件包的系统分析人员完成项目所
需要的平均时间。
n1 n2 2
20
STAT
则有:标准差的对应估计值为
s x1x2
s2
1 n1
1 n2
18855
1 12
1 10
58.79
当α=0.10时,查t分布表可得 t (20) t0.05 (20) 1.725 。
因此,区间估计为:
2
x1 x2 t 2 (n1 n2 2)sx1x2 (1000 920) 1.725 58.79 80 101.41
5%, z /2 1.96
z 2.47 z /2 =1.96,拒绝H0,即可以认为两个地区 的顾客的平均年龄有显著差异。
练习:P309,T13
10.2.2小样本情况下
STAT
如第一节所讨论,小样本情况下,两个总体均值之差的分布与 自由度为n1+n2-2的t分布相关。
假定两个总体服从正态分布且方差相等。
1 -2的区间估计 小样本(n1<30或/和n2<30),1、 2未知
x1 x2 t 2(n1 n2 2)sx1x2
[例2] 对克利夫兰国家银行的两个支行顾客的独立随机样本的 账户余额进行核查得到下面的结果:
STAT
支行
A B
被抽取的账户数
n1 12 n2 10
样本平均余额
40 35 2.16 1768( 1 1 )
12 12
右侧检验拒绝域为: t t , 拒绝H0。
5%, t0.05(22) 1.717
t 2.16 t0.05 =1.717, 拒绝H0,即可以认为新软件包 能够能够缩短项目所需的平均时间。
10.3 两个总体均值差异的推断:匹配样本 STAT
STAT
令: p1、p2表示总体1、2中错误报单的比例。 p1、p2表示样本1、2中错误报单的比例。
假设来自于两个办事处的独立随机样本提供了下面信息:
办事处1 n1 250 错误申报单数量m1 35
办事处2 n2 300 错误申报单数量m2 27
H0 : 1 2 0 H : 1 2 0
STAT
在样本的抽取时有两种备选方案: (1)独立样本:抽取工人组成一个简单随机样本,每个工 都采用第一种方法;再独立抽取工人组成另一个简单随机样本, 每个工人都采用第二种方法;如前一节的内容。 (2)匹配样本:抽取工人组成一个简单随机样本,每个工 人都先使用一种方法,然后再使用另外一种方法。分配给每个 工人的方法的顺序是随机的。 匹配样本方案下产生的抽样误差比独立样本方案的误差小。
即(-21.41,181.41)
10.2 两个总体均值差异的假设检验:独立S样TA本T
两个总体均值差异的假设检验和单个总体均值的假设检验的过 程基本相似,我们也分大样本和小样本来讨论
10.2.1 大样本情况下
运算步骤:
1、建立零假设和备择假设
H0 H
: :
1 1
2 2
0 0
该例是对研究性假设进行检验,根据提出零假设和备择假设的
原理,研究性假设常作为备择假设,也就是 H : 1 2 0
STAT
解:建立零假设和备择假设
H0 H
: :
1 1
2 2
0 0
右侧检验
小样本情况下的检验统计量:
t (x1 x2 ) (1 2 )
STAT
STAT
10.1.3 1-2的区间估计:小样本情况下
当某一个样本容量小于30或两个样本容量同时小于30时
假设:
(1)两个总体都服从正态分布;
(2)两个总体方差相等。
2 2
2 2
2
此时
x1x2
2 1
2 2
n1 n2
2( 1 1 )
n1 n2
STAT
当总体方差未知时,我们不再对两个总体的方差进行单独
重点:均值比较的区间估计法; 均值比较的假设检验; 比例比较的区间估计法; 比例比较的假设检验;
STAT
难点:有关公式的理解,特别是两总体联合方差的表 达形式
10.1 两个总体均值差异的估计:独立样本STAT
10.1.1 x1 x2 的抽样分布
E ( x1 x2 ) 1 2
t d d 0.3 2.19
sd / n 0.335 / 6
当 0.05,可查t分布表得t0.025 (5) 2.571
t 2.19 t0.025 2.571,落入接受域,不能拒绝H0。 即可以认为两种生产方法的完成时间没有差异。
10.4两个总体比例之差的推断
2 1
2 2
n1 n2
s x1x2
s12 n1
s22 n2
,12、 22未知时
1-2的区间估计:大样本,1、 2未知
x1 x2 z s2 x1x2
STAT
[例1]下表是某商店从光顾市中心商店和郊区商店的顾客中抽取 的样本数据:
商店 市中心商店 郊区商店
被抽样的顾客数
STAT
令 d 表示“工人总体中差异值的平均数”,则可将原来
的假设改成:
H0 : d 0 H : d 0
d d 1.8 / 6 0.3
n
sd
(d d )2 0.56 0.335
n 1
5
本例属小样本情况下的双侧检验。
STAT
计算检验统计量的值:
建立零假设和备择假设
H0 : 1 2 0 H : 1 2 0
确定检验统计量(Z统计量)
Z (x1 x2 ) (1 2 )
s12 s22 n1 n2
40 35 5 2.42 92 102 2.07 36 49
STAT
双侧检验的拒绝域为: z z / 2或z z / 2
两个总体的参数估计与检验
生活中的统计
STAT
经常需要对两个班级同一学科考试平均成绩进行比较 而不计较成绩的绝对高低;又如:对男女两组人群进 行肺活量大小的比较以鉴别二者是否存在显著差异但 也不计较每组人群肺活量的绝对高低等等问题都属于 均值的比较问题;两个班一场考试之后的及格率需要 比较;两批同样生产线不同操作流程或不同生产者生 产出来的产品出厂前的合格率需要比较;饲养同样品 种但方法有所不同的动物的死亡率或生存率也需要比 较。从某种意义上说,比例的比较问题就是均值的比 较问题,后者是前者的特例,但侧重点又有所不同, 值得单独加以研究。
STAT
两个总体比例之差的推断和检验分别与两个总体的均值之 差的推断与检验的方法大致相同
适用于来自两个总体的独立、随机样本。 两个总体比例之差的点估计量: p1 p2 10.4.1 p1 p2的抽样分布 期望值: E( p1 p2 ) p1 p2
标准差 p1 p2
p1(1 p1) p2 (1 p2 )
n1
n2
STAT
在大样本的情况下,p1 p2的抽样分布为正态分布。
10.4.2 p1 p2的区间估计
某税务准备公司对比较他的两个地区性办事处的工作质量非常 感兴趣。通过随机地从每个办事处准备的纳税申报单中抽取样 本,对纳税申报单样本的准确率进行检查,公司就能够对每个 办事处准备的申报单中错误的申报单比例进行估计,特别感兴 趣的是两个比例之差。现在想在90%的置信度下对其进行估计。
估计而直接估计 2
将两个样本的数据结合起来可以提供一个总体方差 2的估计
s2 (n1 1)s12 (n2 1)s22 n1 n2 2
当
2 1
2 2
2
x1x2的点估计为
s x1x2
s2( 1 1 ) n1 n2
STAT
小样本情况下,用t分布来估计两个总体均值之间的差异, 此时自由度为n1+n2-2,
STAT
负责新软件评估项目的研究人员希望可以证明名新软件包将能 够缩短完成项目所需要的平均时间。假定该项评估在0.05的显 著性水平下进行,并假定两个总体的方差相等。
根据记录、整理,两个组的数据如下:
n1 1 2
n2 12
x1 325小 时 s1 4 0
x 2 288小时 s2 44
假定某个生产公司的职员可以通过两种方法来完成某一项生产 任务。为了使产量最大化,公司想知道使用哪一种方法能够使
完成单件产品所需要的时间较短。令 1表示“采用第一种生产 方法完成生产任务所需的平均时间”,2 表示“采用第二种生
产方法完成生产任务所需的平均时间”。由于没有先验数据, 我们可以尝试性的假设两种生产方法完成任务所需的时间相同。 由此可建立零假设和备择假设:
x1 1000美元 x2 920美元
样本标准差
s1 150美元
s2 120美元
用这些数据来建立两个支行账户余额样本均值差异的置信度是 90%的置信区间。假定两个支行检察账户余额服从正态分布,且 两个支行检察账户余额的方差相等。
解:首先将两个样本的方差合并得到总体方差的合并估计:
s2 (n1 1)s12 (n2 1)s22 111502 9 1202 18855
2 ( x1
x2 )
2 1
n1
2 2
Hale Waihona Puke Baidu
n2
两个总体均值之差的抽样分布的形式:
如果两个总体的样本大小都足够大,可以以正态分布来近似。
STAT
10.1.2
1-2的区间估计:大样本情况下且1、 2已知
x1 x2 z 2 x1x2
x1x2 的点估计
x1x2
n1 36 n2 49
样本平均年龄
x1 40岁 x2 35岁
样本的标准差
s1 9岁
s2 10岁
试对两个不同区域的顾客年龄之差做出置信水平为95%的区间 估计。 解:依据区间估计的一般原理以及 x1 x 2的 抽 样 分 布
首先计算点估计的值 x1 x 2 = 4 0 - 3 5 = 5 岁
4、根据拒绝准则进行判断,是否接受零假设。
左侧检验:z z ,拒绝H0。 右侧检验:z z , 拒绝H0。
双侧检验:z z /2或z z /2 , 拒绝H0。
STAT
以前面的例1,试在5%显著性水平下检验两个不同地区之 间的顾客平均年龄是否存在差异。
n1 36 n2 49 x1 40岁 x2 35岁 s1 9岁 s2 10岁