商务与经济统计课件 (2)

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

接下来计算误差边际 1 95%, z /2 1.96
z z z / 2 x1x2
/ 2 x1 x2
/2
s12 s22 n1 n2
1.96 92 122 4.06 36 49
得到总体均值之差的95%的置信区间为5±4.06 即（0.94,9.04）岁

左侧检验
H0 H
: :
1 1

2 2

0 0

右侧检验
H0 H
: :
1 1

2 2

0 0

双侧检验
STAT
2、确定检验统计量（Z统计量）
Z (x1 x2 ) (1 2 )
12

2 2
n1 n2
3、根据给定的显著性水平，查标准正态分布表得临界值
s2( 1 1 ) n1 n2
先计算方差 2的合并估计值：
s2 (n1 1)s12 (n2 1)s22 11 402 11 442 1768
n1 n2 2
22
STAT
t (x1 x2 ) (1 2 )
s2( 1 1 ) n1 n2
STAT
假定现在抽取了6个工人组成一个简单随机样本，每个工人都提供一对数据值如下表：
工人
1 2 3 4 5 6
第一种方法
6.0 5.0 7.0 6.2 6.0 6.4
第二种方法
5.4 5.2 6.5 5.9 6.0 5.8
完成时间差异d
0.6 -0.2 0.5 0.3
0 0.6
我们想检验两种方法的完成时间有无差异，实际上就等同于检验上表第三列数据（完成时间差异）的均值是否等于0，若等于 0即没有差异，若不等于0，就有差异。
例：为了评价某种新软件包的优点，随机抽取24个系统分析人员组成样本，要求其中的12个分析人员用现有的技术来开发该信息系统，另外12个分析人员使用新的软件包来开发该信息系
统。假定表示 1 是使用现有技术的系统分析人员完成项目所需要的平均时间， 2 是使用新软件包的系统分析人员完成项目所
需要的平均时间。
n1 n2 2
20
STAT
则有：标准差的对应估计值为
s x1x2
s2

1 n1

1 n2

18855

1 12

1 10

58.79
当α=0.10时，查t分布表可得 t (20) t0.05 (20) 1.725 。
因此，区间估计为：
2
x1 x2 t 2 (n1 n2 2)sx1x2 (1000 920) 1.725 58.79 80 101.41
5%, z /2 1.96
z 2.47 z /2 =1.96,拒绝H0,即可以认为两个地区的顾客的平均年龄有显著差异。
练习：P309,T13
10.2.2小样本情况下
STAT
如第一节所讨论，小样本情况下，两个总体均值之差的分布与自由度为n1+n2-2的t分布相关。
假定两个总体服从正态分布且方差相等。
1 -2的区间估计小样本（n1<30或/和n2<30）,1、 2未知
x1 x2 t 2(n1 n2 2)sx1x2
[例2] 对克利夫兰国家银行的两个支行顾客的独立随机样本的账户余额进行核查得到下面的结果：
STAT
支行
A B
被抽取的账户数
n1 12 n2 10
样本平均余额
40 35 2.16 1768( 1 1 )
12 12
右侧检验拒绝域为： t t , 拒绝H0。
5%, t0.05(22) 1.717
t 2.16 t0.05 =1.717, 拒绝H0,即可以认为新软件包能够能够缩短项目所需的平均时间。
10.3 两个总体均值差异的推断：匹配样本 STAT
STAT
令： p1、p2表示总体1、2中错误报单的比例。 p1、p2表示样本1、2中错误报单的比例。
假设来自于两个办事处的独立随机样本提供了下面信息：
办事处1 n1 250 错误申报单数量m1 35
办事处2 n2 300 错误申报单数量m2 27
H0 : 1 2 0 H : 1 2 0
STAT
在样本的抽取时有两种备选方案：（1）独立样本：抽取工人组成一个简单随机样本，每个工都采用第一种方法；再独立抽取工人组成另一个简单随机样本，每个工人都采用第二种方法；如前一节的内容。（2）匹配样本：抽取工人组成一个简单随机样本，每个工人都先使用一种方法，然后再使用另外一种方法。分配给每个工人的方法的顺序是随机的。匹配样本方案下产生的抽样误差比独立样本方案的误差小。
即（-21.41，181.41）
10.2 两个总体均值差异的假设检验：独立S样TA本T
两个总体均值差异的假设检验和单个总体均值的假设检验的过程基本相似，我们也分大样本和小样本来讨论
10.2.1 大样本情况下
运算步骤：
1、建立零假设和备择假设
H0 H
: :
1 1

2 2

0 0

该例是对研究性假设进行检验，根据提出零假设和备择假设的
原理，研究性假设常作为备择假设，也就是 H : 1 2 0
STAT
解：建立零假设和备择假设
H0 H
: :
1 1

2 2

0 0

右侧检验
小样本情况下的检验统计量：
t (x1 x2 ) (1 2 )
STAT
STAT
10.1.3 1-2的区间估计：小样本情况下
当某一个样本容量小于30或两个样本容量同时小于30时
假设:
(1)两个总体都服从正态分布；
(2)两个总体方差相等。
2 2

2 2

2
此时
x1x2

2 1

2 2

n1 n2
2( 1 1 )
n1 n2
STAT
当总体方差未知时，我们不再对两个总体的方差进行单独
重点：均值比较的区间估计法；均值比较的假设检验；比例比较的区间估计法；比例比较的假设检验；
STAT
难点：有关公式的理解，特别是两总体联合方差的表达形式
10.1 两个总体均值差异的估计：独立样本STAT
10.1.1 x1 x2 的抽样分布
E ( x1 x2 ) 1 2
t d d 0.3 2.19
sd / n 0.335 / 6
当 0.05,可查t分布表得t0.025 (5) 2.571
t 2.19 t0.025 2.571,落入接受域，不能拒绝H0。即可以认为两种生产方法的完成时间没有差异。
10.4两个总体比例之差的推断

2 1

2 2
n1 n2
s x1x2
s12 n1

s22 n2
,12、 22未知时
1-2的区间估计：大样本,1、 2未知
x1 x2 z s2 x1x2
STAT
[例1]下表是某商店从光顾市中心商店和郊区商店的顾客中抽取的样本数据：
商店市中心商店郊区商店
被抽样的顾客数
STAT
令 d 表示“工人总体中差异值的平均数”，则可将原来
的假设改成：
H0 : d 0 H : d 0
d d 1.8 / 6 0.3
n
sd
(d d )2 0.56 0.335
n 1
5
本例属小样本情况下的双侧检验。
STAT
计算检验统计量的值：
建立零假设和备择假设
H0 : 1 2 0 H : 1 2 0
确定检验统计量（Z统计量）
Z (x1 x2 ) (1 2 )
s12 s22 n1 n2
40 35 5 2.42 92 102 2.07 36 49
STAT
双侧检验的拒绝域为： z z / 2或z z / 2
两个总体的参数估计与检验
生活中的统计
STAT
经常需要对两个班级同一学科考试平均成绩进行比较而不计较成绩的绝对高低；又如：对男女两组人群进行肺活量大小的比较以鉴别二者是否存在显著差异但也不计较每组人群肺活量的绝对高低等等问题都属于均值的比较问题；两个班一场考试之后的及格率需要比较；两批同样生产线不同操作流程或不同生产者生产出来的产品出厂前的合格率需要比较；饲养同样品种但方法有所不同的动物的死亡率或生存率也需要比较。从某种意义上说，比例的比较问题就是均值的比较问题，后者是前者的特例，但侧重点又有所不同，值得单独加以研究。
STAT
两个总体比例之差的推断和检验分别与两个总体的均值之差的推断与检验的方法大致相同
适用于来自两个总体的独立、随机样本。两个总体比例之差的点估计量： p1 p2 10.4.1 p1 p2的抽样分布期望值： E( p1 p2 ) p1 p2
标准差 p1 p2
p1(1 p1) p2 (1 p2 )
n1
n2
STAT
在大样本的情况下，p1 p2的抽样分布为正态分布。
10.4.2 p1 p2的区间估计
某税务准备公司对比较他的两个地区性办事处的工作质量非常感兴趣。通过随机地从每个办事处准备的纳税申报单中抽取样本，对纳税申报单样本的准确率进行检查，公司就能够对每个办事处准备的申报单中错误的申报单比例进行估计，特别感兴趣的是两个比例之差。现在想在90%的置信度下对其进行估计。
估计而直接估计 2
将两个样本的数据结合起来可以提供一个总体方差 2的估计
s2 (n1 1)s12 (n2 1)s22 n1 n2 2
当

2 1

2 2

2
x1x2的点估计为
s x1x2
s2( 1 1 ) n1 n2
STAT
小样本情况下，用t分布来估计两个总体均值之间的差异，此时自由度为n1+n2-2，
STAT
负责新软件评估项目的研究人员希望可以证明名新软件包将能够缩短完成项目所需要的平均时间。假定该项评估在0.05的显著性水平下进行，并假定两个总体的方差相等。
根据记录、整理，两个组的数据如下：
n1 1 2
n2 12
x1 325小时 s1 4 0
x 2 288小时 s2 44
假定某个生产公司的职员可以通过两种方法来完成某一项生产任务。为了使产量最大化，公司想知道使用哪一种方法能够使
完成单件产品所需要的时间较短。令 1表示“采用第一种生产方法完成生产任务所需的平均时间”，2 表示“采用第二种生
产方法完成生产任务所需的平均时间”。由于没有先验数据，我们可以尝试性的假设两种生产方法完成任务所需的时间相同。由此可建立零假设和备择假设：
x1 1000美元 x2 920美元
样本标准差
s1 150美元
s2 120美元
用这些数据来建立两个支行账户余额样本均值差异的置信度是 90%的置信区间。假定两个支行检察账户余额服从正态分布，且两个支行检察账户余额的方差相等。
解：首先将两个样本的方差合并得到总体方差的合并估计：
s2 (n1 1)s12 (n2 1)s22 111502 9 1202 18855

2 ( x1
x2 )

2 1
n1

2 2
Hale Waihona Puke Baidu
n2
两个总体均值之差的抽样分布的形式：
如果两个总体的样本大小都足够大，可以以正态分布来近似。
STAT
10.1.2
1-2的区间估计：大样本情况下且1、 2已知
x1 x2 z 2 x1x2
x1x2 的点估计
x1x2
n1 36 n2 49
样本平均年龄
x1 40岁 x2 35岁
样本的标准差
s1 9岁
s2 10岁
试对两个不同区域的顾客年龄之差做出置信水平为95%的区间估计。解：依据区间估计的一般原理以及 x1 x 2的抽样分布
首先计算点估计的值 x1 x 2 = 4 0 - 3 5 = 5 岁
4、根据拒绝准则进行判断，是否接受零假设。
左侧检验：z z ,拒绝H0。右侧检验：z z , 拒绝H0。
双侧检验：z z /2或z z /2 , 拒绝H0。
STAT
以前面的例1，试在5%显著性水平下检验两个不同地区之间的顾客平均年龄是否存在差异。
n1 36 n2 49 x1 40岁 x2 35岁 s1 9岁 s2 10岁