05第五章 参数估计与假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
•
检验统计量为
Z
( X 1 - X 2 ) - ( m1 - m 2 ) s s n1 n2
2 1 2 2
~ N (0,1)
2014-5-25
14
两个总体均值之差的检验 (s12、 s22 未知但相等,小样本)
1. 2. 3.
检验具有等方差的两个总体的均值 假定条件
两个样本是独立的随机样本 两个总体都是正态分布 两个总体方差未知但相等
均值比较的概念
统计分析常常采取抽样研究的方法,即从总体中随机抽取一 定数量的样本进行研究来推断总体的特性。由于总体中的每 个个体间均存在差异,即使严格遵守随机抽样原则也会由于 多抽到一些数值较大或较小的个体致使样本统计量与总体参 数之间有所不同;又由于实验者测量技术的差别或测量仪器 精确程度的差别等等也会造成一定的偏差,使样本统计量与 总体参数之间存在差异。由此可以得到这样的认识:均值不 相等的两组样本不一定来自均值不同的总体。 能否用样本均值估计总体均值?两个变量均值接近的样本是 否来自均值相同的总体?换句话说,两组样本某变量均值不 同,其差异是否具有统计意义?能否说明总体具有显著性差 异?这是各种研究工作中经常提出的问题。这就要进行均值 比较。
2014-5-25 3
第一节 单一样本T检验
一、 简介 主要用于检验单个变量的均值与假 设检验值(给定的常数)之间是否存在差 异,也可进行单样本的参数区间估计。
二、完全窗口分析
按Analyze—Compare Means—OneSample T Test顺序,打开One-Sample T Test主对话框(如图5--1)
2014-5-25 20
(二)仍以[04-7]的资料来说明,要求检验男生和女 生血红蛋白平均含量是否相等。 1、操作步骤 1)打开数据文件“04-7血红蛋白.sav”。 按Analyze—Compare Means— Independent-Sample T Test顺序,打开主对话框。 2)将变量hb选入 Test Variable框。 3)在sex选入Grouping Variable框中作为检验变量。 4)打开Define Groups对话框,在Group1输入1, Group2输入2,单击Continue,再单击OK。
2014-5-25
22
表5-4
Levene's Test for Equality of Variances
独立样本T检验结果
Ind epend ent Sa mples Test t-test for Equality of Means Sig. (2-tailed) .000 .000 Mean Difference 2.5434 2.5434 Std. Error Difference .5996 .5938 95% Confidence Interval of the Difference Lower Upper 1.3296 3.7571 1.3409 3.7458
第五章 参数估计与假设检验
2014-5-25
1
主要内容
第一节 单一样本T检验 (One-
Sample T Test)
第二节 独立样本T检验
(Independent-Sample T Test)
第三节 配对样本T检验 (Paired-Sample T Test)
2014-5-25
2
均值比较与均值比较的检验过程
30-40
40-50 50-60 60-70
10
12 20 10
合计
60
试构造学生态度得分平均值的98%的置信区间。
2014-5-25 6
(二)以[04-7]的资料来说明。已知另一地区 16-18岁的少年血红蛋白平均值为11.657 (g%),检验这一地区16-18岁少年血红蛋 白平均值是否与另一地区的平均值相等。
2014-5-25 11
两个独立样本均值之差的抽样分布
总体1
s1 m1
s2
m2
总体2
抽取简单随机样 样本容量 n1 计算X1
计算每一对样本
的X1-X2
抽取简单随机样 样本容量 n2 计算X2
所有可能样本 的X1-X2
抽样分布
m1- m2
12
2014-5-25
两个总体均值之差的检验 (s12、 s22 已知)
2014-5-25 10
第二节 独立样本T检验
一、 简介 利用来自两个总体的独立样本,推断两个 总体的均值是否存在显著性差异。如果两个样 本彼此不独立,应使用配对样本T检验(PairedSample T Test)。如果两个样本是从两个总体中 独立地抽取的,即一个样本中的元素与另一个 样本中的元素相互独立,则称为独立样本。 两独立样本的样本容量可以相等,也可以 不相等。 独立样本 T 检验还要求总体服从或近似服 从正态分布。若总体明显不服从正态分布,则 应使用非参数检验过程(Nonparametric test)。
2014-5-25
16
方差齐性检验(Levene F方法): 计算两组样本的均值 计算各个样本与本组均值的平均离差绝对值; 利用单因素方差分析推断两独立总体平均离差绝对值是 否有显著差异。 在对两独立样本进行T检验时,两组样本方差相等和不等 时,计算t值使用的公式不同,所以首先进行方差F检验。 用户需要根据F检验的结果,自己选择t检验输出中的结 果,得出最后结论。如果推断两总体方差相等,则看方 差相等的T检验值和P值;如果推断两总体方差不相等, 则看方差不相等的T检验值和P值。
•
1.假定条件 两个样本是独立的随机样本 两个总体都是正态分布 若不是正态分布, 可以用正态分布来近似(n130和 n230) 2.检验统计量为
Z
( X 1 - X 2 ) - ( m1 - m 2 )
s 12
n1
2 s2
~ N (0,1)
n2
13
2014-5-25
两个总体均值之差的检验 (s12、 s22 未知,大样本)
HB
t -.592
df 39
从表5-2可看出,t值为-0.592,自由度 为39,显著值为0.558,样本均值与检验 值的差为-0.2122,该差值95%的置信区 间是-0.9379~0.5134。
2014-5-25 9
(三)为了解某村1300户农民的年收入状况,不 重复抽取70户家庭进行调查,得出每户农民年 平均收入为4500元,标准差为260元。试求该村 每户农民年平均收入95%的置信区间。 (四)某商品的零售商要求总代理增加广告费支 出,认为如此每星期平均销售量可达20000箱。 总代理增加广告费三个月后想了解平均销售情 况,随机抽取16家零售店调查,发现每星期平 均销售量只有15000箱,标准差为6000箱。假设 销售量服从正态分布,试问平均销售量的下降 是否因偶然因素所致(α=0.01)?
2、结果分析
表5-1 单个样本统计量
One -Samp le St atist ics N HB 40 Mean 11.4448 Std. Deviation 2.2690 Std. Error Mean .3588
表5-1 是血红蛋白值的观测量个数、均值、 标准差和均值的标准误等统计量。
2014-5-25
8
表5-2 单个样本检验
One -Samp le Tes t Test Value = 11.657 Sig. (2-tailed) .558 Mean Difference -.2122 95% Confidence Interval of the Difference Lower Upper -.9379 .5134
图5-5 Independent-Sample T Test的Options对话框
2014-5-25
19
三、例题分析 (一) [05-2] 某一个新的制造过程可以增加电池的 使用寿命,假设电池使用寿命服从正态分布。在新 电池中随机抽15个,而在旧电池中随机抽12个同时 测试其使用寿命,资料如下,试求新旧两种电池平 均寿命之差的95%的置信区间。 新电池(日):18.2,10.4,12.6,18.0,11.7, 15.0,24.0,17.6,23.6,24.8,19.3,20.5, 19.8, 17.1,16.3 旧电池(日):12.1,7.5,8.6,13.9,7.8,15.1, 17.9,10.6,13.8,14.2,15.3,11.6
HB
Equal variances assumed Equal variances not assumed
F .376
Sig. .544
t 4.242 4.283
df 38 37.722
从表5-4可看出,Equal variances assumed 行是假设方 差相等进行的检验,当方差相等时考察这一行的结果; Equal variances not assumed行是假设方差不等进行的检验, 当方差不等时考察这一行的结果。在Levene’s Test for Equality of Variance列中,P值为 0.544>0.05,可认为方差 是相等的,所以应考察第一行的结果。可看出,P值为 0.000<0.05,所以认为均值是不等的。
2014-5-25 4
Test Variables 框:用于 选取需要 分析的变 量
Test Value:输
入已知的 总体均值, 默认值为 0
图5-1 One-Sample T Test主对话框
Missing Values: 在源自文库验变量中含 有缺失值的观测将 不被计算。 在任何一个变量 中含有缺失值的观 测都将不被计算
1. 检验具有不等方差的两
2.
个总体的均值 假定条件
3. 检验统计量
两个样本是独立的随机 样本 两个总体都是正态分布 两个总体方差未知且不 相等s12 s22
2 S12 S2 ( )2 ( X 1 - X 2 ) - ( m1 - m2 ) n1 n2 t ~ t( 2 ) 2 2 2 S1 S2 S1 S2 ( )2 /( n 1) ( )2 /( n2 - 1) 1 n1 n2 n1 n2
2014-5-25
17
二、完全窗口分析 按Analyze—Compare Means—IndependentSample T Test顺序,打开Independent- Sample T Test主对话框(如图5--3)
从源变量框中选取 要作检验的变量。 为分组变量, 只能有一个。
图5—3
2014-5-25
独立样本T检验主对话框
18
分别输入分组变量的取值条 件,如1为男,2为女等。 输入分界点值,如体重60公 斤等。 图5—4 Define Groups 主对话框
输入置信区 间,一般取 90、95、99 等。
在检验变量中含有缺 失值的观测将不被计算。 在任何一个变量中含 有缺失值的观测都将不 被计算
5
Confidence Interval:输 入置信区间, 一般取90、 95、99等。
2014-5-25
图5-2 Options对话框
三、例题分析
(一) [05-1] 某校在对一项教学改革措施的评价 中,随机抽取了60位学生进行态度调查,他们的 10项态度7级量表的态度反应资料见下表:
教学改革态度反应得分(x) 10-20 20-30 人数(f) 2 6
2014-5-25 21
2、结果分析
表5-3 分组统计量
Gro up St atisti cs 1,2 1 2 N 21 19 Mean 12.6529 10.1095 Std. Deviation 2.0531 1.6989 Std. Error Mean .4480 .3898
HB
表5-3 是血红蛋白值的观测量个数、均值、标准差和均 值的标准误等统计量。
1、操作步骤 1)(打开数据文件“04-7血红蛋白.sav”。) 按Analyze—Compare Means—One Sample T Test顺序,打开主对话框。 2)将变量hb选入 Test Variable框。 3)在Test Value中输入 11.657,后单击OK。
2014-5-25 7
检验统计量
( X 1 - X 2 ) - (m1 - m2 ) t ~ t (n1 n2 - 2) 1 1 Sp n1 n2
2 2 ( n 1) S ( n 1) S 2 1 1 2 2 S 其中: p n1 n2 - 2
2014-5-25
15
两个总体均值之差的检验 (s12、 s22 未知且不相等,小样本)