体育统计方法与实例第五章 假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
解:输入数据,变量名为“铅球成绩”。 步骤1:选择“分析” →“描述统计” → “探索”命令,弹出“探索”对话框。
SPSS演示
步骤2:选择“铅球成绩” 到“因变量列表(D)”框中。 步骤3:单击“统计量”按钮,选择 “描述性”选项,定义区间范围,
单击“继续”按钮,返回“探索”对话框。其它选项一般不用 更改,使用默认设置即可。
1
统计方法
描述统计
推断统计
参数估计
假设检验
学习目标: 目标1 了解抽样分布的概念 目标2 掌握抽样误差的计算 目标3 熟悉点估计和区间估计的原理
5.1.1 抽样分布
数据的分布
总体分布 样本分布 抽样分布
抽样误差:由抽样引起的样本统计量与总体参数之间 或样本统计量之间的差异。
如果从均数为 ,方差为 (有限)的任意一个总体
5.1.2 参数估计
1.点估计
常用的最佳样本估计量
总体指标(参数)
样本指标(统计量)
总体平均数
总体方差 2
总体率
样本平均数 x
样本方差 S 2
样本率
2.区间估计
区间估计是根据抽样误差的大小,并给予一定的概率,来 估计未知参数所在的可能范围,称为总体参数的可信区间或置 信区间,符号CI。
预先给定的概率称为可信度或置信度,符号 称为置信区间的显著性水平。
试估计其抽样误差和总体均数的95%置信区间? 解:计算: 查t值表 抽样误差大小即标准误,采用公式5-1-2计算:
因为总体标准差未知,n<100,计算:
即某市高一年级男生的铅球成绩总体均数的95%置信区间为(7.9737,8.2057)。
(2)当
时,采用u分布理论(正态分布)
x
u 当n充分大时,t分布近拟正态分布,统计量可选择: S
✓ 逻辑上运用反正法; ✓ 统计上依据小概率原理。
小概率原理:发生概率很小的随机事件在一次试验中是几
乎不可能发生的。小概率P<5%。
假设检验的四个步骤:
(1)建立假说:提出差异不具有显著性的原假设(H0) 和差异具有显著性的备择假设(H1)。
(2)计算检验统计量。 (3)根据统计检验要求确定小概率值。 (4)进行统计推断。如结果没有出现小概率事件,就接受
解:因
,总体均数的99%置信区间 =(15.11,15.49)
即该校17岁女生100米跑平均成绩的99%置信区间为(15.11,15.49)。
5.1.5 总体率的区间估计
在
的情况下,样本率p的抽样分布服从u分布理论(正态分布)。
统计量可选择:
总体率的
置信区间为:
简记为:
[例5-1-4] 随机抽取学院200名学生参加体质测试,达到合格率为97%, 试求该学院学生体测合格率的95%置信区间?
原假设(H0);如果结果相反,就拒绝原假设(H0), 接受备择假设(H1)。
单侧检验
双侧检验
两类错误
α类错误:也称为弃真,即拒绝了正确的原假设(H0), 如显著度标准定高了,该接受的没被接受, 即被认为是小概率事件而被拒绝了。
β类错误:也称为纳伪,即接受了错误的原假设(H0), 如显著度标准定低了,不该接受的被接受了, 即被认为是大概率事件而接受了。
Hale Waihona Puke Baidu
[例5-1-1] 采用不重复抽样,从某市随机抽取15名16岁男生身高(单位:
cm)为:152、160、148、155、157、150、159、160、159、160、
158、153、154、155、157 试估计抽样误差?
解:先计算出平均数: 标准差: 由公式5-1-1计算均数的标准误
即由抽样引起的样本均数与总体均数的误差估计值为0.982cm。
x
总体均数的 (1 )% 置信区间为:
x
u / 2
S x
x
u / 2
S x
u分布的95%和99%的临界值可知
u0.01/ 2 2.58
总体均数的95%置信区间为: 总体均数的99%置信区间为:
[例5-1-3] 随机抽取某校120名17岁女生100米跑平均成绩为15.3秒,标准差为 0.8秒,试求该校17岁女生100米跑平均成绩的99%置信区间?
学习目标: 目标1 理解单样本t检验的条件 目标2 熟悉单样本t检验的检验过程 目标3 能够熟练运用SPSS进行单样本t检验
不同自由度的 t 分布
单侧:t的临界值为:
t (df ) IDF.T( ,df )
双侧:例如当自由度为10,概 率为0.05时,t的双侧临界值 为-2.228
5.1.4 总体均数的区间估计
(1)当n<100时,采用t分布理论
总体均数的95%置信区间为: 总体均数的99%置信区间为:
[例5-1-2] 从某市高一年级随机抽取36名男生的铅球成绩(单位:m),数据如下:
解:已知 率的标准误为:
总体率的95%置信区为:
=(94.64%,99.36%)
即该学院学生合格率的95%置信区间为(94.64%,99.36%) 。结果表 明有95%的把握可认为该学院学生体测合格率在94.64%~99.36%之间。
5.1.6 区间估计的SPSS例解
[例5-1-5]从某市高一年级随机抽取36名男生的铅球成绩(单位:m),数据见 [例5-1-2],试估计其抽样误差和总体均数的95%置信区间?
通常把 取为0.10、0.05或0.01,即可信度取为90%、95% 或99%。
5.1.3 t分布
当样本含量n充分大时,其均数近似服从正态分布,即 x ~ N (, 2 ) x
统计量
的分布将服从以自由度的
分布,则
统计量
服从t 分布,即
公式5-1-2
自由度df越大, 分布与正态分布出入就越小
t 分布与正态分布的比较
中抽取样本含量为n的所有样本,只要样本含量足够大
时
,由中心极限定理可知,样本均数的分布近似服
从均数为 ,方差 为 的正态分布。
为样本均数的
标准误(标准误 的估计值)
SS
x
n
公式5-1-1
为样本标准差 为样本含量
影响抽样误差的因素: (1)原总体个体的分散性; (2)样本含量的大小; (3)抽样方法和抽样的组织方式。
结果与分析
学习目标: 目标1 理解假设检验的基本原理 目标2 熟悉假设检验的四个步骤 目标3 了解常用假设检验方法
假设检验的小概率事件原理
假设检验:简而言之,就是先假设总体具有什么特征,然后 从总体中抽出一个样本,根据这个随机样本的特征来检验所 提出的假设是否成立。
假设检的特征:
SPSS演示
步骤2:选择“铅球成绩” 到“因变量列表(D)”框中。 步骤3:单击“统计量”按钮,选择 “描述性”选项,定义区间范围,
单击“继续”按钮,返回“探索”对话框。其它选项一般不用 更改,使用默认设置即可。
1
统计方法
描述统计
推断统计
参数估计
假设检验
学习目标: 目标1 了解抽样分布的概念 目标2 掌握抽样误差的计算 目标3 熟悉点估计和区间估计的原理
5.1.1 抽样分布
数据的分布
总体分布 样本分布 抽样分布
抽样误差:由抽样引起的样本统计量与总体参数之间 或样本统计量之间的差异。
如果从均数为 ,方差为 (有限)的任意一个总体
5.1.2 参数估计
1.点估计
常用的最佳样本估计量
总体指标(参数)
样本指标(统计量)
总体平均数
总体方差 2
总体率
样本平均数 x
样本方差 S 2
样本率
2.区间估计
区间估计是根据抽样误差的大小,并给予一定的概率,来 估计未知参数所在的可能范围,称为总体参数的可信区间或置 信区间,符号CI。
预先给定的概率称为可信度或置信度,符号 称为置信区间的显著性水平。
试估计其抽样误差和总体均数的95%置信区间? 解:计算: 查t值表 抽样误差大小即标准误,采用公式5-1-2计算:
因为总体标准差未知,n<100,计算:
即某市高一年级男生的铅球成绩总体均数的95%置信区间为(7.9737,8.2057)。
(2)当
时,采用u分布理论(正态分布)
x
u 当n充分大时,t分布近拟正态分布,统计量可选择: S
✓ 逻辑上运用反正法; ✓ 统计上依据小概率原理。
小概率原理:发生概率很小的随机事件在一次试验中是几
乎不可能发生的。小概率P<5%。
假设检验的四个步骤:
(1)建立假说:提出差异不具有显著性的原假设(H0) 和差异具有显著性的备择假设(H1)。
(2)计算检验统计量。 (3)根据统计检验要求确定小概率值。 (4)进行统计推断。如结果没有出现小概率事件,就接受
解:因
,总体均数的99%置信区间 =(15.11,15.49)
即该校17岁女生100米跑平均成绩的99%置信区间为(15.11,15.49)。
5.1.5 总体率的区间估计
在
的情况下,样本率p的抽样分布服从u分布理论(正态分布)。
统计量可选择:
总体率的
置信区间为:
简记为:
[例5-1-4] 随机抽取学院200名学生参加体质测试,达到合格率为97%, 试求该学院学生体测合格率的95%置信区间?
原假设(H0);如果结果相反,就拒绝原假设(H0), 接受备择假设(H1)。
单侧检验
双侧检验
两类错误
α类错误:也称为弃真,即拒绝了正确的原假设(H0), 如显著度标准定高了,该接受的没被接受, 即被认为是小概率事件而被拒绝了。
β类错误:也称为纳伪,即接受了错误的原假设(H0), 如显著度标准定低了,不该接受的被接受了, 即被认为是大概率事件而接受了。
Hale Waihona Puke Baidu
[例5-1-1] 采用不重复抽样,从某市随机抽取15名16岁男生身高(单位:
cm)为:152、160、148、155、157、150、159、160、159、160、
158、153、154、155、157 试估计抽样误差?
解:先计算出平均数: 标准差: 由公式5-1-1计算均数的标准误
即由抽样引起的样本均数与总体均数的误差估计值为0.982cm。
x
总体均数的 (1 )% 置信区间为:
x
u / 2
S x
x
u / 2
S x
u分布的95%和99%的临界值可知
u0.01/ 2 2.58
总体均数的95%置信区间为: 总体均数的99%置信区间为:
[例5-1-3] 随机抽取某校120名17岁女生100米跑平均成绩为15.3秒,标准差为 0.8秒,试求该校17岁女生100米跑平均成绩的99%置信区间?
学习目标: 目标1 理解单样本t检验的条件 目标2 熟悉单样本t检验的检验过程 目标3 能够熟练运用SPSS进行单样本t检验
不同自由度的 t 分布
单侧:t的临界值为:
t (df ) IDF.T( ,df )
双侧:例如当自由度为10,概 率为0.05时,t的双侧临界值 为-2.228
5.1.4 总体均数的区间估计
(1)当n<100时,采用t分布理论
总体均数的95%置信区间为: 总体均数的99%置信区间为:
[例5-1-2] 从某市高一年级随机抽取36名男生的铅球成绩(单位:m),数据如下:
解:已知 率的标准误为:
总体率的95%置信区为:
=(94.64%,99.36%)
即该学院学生合格率的95%置信区间为(94.64%,99.36%) 。结果表 明有95%的把握可认为该学院学生体测合格率在94.64%~99.36%之间。
5.1.6 区间估计的SPSS例解
[例5-1-5]从某市高一年级随机抽取36名男生的铅球成绩(单位:m),数据见 [例5-1-2],试估计其抽样误差和总体均数的95%置信区间?
通常把 取为0.10、0.05或0.01,即可信度取为90%、95% 或99%。
5.1.3 t分布
当样本含量n充分大时,其均数近似服从正态分布,即 x ~ N (, 2 ) x
统计量
的分布将服从以自由度的
分布,则
统计量
服从t 分布,即
公式5-1-2
自由度df越大, 分布与正态分布出入就越小
t 分布与正态分布的比较
中抽取样本含量为n的所有样本,只要样本含量足够大
时
,由中心极限定理可知,样本均数的分布近似服
从均数为 ,方差 为 的正态分布。
为样本均数的
标准误(标准误 的估计值)
SS
x
n
公式5-1-1
为样本标准差 为样本含量
影响抽样误差的因素: (1)原总体个体的分散性; (2)样本含量的大小; (3)抽样方法和抽样的组织方式。
结果与分析
学习目标: 目标1 理解假设检验的基本原理 目标2 熟悉假设检验的四个步骤 目标3 了解常用假设检验方法
假设检验的小概率事件原理
假设检验:简而言之,就是先假设总体具有什么特征,然后 从总体中抽出一个样本,根据这个随机样本的特征来检验所 提出的假设是否成立。
假设检的特征: