统计 习题课件 CH07
合集下载
统计基础第七章课件共86页
利用抽样调查,可以检验全面调查资料的准 确性,并能修正全面调查资料的差错;
抽样调查可用于工业生产过程的质量控制; 利用抽样调查原理,可以对某些总体的假设
进行检验,来判断这种假设的真伪,以决定 行动的取舍。
4
三、抽样调查的几个基本概念
全及总体和 全及指标和
抽样总体
抽样指标
02.06.2020
本单位,记录它的有关标志值后, 抽选第二个样本单位,记录了该单
也把它放回全及总体中去,照此下 位有关标志值后,该单位也不放回
去直到抽选第n个样本单位为止。 全及总体中去,从总体N-2个单位
在重置抽样方法下,全及总体单位 数在抽选过程中始终未减少,每个
中抽选第三个样本单位,照此下去 直到抽选第n个样本单位。
抽样平均误差是所有抽样误差的平均水平。确 切地说,则是所有样本指标(样本平均数和样 本成数)的标准差。公式如下:
02.06.2020
(xX)2, (pP)2
02.06.2020
第七章 抽样调查
抽样调查的一般问题 抽样误差和抽样估计 抽样调查的组织方式 样本容量的确定和对总量指
标的推算 假设检验的意义和假设命题 假设检验的方法
1
02.06.2020
第一节 抽样调查的一般问题
抽样调查的概念和特点 抽样调查的作用 抽样调查的几个基本概念 抽样调查的理论基础 抽样方法
2
一、抽样调查的概念和特点
概念
抽样调查是按照随机原 则从调查对象(即总体) 中抽取部分单位进行调 查,用调查所得指标数 值对调查对象相应指标 数值作出具有一定可靠 性的估计和判断的一种 统计调查方法。
所谓随机原则也称为机 会均等原则。
特点
抽样调查是一种二)统计调查误差的种类
抽样调查可用于工业生产过程的质量控制; 利用抽样调查原理,可以对某些总体的假设
进行检验,来判断这种假设的真伪,以决定 行动的取舍。
4
三、抽样调查的几个基本概念
全及总体和 全及指标和
抽样总体
抽样指标
02.06.2020
本单位,记录它的有关标志值后, 抽选第二个样本单位,记录了该单
也把它放回全及总体中去,照此下 位有关标志值后,该单位也不放回
去直到抽选第n个样本单位为止。 全及总体中去,从总体N-2个单位
在重置抽样方法下,全及总体单位 数在抽选过程中始终未减少,每个
中抽选第三个样本单位,照此下去 直到抽选第n个样本单位。
抽样平均误差是所有抽样误差的平均水平。确 切地说,则是所有样本指标(样本平均数和样 本成数)的标准差。公式如下:
02.06.2020
(xX)2, (pP)2
02.06.2020
第七章 抽样调查
抽样调查的一般问题 抽样误差和抽样估计 抽样调查的组织方式 样本容量的确定和对总量指
标的推算 假设检验的意义和假设命题 假设检验的方法
1
02.06.2020
第一节 抽样调查的一般问题
抽样调查的概念和特点 抽样调查的作用 抽样调查的几个基本概念 抽样调查的理论基础 抽样方法
2
一、抽样调查的概念和特点
概念
抽样调查是按照随机原 则从调查对象(即总体) 中抽取部分单位进行调 查,用调查所得指标数 值对调查对象相应指标 数值作出具有一定可靠 性的估计和判断的一种 统计调查方法。
所谓随机原则也称为机 会均等原则。
特点
抽样调查是一种二)统计调查误差的种类
统计 习题课件 CH07
两独立样本设计资料 t 检验的功效
计算
Zβ
: Zβ =
σ
|δ | Zα 1 1 + n1 n2
其 中 , n1 , n 2 分 别 为 两 样 本 的 样 本 含 量 , 其 余 符 号 含 义 同 上 .
第五节 假设检验的功效
三,应用假设检验需要注意的问题 对服从正态分布资料进行t检验,不是 看样本均数间差别的大小,而是推断两个 总体均数是否相等(或其中一个大于另一 个);类似地,对服从二项分布资料或 Poisson分布资料进行Z检验,目的也是对 相应的总体参数大小进行推断.
(二)两独立样本设计资料的 Z 检验 独立样本设计资料的 设计 检验统计量: 检验统计量: | p1 p2 | 1 1 pc (1 pc )( + ) n1 n2 | p1 p2 | 0.5( 或 Z= 1 1 + ) n1 n2 1 1 pc (1 pc )( + ) n1 n2
Z=
其中, n1 , n2 分别为两样本的样本含量;
思考与练习
3. 随机将 20 只雌体中年大鼠均分为甲,乙两组,乙组中的每只大鼠接受 3mg/kg 的内毒素,甲组作为对照组,分别测得两组大鼠的肌酐(mg/L)如下: 甲(对照)组: 6.2 乙(处理)组: 8.5 3.7 6.8 5.8 11.3 2.7 3.9 9.4 9.3 6.1 7.3 6.7 7.8 3.8 7.2 6.9 8.2
当 n 不太大时, 需作如下的连续性校正: | X n π 0 | 0 .5 n π 0 (1 π 0 ) | p π0 | 0 .5 n π 0 (1 π 0 ) n
Z =
或
Z =
其中,π0 为已知的总体概率(一般为理论值,标准值或经过大量观察所得的稳 X 定值等) p = , . n
四年级 下7《统计》PPT课件PPT共26页
课件
51、山气日夕佳,飞鸟相与还。 52、木欣欣以向荣,泉涓涓而始流。
53、富贵非吾愿,帝乡不可期。 54、雄发指危冠,猛气冲长缨。 55、土地平旷,屋舍俨然,有良田美 池桑竹 之属, 阡陌交 通,鸡 犬相闻 。
41、学问是异常珍贵的东西,从任何源泉吸 收都不可耻。——阿卜·日·法拉兹
42、只有在人群中间,才能认识自 己。——德国
43、重复别人所说的话,只需要教育; 而要挑战别人所说的话,则需要头脑。—— 玛丽·佩蒂博恩·普尔
44、卓越的人一大优点是:在不利与艰 难的遭遇里百折不饶。——贝多芬
45、自己的饭量自己知道。——苏联
51、山气日夕佳,飞鸟相与还。 52、木欣欣以向荣,泉涓涓而始流。
53、富贵非吾愿,帝乡不可期。 54、雄发指危冠,猛气冲长缨。 55、土地平旷,屋舍俨然,有良田美 池桑竹 之属, 阡陌交 通,鸡 犬相闻 。
41、学问是异常珍贵的东西,从任何源泉吸 收都不可耻。——阿卜·日·法拉兹
42、只有在人群中间,才能认识自 己。——德国
43、重复别人所说的话,只需要教育; 而要挑战别人所说的话,则需要头脑。—— 玛丽·佩蒂博恩·普尔
44、卓越的人一大优点是:在不利与艰 难的遭遇里百折不饶。——贝多芬
45、自己的饭量自己知道。——苏联
统计基础第七章课件
统
计调查误 代 登差表 记
性误差 性误差
登记性误差是指统计调查时,由于主客观原因在 登记、汇总、计算、过录中产生的差错。登记性 误差不论全面调查或非全面调查都可能产生。
代表性误差是抽样调查可能产生的误差。代表性 误差又可分为系统性误差和随机误差。抽样误差 就是这种随机误差。
2019/9/4
p
p
根据样本指标和抽样平均误差,可以确定总体指标所 在的范围;
区间估计所表明的是一个可能范围,不是一个绝对可 靠的范围;
要提高推断的可靠程度即提高概率,必须扩大误差范 围。
2019/9/4
29
区间估计的步骤:
计算样本平均数或成数; 计算或确定方差; 计算抽样平均数或成数的平均误差; 计算平均数或成数的极限误差; 确定总体平均数或成数的置信区间。
2019/9/4
26
(三)抽样估计方法
点估计
区间估计
2019/9/4
27
1. 点估计
点估计又称定值估计。它是用实际 样本指标数值代替总体指标数值, 即总体平均数的点估计值就是样本 平均数,总体成数的点估计值就是 样本成数。
2019/9/4
28
2. 区间估计
x Xx
x
x
p P p
2019/9/4
3
一、抽样调查的概念和特点
概念
抽样调查是按照随机原 则从调查对象(即总体) 中抽取部分单位进行调 查,用调查所得指标数 值对调查对象相应指标 数值作出具有一定可靠 性的估计和判断的一种 统计调查方法。
所谓随机原则也称为机 会均等原则。
特点
抽样调查是一种非全面调 查;
简单随机抽样从理论上说最符合随机原则,是其 他抽样方式的基础,也是衡量其他抽样方式抽样 效果的标准。但是在统计实践中受到很大限制: 一是当总体很大时,编号工作就很困难,对于连 续生产的企业产品编号也不可能;二是当总体各 单位标志值之间差异很大时,采用这种抽样方式 并不能保证样本的代表性。
统计基础课件习题的答案第七章-文档资料
ˆ )2 ( y y S xy n2
S yx
y
2
a y b xy nm
估计标准误差越小,估计值的代表性越强, 用回归方程估计或预测的结果越准确。
可线性化的曲线回归
1.指数曲线模型
ˆ abx y
转化为直线回归模型
ˆ A Bx Y
2.幂函数曲线模型
ˆ ax b y
3.根据相关的方向划分,分为正相关和负相关。 正相关是指当自变量的值增加或减少时,因变量 的值也随之增加或减少。 负相关是指当自变量的值增加或减少时,因变量 的值反而减少或增加。
4.根据自变量的多少划分,分为单相关和复相关。
单相关又称一元相关,自变量的个数只有一个。 复相关又称多元相关,自变量有两个或两个以上。
四、相关关系的判断
1.定性分析。在进行相关分析之前,首先对客观现象之间是否存在相关 关系,以及有何种相关关系做出判断,这是定性分析。 2.简单相关表和相关图。相关表是将总体中各单位的原始资料或整理资 料不经任何分组,只将一个变量的变量值按由小到大顺序列表排列, 另一个变量值与其一一对应,并按相应的变量值顺序排列形成的统计 表。 相关图也叫散点图或相关点图,相关图上的横座标代表自变量x, 纵座标代表因变量y。把观察所得的有关资料,依次以相关点标在图上 ,从相关点在图象上的分布及趋势,可以掌握变量之间的相关关系的 状况。 3.分组相关表。是把原始的相关资料加以分组,排列在一张表格上,用 以观察现象之间相关关系的表格。依分组标志的多少分为单变量分组 相关表和双变量分组相关表两种。单变量分组相关表是按一个变量进 行分组,求出各组内另一个变量的次数和取值的平均数,列表表示变 量之间关系的方法。双变量分组相关表是对自变量和因变量都进行分 组而编制的相关表。
S yx
y
2
a y b xy nm
估计标准误差越小,估计值的代表性越强, 用回归方程估计或预测的结果越准确。
可线性化的曲线回归
1.指数曲线模型
ˆ abx y
转化为直线回归模型
ˆ A Bx Y
2.幂函数曲线模型
ˆ ax b y
3.根据相关的方向划分,分为正相关和负相关。 正相关是指当自变量的值增加或减少时,因变量 的值也随之增加或减少。 负相关是指当自变量的值增加或减少时,因变量 的值反而减少或增加。
4.根据自变量的多少划分,分为单相关和复相关。
单相关又称一元相关,自变量的个数只有一个。 复相关又称多元相关,自变量有两个或两个以上。
四、相关关系的判断
1.定性分析。在进行相关分析之前,首先对客观现象之间是否存在相关 关系,以及有何种相关关系做出判断,这是定性分析。 2.简单相关表和相关图。相关表是将总体中各单位的原始资料或整理资 料不经任何分组,只将一个变量的变量值按由小到大顺序列表排列, 另一个变量值与其一一对应,并按相应的变量值顺序排列形成的统计 表。 相关图也叫散点图或相关点图,相关图上的横座标代表自变量x, 纵座标代表因变量y。把观察所得的有关资料,依次以相关点标在图上 ,从相关点在图象上的分布及趋势,可以掌握变量之间的相关关系的 状况。 3.分组相关表。是把原始的相关资料加以分组,排列在一张表格上,用 以观察现象之间相关关系的表格。依分组标志的多少分为单变量分组 相关表和双变量分组相关表两种。单变量分组相关表是按一个变量进 行分组,求出各组内另一个变量的次数和取值的平均数,列表表示变 量之间关系的方法。双变量分组相关表是对自变量和因变量都进行分 组而编制的相关表。
统计基础第七章PPT学习教案
3.能运用时间数列分析方
3.掌握估计标准误差的涵义 及计算公式;
法和回归分析方法进行简 单统计预测。
4.掌握几种常用的预测方法 及其应用条件。
第2页/共30页
第一节 相关分析
事物或现象间在数量上存在着相互依存、相
互制约的关系,这种关系可以分为两种类型,
一
一种是确定性关系,即变量之间客观存在的
、
确定性的数量对应关系,当自变量取一个值 时,因变量就有一个完全确定的值与之对应,
不完全相关是指两个变量的关系介 于完全相关和完全不相关之间,在 统计学中,一般的相关关系指的就 是这种关系,相关分析的主要对象 是不完全的相关关系
完全不相关又称零相关,指 两个变量的数值之间不存在 任何依存关系,彼此独立, 互不影响。
第7页/共30页
(四)按相 关的程度来 分
三、相关分析的 步骤
1
第20页/共30页
随堂训练:
某农场单位面积施肥费用与单位产量之间的关系如下表, 要求绘制散点图,计算相关系数,求回归直线方程。
序号
单位面积施肥费用( 元)
单产(KG)
1
46
720
2
48
766
3
52
816
4
54
960
5
58
1020
合计
258
第21页/共30页
4282
单位(KG)
1200 1000
800 600 400 200
第9页/共30页
定量分析
变量之间相关关系的 定量分析主要通过相 关系数分析进行。 相关系数(r)概念 用来测定变量间相关 密切程度的指标。
简单相关表举例:
将一系列的成对观察值排列在统计表中,就形成了简 单相关表。如下表:
统计基础第七章课件
重置抽样
不重置抽样
重置抽样,也称重复抽样,是指从 全及总体抽取样本时,随机抽取一
不重置抽样,也称不重复抽样,是 从全及总体抽取第一个样本单位,
个样本单位,记录该单位有关标志 记录该单位有关标志值,这个样本
值后,把它放回到全及总体中去, 单位不再放回全及总体参加下一次
再从全及总体中继续抽取第二个样 抽选。然后,从N-1个单位中随机
耐用时间(小时)
3000以下 3000-4000 4000-5000 5000以上
合计
全面检测(支)
50 600 990 360
2000
抽样复测(支)
2 30 50 18
100
2020/2/1
31
解:
2020/2/1
x 2500 2 3500 30 4500 50 5500 18 100
简单随机抽样从理论上说最符合随机原则,是其 他抽样方式的基础,也是衡量其他抽样方式抽样 效果的标准。但是在统计实践中受到很大限制: 一是当总体很大时,编号工作就很困难,对于连 续生产的企业产品编号也不可能;二是当总体各 单位标志值之间差异很大时,采用这种抽样方式 并不能保证样本的代表性。
36
三、类型抽样
抽样平均 数的平均 误差
2
x
n
2020/2/1
抽样成数 的平均误
差
p (1 p )
p
n
21
2. 不重置抽样的抽样平均误差
2020/2/1
抽样平均 数的平均 误差
抽样成数 的平均误 差
2 (1 n )
x
n
N
p (1 p ) (1 n )
统计基础第七章课件.ppt
29
23.03.2019
区间估计的步骤:
计算样本平均数或成数; 计算或确定方差; 计算抽样平均数或成数的平均误差; 计算平均数或成数的极限误差; 确定总体平均数或成数的置信区间。
23.03.2019
30
例如,对某天生产的2000件电子元件的耐用时间进行全面检 测,又抽取5%进行抽样复测,资料如下表。根据规定耐用时 间在3000小时以下为不合格。根据以上资料按重置抽样法计 算该电子元件平均耐用时间的抽样平均误差和合格率的抽样 平均误差,并以95.45%的把握估计该电子元件平均耐用时间 和合格率的区间范围。 耐用时间(小时) 3000以下 3000-4000 4000-5000 5000以上 合
( x X ) ( p P ) , x p k k
2 2
23.03.2019 19
(二)抽样平均误差的计算
重置抽样的 抽样平均误 差
不重置抽样 的抽样平均 误差
23.03.2019
20
1. 重置抽样的抽样平均误差
抽样平均 数的平均 误差
x
n
2
抽样成数 的平均误 差
指标值的平均数等于被估计的总体指标值本身;
一致性就是随着n的无限增大,样本指标与未知
的总量指标之间的绝对离差任意小的可能性趋于 实际必然性;
有效性就是用样本指标估计总体指标时,作为
估计量的方差比其他估计量的方差小。
23.03.2019
26
(三)抽样估计方法
点估计
区间估计
23.03.2019
12
重置抽样,也称重复抽样,是指从 全及总体抽取样本时,随机抽取一 个样本单位,记录该单位有关标志 值后,把它放回到全及总体中去, 再从全及总体中继续抽取第二个样 本单位,记录它的有关标志值后, 也把它放回全及总体中去,照此下 去直到抽选第n个样本单位为止。 在重置抽样方法下,全及总体单位 数在抽选过程中始终未减少,每个 单位中选的机会在每次抽选中都是 均等的,同一个单位有可能不止一 次被抽中。
23.03.2019
区间估计的步骤:
计算样本平均数或成数; 计算或确定方差; 计算抽样平均数或成数的平均误差; 计算平均数或成数的极限误差; 确定总体平均数或成数的置信区间。
23.03.2019
30
例如,对某天生产的2000件电子元件的耐用时间进行全面检 测,又抽取5%进行抽样复测,资料如下表。根据规定耐用时 间在3000小时以下为不合格。根据以上资料按重置抽样法计 算该电子元件平均耐用时间的抽样平均误差和合格率的抽样 平均误差,并以95.45%的把握估计该电子元件平均耐用时间 和合格率的区间范围。 耐用时间(小时) 3000以下 3000-4000 4000-5000 5000以上 合
( x X ) ( p P ) , x p k k
2 2
23.03.2019 19
(二)抽样平均误差的计算
重置抽样的 抽样平均误 差
不重置抽样 的抽样平均 误差
23.03.2019
20
1. 重置抽样的抽样平均误差
抽样平均 数的平均 误差
x
n
2
抽样成数 的平均误 差
指标值的平均数等于被估计的总体指标值本身;
一致性就是随着n的无限增大,样本指标与未知
的总量指标之间的绝对离差任意小的可能性趋于 实际必然性;
有效性就是用样本指标估计总体指标时,作为
估计量的方差比其他估计量的方差小。
23.03.2019
26
(三)抽样估计方法
点估计
区间估计
23.03.2019
12
重置抽样,也称重复抽样,是指从 全及总体抽取样本时,随机抽取一 个样本单位,记录该单位有关标志 值后,把它放回到全及总体中去, 再从全及总体中继续抽取第二个样 本单位,记录它的有关标志值后, 也把它放回全及总体中去,照此下 去直到抽选第n个样本单位为止。 在重置抽样方法下,全及总体单位 数在抽选过程中始终未减少,每个 单位中选的机会在每次抽选中都是 均等的,同一个单位有可能不止一 次被抽中。
《统计课件》PPT课件_OK
(2)从总体中抽取的 一部分个体 叫做总体的一个样本,样本中
的个体的
数目
叫做样本容量.
(3)在抽取样本的过程中,总体中的每个个体都以相等的机会被抽
到,像这样的抽样方法叫简单随机抽样.
2.中位数、众数
中间位置
(1)中位数:将一组数据按大小顺序排列,处在最
上的数
据叫做这组数据的中位数;如果数据的个数为偶数,中位数就是处在
2021/7/27
14
点2 平均数、中位数、众数
1、某学习小组7位同学,为玉树地震灾区捐款,捐款 金额分别为:5元,10元,6元,6元,7元,8元,9元 ,则这组数据的中位数与众数分别为( B ) A.6,6 B.7,6 C.7,8 D.6,8
规律总结:众数是指一组数据中出现次数最多的数据,它反映了 一组数据的多数水平,一组数据的众数可能不是唯一的.
2021/7/27
9
课前预习
5. (2014重庆)2014年8月26日,第二届青奥会将在南京举行,甲、
乙、丙、丁四位跨栏运动员在为该运动会积极准备.在某天“110
米跨栏”训练中,每人各跑5次,据统计,他们的平均成绩都是13.2
秒,甲、乙、丙、丁的成绩的方差分别是0.11、0.03、0.05、0.02.
解析:小明数据的平均数 方差
小兵数据的平均数
方差
∴S12<S22.
2021/7/27
19
考点突破
考点归纳:本考点近些年广东省中考均未考查,但本考点是初中 的重要内容,2015年备考时应注意.本考点一般出题考查难度中等,为 中等难度题.本考点应注意掌握的知识点:
方差是用来衡量一组数据波动大小的量,方差越小,表明这组数 据分布比较集中,各数据偏离平均数越小,即波动越小,数据越稳定 .
的个体的
数目
叫做样本容量.
(3)在抽取样本的过程中,总体中的每个个体都以相等的机会被抽
到,像这样的抽样方法叫简单随机抽样.
2.中位数、众数
中间位置
(1)中位数:将一组数据按大小顺序排列,处在最
上的数
据叫做这组数据的中位数;如果数据的个数为偶数,中位数就是处在
2021/7/27
14
点2 平均数、中位数、众数
1、某学习小组7位同学,为玉树地震灾区捐款,捐款 金额分别为:5元,10元,6元,6元,7元,8元,9元 ,则这组数据的中位数与众数分别为( B ) A.6,6 B.7,6 C.7,8 D.6,8
规律总结:众数是指一组数据中出现次数最多的数据,它反映了 一组数据的多数水平,一组数据的众数可能不是唯一的.
2021/7/27
9
课前预习
5. (2014重庆)2014年8月26日,第二届青奥会将在南京举行,甲、
乙、丙、丁四位跨栏运动员在为该运动会积极准备.在某天“110
米跨栏”训练中,每人各跑5次,据统计,他们的平均成绩都是13.2
秒,甲、乙、丙、丁的成绩的方差分别是0.11、0.03、0.05、0.02.
解析:小明数据的平均数 方差
小兵数据的平均数
方差
∴S12<S22.
2021/7/27
19
考点突破
考点归纳:本考点近些年广东省中考均未考查,但本考点是初中 的重要内容,2015年备考时应注意.本考点一般出题考查难度中等,为 中等难度题.本考点应注意掌握的知识点:
方差是用来衡量一组数据波动大小的量,方差越小,表明这组数 据分布比较集中,各数据偏离平均数越小,即波动越小,数据越稳定 .
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
p1 和 p 2 分别为两样本的阳性频率;
n1 + 1 ) 为连续性校正项; n2
Pc 为 两 样 本 合 并 的 阳 性 频 率 . 分 子 中 的 0.5( 1
pc = X1 + X 2 ; X 1 和 X 2 分别为两样本阳性例数. n1 + n2
二项分布资料与Poisson分 第三节 二项分布资料与 分 布资料的Z检验 布资料的 检验
二项分布资料与Poisson分 第三节 二项分布资料与 分 布资料的Z检验 布资料的 检验
二 项 分 布 资 料 的 正 态 近 似 条 件 : n 较 大 , π 不 接 近 0 也 不 接 近 1. 实 践 中 , 若 np 与 n (1 -p )均 大 于 5 , 便 可 认 为 符 合 条 件 . P o isso n 分 布 资 料 的 正 态 近 似 条 件 : 总 体 均 数 λ 较 大 . 实 践 中 , 若 X ? 2 0 , 便 可 认 为符合条件. 一,二项分布资料的 Z 检验 (一 ) 单 样 本 设 计 资 料 的 Z 检 验 检验统计量: Z = X nπ 0 n π 0 (1 π 0 ) 或 Z = p π0 π 0 (1 π 0 ) n
t=
d 0 , Sd / n
ν = n 1
其中, d 为差值的均数, Sd 为差值的样本标准差, n 是对子数.
第二节 t 检验
三,两独立样本设计资料的 t 检验 (一 ) 两 样 本 所 属 总 体 方 差 相 等 检验统计量:
t =
X1 X 2 , ν = n1 + n 2 2 1 1 + ) Sc ( n1 n2
当 n 不太大时, 需作如下的连续性校正: | X n π 0 | 0 .5 n π 0 (1 π 0 ) | p π0 | 0 .5 n π 0 (1 π 0 ) n
Z =
或
Z =
其中,π0 为已知的总体概率(一般为理论值,标准值或经过大量观察所得的稳 X 定值等) p = , . n
二项分布资料与Poisson分 第三节 二项分布资料与 分 布资料的Z检验 布资料的 检验
第二节 t 检验
t 检验的应用条件:当样本含量较小时,要求样本取自正态总体;对于两独立样 本设计资料,要求具有方差齐性(两个总体方差相等) . 一,单样本设计资料的 t 检验 检验统计量:
t=
X 0 , S/ n
ν = n 1
其中,μ0 为已知的总体均数(一般为理论值,标准值或经过大量观察所得的稳 定值等) . 二,配对设计资料的 t 检验 配 基本概念: 对设计是研究者为了控制可能存在的主要非处理因素而采用的 一种试验设计方法. 检验统计量:
两独立样本设计资料 t 检验的功效
计算
Zβ
: Zβ =
σ
|δ | Zα 1 1 + n1 n2
其 中 , n1 , n 2 分 别 为 两 样 本 的 样 本 含 量 , 其 余 符 号 含 义 同 上 .
第五节 假设检验的功效
三,应用假设检验需要注意的问题 对服从正态分布资料进行t检验,不是 看样本均数间差别的大小,而是推断两个 总体均数是否相等(或其中一个大于另一 个);类似地,对服从二项分布资料或 Poisson分布资料进行Z检验,目的也是对 相应的总体参数大小进行推断.
第七章 假设检验基础
第一节 假设检验的概念与原理
一,假设检验的思维逻辑 基本推断原理: 基本推断原理:小概率事件在一次随机试验中不(大) 可能发生. 特点: 特点:从研究总体中抽取大小合适的随机样本,应用假 设检验理论和方法,依据样本提供的有限信息对总体做推 断. 二,假设检验的基本步骤 基本概念: 基本概念:假设检验就是首先根据设计和研究目的提 出某种假设,然后根据现有资料提供的信息,推断此假设 应当拒绝还是不拒绝. 假设检验的基本步骤: 假设检验的基本步骤: 分为三步: 1.建立检验假设,确定检验水准 2. 计算统计量 3. 确定值,做出推断
5.6 7.9
试检验两总体均值之间有无差别?
解答:
1. 本题属于两独立样本设计资料的 t 检验.首先检验两样本方差是否具有 齐性(参见教材例 7-6 方法) ,求得 F=1.13,P=0.8569>0.05,方差齐;选用 t 检验求得 t=-3.785,
ν =18,P=0.0014<0.05,有统计学意义.说明甲,乙两组大
*第六节 正态性检验 第六节
一,图示法 1.P-P图法 2.Q-Q图法 二,统计检验法 1.W检验 2.D检验 3.矩法
思考与练习
已知某水样中含CaCO3含量的真值为20.70 CaCO3含量的真值为 1. 已知某水样中含CaCO3含量的真值为20.70 mg/L),现用某法重复测定该水样11 ),现用某法重复测定该水样11次 (mg/L),现用某法重复测定该水样11次, CaCO3 含量(mg/L) 20.99, 20.41,20.10,20.00, 含量(mg/L)为:20.99, 20.41,20.10,20.00, 20.91, 22.60,20.99,20.41,20.00, 23.00, 20.91, 22.60,20.99,20.41,20.00, 23.00, 22.00, 用该法测CaCO3 CaCO3含量所得的均值与真 22.00, 问:用该法测CaCO3含量所得的均值与真 值有无差异? 值有无差异? 解答:根据统计学理论可知:重复测定该水样 中的CaCO3含量数据应服从正态分布,又根据资料 特点,本题属于单组样本设计资料的t检验.结果 是:t=1.0636907, ν =0.3125,不拒绝H0,差异无 统计学意义.不能认为用该法测水样中CaCO3含量 所得的总体均数与真值之间有差异.
第五节 假设检验的功效一,源自设检验的两类错误表 7-1 推断结论和两类错误的概率 实际情况 H0 真 H0 不真 检验结果 拒绝 H0 第Ⅰ类错误 (α ) 结论正确 (1- β ) 不拒绝 H0 结论正确(1-α ) 第Ⅱ类错误( β )
当样本含量 n 一定时,α 越小 β 越大;α 越大 β 越小;要想同时降低α 与 β ,唯 一的方法是增大样本含量.
第五节 假设检验的功效
二,假设检验的功效 基 本 概 念 : 1 -β 称 为 假 设 检 验 的 功 效 , 其 意 义 是 , 当 所 研 究 的 总 体 与 H 0 确 有 差 别 时 , 按 检 验 水 平 α 能 够 发 现 它 ( 拒 绝 H 0) 的 概 率 . 1. 单样本设计资料 t 检验的功效
β
计算 Z
:
Zβ =
nδ
σ
Zα
其 中 ,n 为 样 本 含 量 ,δ 为 欲 发 现 的 最 小 差 异 或 容 许 误 差 , σ 为 总 体 标 准 差 , Z α 为假设检验的临界值(取单侧) 然后根据 Zβ 反查标准正态分布表, 标准正态分 . 布的密度曲线下, Z 2.
β
左 侧 的 面 积 就 是 功 效 1 -β .
第二节 t 检验
独立样本设计 设计资料的方差齐性检验 四,两独立样本设计资料的方差齐性检验 检验统计量: 检验统计量:
2 S(较大) F = 12 , S(较小) 2
ν1=n1-1,ν2=n2-1 -1 ν
2 其中, S12 与 S 2 是被比较的两个样本方差.
第二节 t 检验
五,大样本资料的 Z 检验 (一)单样本设计资料的 Z 检验 检验统计量: 当 n 较大时,公式为 Z = X 0 S/ n
X1与 X 2 分别为两样本的计数值.
2. 当 两 样 本 观 测 单 位 数 不 等 时 : Z = X1 X
2
X1 X2 + n1 n2
其 中 , X 1 与 X 2 分 别 为 两 样 本 均 数 , n1 与 n2 分 别 为 观 测 单 位 数 .
第四节 假设检验与区间估计的关系
两个总体均数差值的双侧(1-α)置信区间:( X1 X2 ) ± tα /2,ν SX1 X2 1. 置信区间具有假设检验的主要功能. 2. 置信区间在回答差别有无统计学意义的同时,还可以提示差别是否具有 实际意义. 3. 假设检验可以报告确切的 P 值,还可以对检验的功效做出估计.
鼠的肌酐(mg/L)两总体均值之间有差别.再结合样本均数:甲组大鼠的肌酐 均数为 4.145(mg/L),乙组大鼠的肌酐均数为 7.008(mg/L) ,故乙组大鼠的肌 酐总体均值较高.
思考与练习
3. 随机将 20 只雌体中年大鼠均分为甲,乙两组,乙组中的每只大鼠接受 3mg/kg 的内毒素,甲组作为对照组,分别测得两组大鼠的肌酐(mg/L)如下: 甲(对照)组: 6.2 乙(处理)组: 8.5 3.7 6.8 5.8 11.3 2.7 3.9 9.4 9.3 6.1 7.3 6.7 7.8 3.8 7.2 6.9 8.2
(二)两独立样本设计资料的 Z 检验 独立样本设计资料的 设计 检验统计量: 检验统计量: | p1 p2 | 1 1 pc (1 pc )( + ) n1 n2 | p1 p2 | 0.5( 或 Z= 1 1 + ) n1 n2 1 1 pc (1 pc )( + ) n1 n2
Z=
其中, n1 , n2 分别为两样本的样本含量;
S
2 c
( n 1 1) S 12 + ( n 2 1 ) S 22 = = n1 + n 2 2
∑ (X
1
X 1)2 +
∑ (X
2
X 2 )2
n1 + n 2 2
其 中 , S c2 是 合 并 方 差 . ( 二 ) 两 样 本 所 属 总 体 方 差 不 等 ( t' 检 验 ) 检验统计量: X1 X
2 1
t' =
2
S S 22 + n1 n2