第五章--统计推断
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章统计推断
•总体与样本之间的关系
-从总体到样本的研究。
-由样本推断总体:样本统计量的分布规律一般是正态分布、t 分布、χ2分布和F分布。•对总体做统计推断的两种途径
–先对所估计的总体做一假设,然后通过样本数据推断这个假设是否接受,这种途径称为统计假设检验(statistical test of hypothesis)
–通过样本统计量估计总体参数,称为总体参数估计(estimation of population parameter)
•本章重点讲解统计推断的一般原理以及对总体平均数及标准差的推断。
一、假设检验
假设检验就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种被此对立的假设,然后由样本的实际结果,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。如果抽样结果使小概率发生,则拒绝假设,如抽样结果没有使小概率发生,则接受假设。
小概率原理
在一次试验中,某事件几乎是不会发生的,若根据一定的假设条件计算出来的该事件发生的概率很小,而在一次试验中它竟然发生了,则可认为原假设条件不正确,给予否定。
在生物统计的显著性检验中,通常取5%或1%小概率为显著性水平,记为“α”
例5.1 根据以往的经验,用一般疗法治疗某种疾病,其死亡率为40%,治愈率为60%。今用一种新药治疗染上该病的6名患者,这6人均治愈了,问该新药是否显著优于一般疗法?
小概率原理用于显著性检验
例5.2用实验动物作实验材料,现从一批动物(σ= 0.4)中抽取含量n= 10的样本并已经计算出平均值为10.23 g。已知这批动物饲养时间较长,不可能小于10g,问此批动物材料是否是抽自于μ=10的总体中?
解:1 样本平均数满足何种分布?
2 从正态分布表查出P = 0.03438< 0.05,这是一个小概率事件,该样本几乎不可能抽自μ = 10.00 g的总体。
单侧检测(one-sided test)
•上尾检验(upper tailed test):拒绝H0后,接受μ>μ0,如下左图。
•下尾检验(lower tailed test):拒绝H0后,接受μ < μ0 ,如下右图。
•双侧检验(two-sided test):拒绝H0后,接受μ≠μ0,如下图。
•由于单侧检验时利用了已知有一侧是不可能的这一条件,从而提高了它的辨别力,所以单侧检验比双侧检验的辨别力更强些。
•实际应用时,要尽量选用单侧检验,但要根据实际情况而定。
二、假设检验中的两类错误
是真实的,却否定了它,又叫弃真错误。1. Type Ⅰ error(α错误),如果H
0
是错误的,却接受了它,又叫纳伪错误。2. Type Ⅱerror (β类错误),如果H
0
例5.3 用实验动物作实验材料,现从一批动物(σ= 0.4)中抽取含量n= 10的样本并已经计算出平均值为10.20 g。已知这批动物饲养时间较长,不可能小于10g,问此批动物材料是否是抽自于μ=10的总体中?
方法1
方法2
图 5-2 两种类型的错误
样本抽自HA:u=10.3g,但却错误的接受
H0:u=10.0 g的概率为0.2327。
关于两种类型错误的三点解释
•当μ1越接近于μ0时,犯Ⅱ型错误的概率愈大;当μ1越远离μ0时,犯Ⅱ型错误的概率愈小。
•在样本含量和样本平均数都固定时,为了降低犯Ⅰ型错误的概率α(就应将图5-2中的竖线右移),必然增加犯Ⅱ型错误的概率。
•为了同时降低α和β就需增加样本含量。
三、假设检验的步骤
●对样本所属总体提出假设,无效假设记作H0,备择假设,记作H A。
●确定显著水平
在进行无效假设和备则假设之后,要确定一个否定H0的概率标准,这个标准叫显著水平或概率水平。
●在H0正确的前提下,根据抽样分布的统计数,进行假设检验的概率计算。
●根据显著水平α的统计数(如u值)的临界值,进行差异是否显著的推断。
四、均值检验
5.1 单个样本的统计假设检验
5.1.1 σ已知单个平均数显著性检验:u检验
例5.5母猪的怀孕期为114天,今抽测10头母猪
的怀孕期分别为116、115、113、 112、114、117、 115、 116、 114、113(天),试检验所得样本的平均数与总体平均数114天有无显著差异?
根据题意,本例应进行双侧t检验。
1、提出无效假设与备择假设
2、计算u值
3、建立H0的拒绝域:因HA:μ> μ0,故为上尾单侧检验,当μ> μ0.05时拒绝H0,a=0.05的上侧分位数μ0.05=1.645。
4、结论:因为m> μ0.05所以拒绝H0,接受HA.上述样本很可能不是抽自N (377.2,3.32)的总体,抽出样本的那个总体的平均数是大于377.2的某个值,即栽培条件的改善显著提高了豌豆籽粒重量。
5.1.2 σ未知时平均数显著性检验:t检验
例5.5 母猪的怀孕期为114天,今抽测10头母猪的怀孕期分别为116、115、113、112、114、117、 115、 116、 114、 113(天),试检验所得样本的平均数与总体平均数114天有无显著差异?
根据题意,本例应进行双侧t检验。
1、提出无效假设与备择假设
2、计算t值
3、查临界t值,作出统计推断
由df=9,查t值表(附表3)得t0.05(9)=2.262,因为|t|
5.1.3 变异性的显著性检验:χ2检验
例5.6一个混杂的小麦品种,株高标准差σ0=14cm,经提纯后随机抽取10株,它们的株高为:90, 105, 101, 95, 100, 100, 101, 105, 93,97,考察提纯后的群体是否比原群体整齐?
1、小麦株高是服从正态分布的随机变量
2、提出假设
关于备择假设的说明:小麦经提纯后只能变得更整齐,绝不会更离散,即s只能小于