第五章统计推断

合集下载

5第五章(二)统计推断概述2假设检验基本原理

5第五章(二)统计推断概述2假设检验基本原理

13:06:12
16
统计结论:
1 检验统计量绝对值 <临界值0.05,则相伴概 率 P>0.05,接受H0 ,差异不显著;
2 临界值0.05<检验统计量绝对值 <临界值0.01, 则相伴概率 0.01<P<0.05,否定H0 ,差异 显著; 3 检验统计量绝对值 >临界值0.01,则相伴概 率 P<0.01,否定H0 ,差异极显著;
(2)相伴概率P:是指在原假设成立时检验统计 量值及所有比它更极端的可能值出现的概率之 和(P---)
13:06:12 15
假设检验的基本步骤
统计结论:
- 差异不显著:在=5%水平下, 检验统计量的观察值落在接受域中, - 差异显著:在=5%水平下,检 验统计量的观察值落在否定域中 - 差异极显著:在=1%水平下, 检验统计量的观察值落在否定域中
Biostatistics and Experimental Design
畜牧、兽医专业
生物统计 附 试验设计
13:06:12
1
统计推断概述内容1小节
一 二 三 四 五 统计推断的概念 抽样分布的概念 统计量的概率分布-抽样分布 正态总体样本平均数的抽样分布 参数估计
13:06:12
2
统计推断概述内容2
13:06:12
18
举例说明
(2)计算检验统计量
Z=
x- m
8.7 - 9 = = - 3.162 2 s n 2.5/ 10
13:06:12
19
(3)确定否定域:
若取 =5%,否定域为Z > 1.96 或 Z < 1.96,临界值U0.05=1.96 ,Z = -3.162 < -1.96,统 计量Z落入否定区,否定H0,相伴概率P<0.05 结论:该场猪的平均背膘厚与9mm差异显著

统计推断

统计推断
(2)选取显著水平 =0.05。 (3)检验计算: 1.58 0.158 X n 100
0。
u
x

X
7.65 7.25 2.532 0.158
0.05 1.96 (4) 推断:u分布中,当 =0.05时, 。实 得 u 1.96, P 0.05 ,故可在0.05显著水平 上否定H0,接受HA,认为新育苗方法的一月 龄体长与常规方法有显著差异。
x1 x 2 u sx1 x 2
例3.某杂交黑麦从播种到开花的天数的标 准差为6.9天,现在相同试验条件下采取 两种方法取样调查,A法调查400株,得 出从播种到开花的平均天数为69.5天;B 法调查200株,得出从播种到开花的平 均天数为70.3天,试比较两种调查方法 所得黑麦从播种到开花的天数有无显著 差别。
1 2
x1 x 2
2 12 2 2
n1
n2
1 1 x1 x2 n1 n2 n1 n2 n
x x
1 2
2 12 2
n
2 n
2 12 2 2 , n1 n2 n
x x
1 2
x x u值的计算公式: 假设H0: 1 2 , u x1 x 2 x x
例1.某鱼场按常规方法所育鲢鱼苗一月龄 的平均体长为7.25cm,标准差为1.58cm, 为提高鱼苗质量,现采用一新方法进行 育苗,一月龄时随机抽取100尾进行测 量,测得其平均体长为7.65cm,试问新 育苗方法与常规方法有误显著差异?
这里 1.58 , 2 为已知,故采用u检验,又新育苗 方法的鱼苗体长可能高于常规方法,也可能低 于常规方法,故进行双侧检验(双尾检验), 检验步骤: 0 7.25cm ,即新育苗方法与 (1)假设H0: 常规方法所育鱼苗一月龄体长相同。对HA:

统计学 第五章

统计学      第五章

第五章 抽样推断抽样推断定义:是一种非全面调查,是按随机原则,从总体中抽取一部分单位进行调查,并以其结果对总体某一数量特征作出估计和推断的一种统计方法。

(一) 总体和样本在抽样推断中面临两个不同的总体,即全及总体和样本总体,全及总体也叫母体,简称总体。

全及总体的单位数用N 表示全及总体⎪⎩⎪⎨⎧⎩⎨⎧属性总体有限总体无限总体变量总体样本总体又叫抽样总体、子样,简称样本,样本总体的单位数称样本容量,用n 表示。

(二) 参数和统计量参数亦称全及指标,由于全及总体是唯一确定的,故根据全及总体计算的参数也是个定值 对于属性总体,可以有如下参数,全及总体成数p ,全及总体标准差)(2p p σσ方差 属性总体标准差:()p p p-=1σ统计量即样本指标设样本总体有n 个变量:n x x x x ,...,,,321 则:样本平均数 nx x ∑=(三) 样本容量与样本个数样本容量是指一个样本所包含的单位数,用n 来表示,一般地,样本单位数达到或超过30个的样本称为大样本,而在30个以下称为小样本。

社会经济统计的抽样推断多属于大样本,而科学实验的抽样观察则多取小样本。

样本个数又称样本可能数目,是指从全及总体中可能抽取的样本的个数。

一个总体可能抽取多少样本,与样本容量大小有关,也与抽样的方法有关。

在样本容量确定之后,样本的可能数目便完全取决于抽样方法。

抽样误差是抽样调查自身所固有的,不可避免的误差,虽然不能消除这种误差,但有办法进行计算,并能对其加以控制。

抽样平均误差越大,表示样本的代表性越低;抽样平均误差越小,表示样本的代表性越高。

在重复简单随机抽样时,样本平均数的抽样分布有数学期望值E(a)=a(a代表全及总体平均数,即X)X⇔。

样本平均数的平均数=总体平均数抽样平均误差=抽样标准误差=样本平均数的标准差(它反映抽样平均数与总体平均数的平均误差程度)例题:某班组4个工人的月工资(N=4)分别是:1400元,1500元,1600元,1700元,现用重复简单随机抽样的方法从全及总体中抽选出容量大小为2的样本(n=2),求抽样平均误差?解:全及总体平均工资)(15501700160015001400元=+++=X全及总体标准差()4500002=-=∑NX Xσ抽样平均误差x μ=nnσσ=2=)(0569.792*450000元=例题:某班组4个工人的月工资(N=4)分别是:1400元,1500元,1600元,1700元,现用不重复简单随机抽样的方法从全部总体中抽选容量大小为2的样本(n=2),求抽样平均误差?解:全及总体平均工资)(155041700160015001400元=+++==∑NXX全及总体标准差()4500002=-=∑NX Xσx μ=⎪⎭⎫ ⎝⎛--∙12N n N n σ=)(55.6414244*250000元=--∙例题:某电子元件厂,生产某型号晶体管,按正常生产试验,产品中属于一级品的占70%,现在从10000件晶体管中,抽取100件进行抽查检验,求一级品率的抽样平均误差? 解:已知:P=0.7 , P(1-P)=0.21在重复抽样的情况下,抽样平均误差为:()np p p -=1μ=%58.410021.0=在不重复抽样的情况下,抽样平均误差为:()⎪⎭⎫⎝⎛-∙-=N n n p p p 11μ=%56.410000*********.0=⎪⎭⎫ ⎝⎛-∙参数估计()()⎪⎪⎩⎪⎪⎨⎧→-==+≤≤是概率度是置信度,极限误差)样本指标总体指标极限误差—(样本指标区间估计:求不高的情况准确程度与可靠程度要点估计:适用于推断的t t F t F P α1例题:已知某车间某产品的合格率在某个置信度下的估计区间是(85%,95%),还已知样本容量为100,求置信度?解:显然p p ∆-=85%,p p ∆+=95%,即p=90%,p ∆=5%p ∆=μ⋅t μpt ∆=⇒=()()67.1100%901%90%51=-∙=-∆np p p ()t F =0.9052即置信度为90.51% ★求置信度,只需要求出t影响抽样数目的因素⎪⎪⎪⎪⎩⎪⎪⎪⎪⎨⎧∆样本单位不重置抽样可以少抽些单位,抽样需要多抽一些样本、在同等条件下,重置单位,则反之值越大,则多抽些样本、概率度则反之单位,的值大可以少抽些样本)、允许误差(极限误差越多,则反之值越大,必要抽样数目、总体标准差4321t x σ例题:某城市组织职工家庭生活抽样调查,职工家庭平均每户每月收入的标准差为11.50元,要求把握程度为95.45%,允许误差为1元,问需抽选多少户? 解:()t F =0.95452=⇒t , 元元,150.11=∆=x σxt n 222∆=σ=()户529150.1142=∙。

第05章 统计推断

第05章  统计推断

单侧检验 α=0.05或0.01 统计推断 第五章
§5.1 单个样本的统计假设检验
5.1.2 单个样本的显著性检验程序
统计假设检验的三步曲: 1、建立零假设(null hypothesis)——假设差异不显著或无关; 2、计算统计量(u-检验,t-检验,x2-检验,F-检验);
3、判断假设。 对于带备择假设的零假设:需根据备择假设的拒
F
s , df n 1, df n 1 s
下侧临界点F1-α的 值,按右式计算
解释: F< F0.05,或P>0.05,接受H0; F> F0.05,或P<0.05,拒 Fdf1,df2,α,df 1附表7中没有给出 df 2为分母自由度 为分子自由度, 1 绝H0, ② F < F 1-α
s ③HA:μ≠μ0,包括μ>μ0和μ<μ0 此时相应各备择假设的H0的拒绝域分别为:
①t > tα解释: t<t0.05,接受H0; t>t0.05,拒绝H0 ②t < -tα ③|t| > tα/2,或表示为|t| > tα(两侧)
t n 1
n
第五章 统计推断
§5.1 单个样本的统计假设检验
379.2 377.2 u 1.82 3. 3 n 9 由于u 1.82 u0.05 1.645 ,所以拒绝H0假设、接受HA。
即栽培条件的改善显著地提高了豌豆籽粒重量。
x 0
第五章 统计推断
§5.1 单个样本的统计假设检验
5.1.4 σ未知时平均数的显著性检验——t 检验(t-test) 检验的程序: (1)零假设H0:μ=μ0 备择假设:①HA:μ>μ0,若已知μ不可能小于μ0 (2)计算统计量: x 0 (3)判断统计量: ②HA:μ<μ0,若已知μ不可能大于μ0

计数资料的统计描述与统计推断

计数资料的统计描述与统计推断

2 nnARn2C 1
(一) 多个样本率的比较:
表3.8 三种药物治疗高血压的疗效
处理
有效
无效
合计
有效率%
复方哌唑嗪 35
5
40
87.50
复方降压片 20
10
30
66.67
安慰剂
7
25
32
21.88
合计
62
40
102
60.78
38
H0:三种处理方法的有效率相等, 即π1= π2= π3 H1:三种处理方法的有效率不等或不全相等
某类死因构某 成同 年 比年 某死 类亡 死总 因人 死 1数 亡 0% 0人数
8
(二)疾病统计指标
某 病 发病 一率 定 该时 期期 间内 新可 病 发能 的 生 例发 平 的 数生 均 某 某 人 K病
某病患病率 某该时时点点某受病检现人患口病 K数例数


病死同 因率期 某某 病
死亡人数 病病 10人 % 0 数
29
31
(三)四格表χ2检验的专用公式
2
(ad b)c2n
(ab)c(d)a (c)b (d)
两组人群尿棕色素阳性率比较
组别
阳性数
阴性数
合计
铅中毒病人 对照组
29(a) 9(c)
7(b) 28(d)
36(a+b) 37(c+d)
合计
38(a+c)
35(b+d)
73(n)
阳性率(%) 80.56 24.32 52.05
712 142 185
61
1100
4
0.6
9
6.3

统计学第5章抽样推断

统计学第5章抽样推断
就 是 由 样 本 指 标 直 接 代 替 全 及 指 标 , 不 考 虑
任 何 抽 样 误 差 因 素 。 即 用 x直 接 代 表 X , 用 p 直 接 代 表 P。
例 在 全 部 产 品 中 , 抽 取 100件 进 行 仔 细 检 查 , 得 到 平 均 重 量 x1002克 , 合 格 率 p98% , 我 们 直 接 推 断 全 部 产 品 的 平 均 重 量 X 1002克 , 合 格 率 P 98% 。
(1)
2
n
(1 )
12 2 (1
100
) 1.19 (千克 )
x
n
N
100 10000
(2) 若以概率 95.45%(t 2)保证,该农场 10000 亩小麦的平均
亩产量的可能范围为:
X : x 400 2 1.19 x
X (: 397 .62 ,402.38 ) (3) 若以概率 99.73%(t 3)保证,该农场 10000 亩小麦的平均
在重复抽样情况下:
p (1 p )
p
n
在不重复抽样情况下:
p (1 p ) n
(1 )
p
n
N

某玻璃器皿厂某日生产15000只印花玻璃 杯,现按重复抽样方式从中抽取150只进行 质量检验,结果有147只合格,其余3只为不 合格品,试求这批印花玻璃杯合格率(成数) 的抽样平均误差。
N15000n150
二、区间估计
根据样本指标和抽样误差去推断全及 指标的可能范围,它能说清楚估计的准 确程度和把握程度。
总体平均数和总体成数的估计
X :(x x, x x)
1的概率保证下:x tx
P:(pp, pp)
1的概率保证下: p tp

应用统计学(第五章 统计推断)

应用统计学(第五章 统计推断)
差与已知总体的方差存在显著差异
检验统计量: χ2 (n 1) s2 σ02
例题5 已知某农田受到重金属污染,抽样测定其镉含量
(μg/g)分别为:3.6、4.2、4.7、4.5、4.2、4.0、3.8、
3.7,试检验污染农田镉含量的方差与正常农田镉含量的方 差0.065是否相同。
解:假设 H0:σ 2 σ02 , H A:σ 2 σ02
P(μ-1.960 σ x ≤ x < μ+1.960 σ x)=0.95
否定区
接受区
否定区
左尾
0.025
μ-1.960σ x
0.95
0.025
0 μ+1.960σ x
右尾
临界值: ± uσ x= ± 1.960σ x
双尾检验 = 0.01
P(μ-2.576 σ x ≤ x < μ+2.576 σ x)=0.99
解: 假设: H0: μ ≤ μ0, HA : μ > μ0 确定显著水平:α=0.05 检验统计量:u x μ0 379.2 377.2 1.818 σ n 3.3 9 u0.05=1.645,计算得:u=1.818>u0.05,P<0.05
推断:否定H0,接受HA。
即:栽培条件的改善,显著提高了豌豆籽粒重量。
4)推断
接受/否定H0(HA,实际意义)
例题1 正常人血钙值服从的正态分布,平均值为2.29 mM,标准差为 0.61mM。现有8名甲状旁腺减退患者经治疗后,测得其血钙值平均为 2.01mM,试检验其血钙值是否正常。
1)提出假设 2)确定显著水平 3)计算概率 4)推断
1)提出假设
H0
零假设 /无效假设
对 /检验假设

f第五章 统计推断

f第五章 统计推断
双侧检验:在拒绝H0之后,接受HA:μ≠μ0 的检验称为双侧检验。 由专业知识确定单、双侧检验。
【例5.1-1b】
用 实 验 动 物 做 实 验 材 料 , 要 求 动 物 平 均 体 重 μ=10.00g, 若 μ<10.00g需再饲养,若μ>10.00g则应淘汰。已知总体标准差 σ=0.40g。从实验动物群体中,随机抽取含量n=10的样本, 样本平均数y=10.23g。这批动物实际饲养的时间比根据以往 经验所需饲养的时间长。问这批动物能否用于实验。
n 10
若假设成立,则得到实际样本这一事件为小概率事件。 假设不成立,拒绝零假设,接受备择假设。
在假设H0正确的情况下,计算样本实际发 生的概率P,若P>α,接受H0 ;若P<α, 拒绝H0 ,接受HA 。在实际应用时,并 不直接求出具体的概率值,而是建立在α 水平上H0的拒绝域和接受域。
拒绝域(rejection region):在上尾、或下尾、 或双侧检验中,U > uα、或U < -uα、或|U| > uα/2的区域,称为在α水平上H0的拒绝域。 接受域(acceptance region):相应的U < uα, 或U > -uα ,或-uα/2 < U < uα/2的区域,称为 在α水平上H0的接受域。 临界值(critical value):接受域的端点称为 临界值。
用实验动物做实验材料 , 要求动物平均体重 μ=10.00g,若 μ<10.00g需再饲养,若μ>10.00g则应淘汰。已知总体标准 差σ=0.40g。从实验动物群体中,随机抽取含量n=10的样本, 样本平均数y=9.77g。这批动物实际饲养时间比根据以往经 验所需饲养的时间短。问这批动物能否用于实验。

《统计学原理》第5章:抽样推断

《统计学原理》第5章:抽样推断
lim P( x X ) 1
n
抽样推断的基本原理
统计推断的理论基础—样本的概率分布
按一定方法随机抽取样本时,所有可能样本的 特征值及其所对应的概率分布情况
学生 A B C D E F G 成绩 30 40 50 60 70 80 90
按随机原则考虑顺序重复抽样抽选出4名学生。
抽样推断的一般问题
样本可能数目
按照一定的抽样方法和组织方式,从总体N中抽取n个 单位构成样本,一共可以抽出的不同样本的数量,一般 用M表示.
考虑顺序的不重复抽样 考虑顺序的重复抽样
M N! (N n)!
M Nn
不考虑顺序的不重复抽样 不考虑顺序的重复抽样
M N! n!(N n)!
全及指标与样本指标
•根据全及总体中各单位的标志值或标志属性计算得 来,反映总体某种特征的指标 •根据样本总体中各单位的标志值或标志属性计算得 来的综合指标.
抽样推断的一般问题
抽样方法
•重复抽样和不重复抽样
•考虑顺序的抽样和不考虑顺序的抽样
抽样推断的一般问题
抽样方法—重复抽样
从总体N个单位中随机抽取一个容量为n的样本,每 次抽取一个单位,把结果登记后再放回到总体中,重新 参加下一次的抽取.
抽出个体
登记特征
放回总体
继续抽取
抽样推断的一般问题
抽样方法—不重复抽样
从总体N个单位中随机抽取一个容量为n的样本, 每次抽取一个单位,把结果登记后不再放回到 总体参加下一次的抽取.
抽出 个体
登记 特征
继续 抽取
抽样推断的一般问题
抽样方法—考虑顺序的抽样
从总体N个单位中抽取n个单位构成样本,不但考虑样本 各单位成分的不同,而且还要考虑样本各单位的中选顺 序.

概率论与数理统计第五章知识点

概率论与数理统计第五章知识点

概率论与数理统计第五章知识点第五章的概率论与数理统计的知识点主要涉及到概率函数、统计推断、分布函数和多元正态分布等内容,这其中包括了多项式概率分布、超几何分布、二项分布、线性回归、假设检验、多重切线回归、卡方检验、小抽样检验、检验均值和协方差等内容。

首先,多项式概率分布是一种特殊的概率分布,它建立了在有限次试验中某个事件出现次数的概率,它由定义性的概率空间和一组完备的事件集合组成,并可以使用不同的统计技术来计算它们。

其次,超几何分布是一种分布,用于计算取样观测中某种特征发生次数的概率,它与多项式分布有着很大的不同,它建立了一个独立的取样模型,它是一种独立取样模型,它利用概率论中的概率空间来分析一个独立取样实验中观测到一个特征发生次数的概率。

再次,二项分布也是一种概率分布,它用来计算一系列试验中出现某种特征的次数的概率。

它是一种特殊的多项式分布,可以使用概率论的工具来应用二项式分布,以确定两个不同事件之间的概率。

此外,线性回归也是第五章概率论与数理统计中一个重要的概念,它是一种统计方法,用来预测一个变量的变化可能会导致另一个变量的变化。

线性回归的基本原理是拟合两个变量的关系,使回归线能够最佳地拟合所有数据,以找到其中的趋势。

另外,假设检验是一种重要的统计技术,在假设检验中,需要使用概率空间,以便计算假设检验中备择假设的概率,并判断假设是否成立。

另外,多重切线回归也是一种重要的统计方法,它是以多元关系作为因变量和因变量之间的关系来拟合数据,以确定多元回归线的最佳拟合方式,让其效果最好。

此外,卡方检验、小抽样检验和检验均值和协方差等也是第五章概率论与数理统计的重要内容。

其中,卡方检验是一种特殊的假设检验,用来判断一组数据的差异是否大于预期,以确定数据的分布情况。

而小抽样检验是一种统计方法,用于给出总体参数的精确估计,以帮助确定相关的总体统计量,用来估计总体参数。

最后,检验均值和协方差也是一种重要的统计方法,它可以帮助分析两个变量之间的关系,以确定两个变量之间的相关程度。

第五章 统计推断

第五章 统计推断

2019/4/2
22
本章习题
3. 某种产品生产过程设计规格为每批平均生产 120 个,超过或低于这个标准都是不合理的。有10批 产品组成的样本中,每批生产的产品数量如下: 108 118 120 122 119 113 124 122 120 123。 检验样本结果能否表示该生产过程运作正常? (假定总体服从正态分布,α=0.05。)
6
1、假设检验问题
【例5.1】 在超市上出售的某种品牌方便面,按规定每
包净重少于 100 克的比例不得超过 1%。技术监督部门 从某超市的货架上任意抽取 200包该种品牌的方便面, 经检验发现有 3包(1.5%)重量少于 100克,试问:超 市出售的这种方便面是否符合质量标准?
在本例中,超市上出售的这种方便面的不合格率是未 知的,我们关心的问题是:如何根据这 200 包方便面 (样本)的不合格率 p=1.5% 来判断超市上出售的这种 品牌的方便面(总体)的不合格率 P≤1% 是否成立?
并非因为它存在逻辑的绝对错误,只是因为它存
在的可能性很小。
2019/4/2 14
6、假设检验的一般步骤
( 1 )根据所研究的问题,提出原假设 H0 和备择 假设H1;
(2)构造检验统计量;
( 3 )计算检验统计量的值和检验统计量观测值 发生的概率; (4)给定显著性水平α(即发生第一类错误的最 大允许概率),并做出统计决策。
2019/4/2
15
5.2 单样本 t 检验
单样本的 T 检验,是一个正态总体在方差未知时,总体 均值与某一已知数是否有显著性差异的假设检验;检验 统计量为(该统计量服从自由度为n-1的t分布):
t
x 0 s/ n
x 0

第五章 统计推断

第五章   统计推断

为研究电渗处理对草莓果实中钙离子含量的影响, 选用10个草莓品种来进行电渗处理与对照的对比试验, 结果如下,问电渗处理对草莓钙离子含量是否有影响?
电渗处理草莓果实钙离子含量
品种号
1
2
3
4
5
6
7
8
910电渗ຫໍສະໝຸດ 理22.2323.42
23.25
21.38
24.45
22.42
24.37
21.75
19.82
三,假设测验的基本方法 ①对所研究的总体首先提出一个无效假设 ②规定测验的显著水平α(一般α=0.05有时α=0.01) ③在承认上述无效假设正确的前提下,获得平均数的抽样分布,计 算假设正确的概率 ④根据"小概率事件实际上不可能发生"的原理接受或否定无效假 设 如小麦品种 旧品种:0=300kg/亩 σ=75kg 新品种:1=330kg/亩 y=330kg 第一步:首先提出假设: HA:1≠0 第二步:平均数的抽样分布,计算概率: = 15 ( kg ) σ y = σ / n = 75 / 25 样本容量n=25 H0:1=0=300kg
135.2
135.2
133.5
(二),成对资料平均数的假设测验
若试验设计是将性质相同 若试验设计是将性质相同的两个供试单位配成一对, 性质相同的两个供试单位配成一对 配成一对, 并设多个配对,然后对每一配对的两个供试单位分别随机 成对数据. 地给予不同处理,所得的观察值为成对数据 地给予不同处理,所得的观察值为成对数据.
1.提出假设.H0:1-2=0,即两条生产线的平均日产量无显著 差异.对HA:1-2≠0,即两条生产线上的平均日产量有显著差 异. 2.确定显著水平.α=0.01. .确定显著水平.α 0.01. 3.检验计算. y1 = 65 . 83 S 2 = 59.7299 y 2 = 59 .77 S 2 2 = 42.8747

统计学5章

统计学5章
在重复简单随机抽样时,样本平均数的抽样分布
有数学期望值 E ( x ) = a a 代表全及总体平均数) (
设总体变量有 N 个:X1,X2,… , XN,则
样本容量为 n:x1 , x2 , … , xn , 则:
X1 X 2 X N X= N
x1 x2 xn x = n
∵ ∴ =
2 x
x1, x2,…, xn相互独立
1 n2 E x1 X


2
E x2 X


2
E xn X
2


2
E ( xi X )( x j X ) i j
=
1 n2 1 n2
E ( x X )2 E x X 1 2 E X X
对于属性总体来说则有如下对应样本指标: 设样本总体 n 个单位中有 n1 个单位具有某种属性, n0 个单位不具有某种属性,且n1 +n0 = n 。则:
n1 p n n0 n n1 q 1 p n n
样本标准差
s
p1 p
(二)参数和统计量
(三)样本容量与样本个数
样本容量是指一个样本所包含的单位数,用 n 来 表示。一般地讲,样本单位数达到或超过30个的样本 称为大样本,而在30个以下称为小样本。 样本个数又称样本可能数目,是指从全及总体中
二、抽样推断的几个基本概念
抽样推断的几个基本概念(见图5-1)。
图5-1 抽样推断的几个基本概念
(一) 总体和样本
在抽样推断中面临两个不同的总体,即 全及总体和样本总体(见图5-2)。
图5-2 全及总体和样本总体关系示意
(一) 总体和样本

第五章 统计推断5-2 - 新

第五章  统计推断5-2 - 新

第五章 统计推断统计推断的意义和内容统计推断是据统计数的分布和概率理论,由样本统计数推论总体参数的方法。

先根据试验目的,对试验总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的估算,做出在概率意义上应接受那种假设的推断。

由于种测验首先对总体提出假设又叫统计假设测验。

统计推断的前提条件:资料必须来自随机样本;统计数的分布规律必须已知。

&5.1 统计假设测验概述统计假设:在科学研究中,往往首先要提出一个有关某一总体参数的假设。

这种假设称为统计假设。

一、数据结构从服从正态分布N(μ0=300,σ=75)的原品种总体中,随机抽取n 个个体构成样本,则样本观察值可表示为 xi = μ0 + εi (i=1,2 ,… ,n)而从新品系总体中随机抽取的样本观察值,则为 xi = μ + εi (i=1,2 ,… ,n) (5.2) 新品系与原品种的产量差异为τ = μ - μ0 (5.3) 将(5.3)代入(5.2)得xi = μ0 + τ + εi (i=1,2 ,… ,n) (5.4) 二、统计假设测验的基本原理 对一个样本的n 个观察值xi 求平均数因x i = μ0 + τ + εi (i=1,2 ,… ,n)iix x εμμμετμ+-=-++=∴)()(0上式说明,x 与 μ0的表面差异(x - μ0)是由真实差异(μ- μ0 )和试验误差εi 构成。

小机率原理:概率很小的事件,在一次试验中是不至于发生的。

统计假设测验:是指据某种需要,对末知的或不完全清楚的总体提出一些假设,由样本实际结果经过一定的概率测验,作出接受或否定假设的推论。

三、统计假设测验的基本步骤例5.1 设某地区的当地小麦品种一般亩产300kg ,多年种植结果获得标准差为75kg 。

现有某新品种n=25,平均数330kg ,问新品种样本所属总体与当地品种这个总体是否差异显著。

第一步 统计假设H0:0μμ=第二步 计算统计量225/75300330/0=-=-=n x u σμu=2> u0.05=1.96,即对应的概率p <0.05。

【统计学概论】抽样推断

【统计学概论】抽样推断

每包重量(克) 149以下 149—150
150—151 151以上
包数 10 20 50 20
(1)以99.73%的概率保证估计这批茶叶平均每包重量的 可能范围
(2)以同样的概率保证估计这批茶叶包装的合格率的可 能范围
• 三必要抽样数目的确定
• (一)影响抽样数目的因素

影响抽样数目的因素有:
(一)总体和样本
总体:调查研究的事物或现象的全体,所包含 的单位数用“N”表示。
样本:从总体中所抽取的部分个体所构成的小 的总体,当中所包含的单位数用“n”
表 示,称为“样本容量”。 样本可分为: 大样本 小样本
(二)全及指标与样本指标 (参数与统计量)
1、全及指标:说明全及总体的综合数量 特征,是唯一的,又称为“参数”。
尺度,用“ ”。
2、公式:
(1)重复抽样条件下:
(2)不重复抽样条件下:
五、抽样极限(允许)误差
1、概念:是在一定的概率保证下,用样本 指标估计全及指标时允许出现的
最 大误差,用“△”表示.
2、计算公式: 根据置信度(即可靠性,F(t)=1-α),
查正态概率分布表,查得对应的概率度t。 (在总体方差未知的情况下)
例3:P94
例4 P95
例5 P96
三、抽样误差
1、概念:是在遵循随机原则的条件下,用 样本指标来代表全及指标所不可避免 的误差。就是统计误差中的随机误差
抽样误差=样本指标 -全及指标 2、影响因素:
①抽取单位数n的多少 ②被研究标志的变异程度 ③抽样方法 ④抽样组织方式
四、抽样平均误差
1、概念:是所有可能组成的样本的抽样误 差的平均数,反映样本指标与全及指标的 平均误差程度,是衡量样本代表性大小的

第五章_差异显著性检验

第五章_差异显著性检验
– 被称为抽样分布的拒绝域
• 3. 表示为 (alpha)
– 常用的 值有0.01, 0.05, 0.10
• 4. 由研究者事先确定
作出统计决策
1. 计算检验的统计量 2. 根据给定的显著性水平,查表得出相应 的临界值t或t/2 3. 将检验统计量的值与 水平的临界值进 行比较 4. 得出接受或拒绝原假设的结论
1 1 ( ) n1 n2
两样本的含量
均数差异标准误
第二节 显著性检验的基本原理
(二) 在无效假设成立的前提下,构造并计算合适的统计量 所得的统计量 t 服从自由度 df =(n1-1)+(n2-1)的 t 分布。 根据两个样本的数据,计算得:
S x1 x2
2 2 ( x x ) ( x x ) 1 1 2 2
是试验误差(或抽样误差)。对两个样本进行比较
时,必须判断样本间差异是抽样误差造成的,还是 本质不同引起的。如何区分两类性质的差异?怎样
通过样本来推断总体?这正是显著性检验要解决的
问题。
第一节 统计推断的意义和原理
两个总体间的差异如何比较? 一种方法是研究整个总体,即由总体中的所有个体数据计 算出总体参数进行比较。这种研究整个总体的方法是很准 确的,但常常是不可能进行的,因为总体往往是无限总体, 或者是包含个体很多的有限总体。 另一种方法,即研究样本,通过样本研究其所代表的总体。 设长白猪经产母猪产仔数的总体平均数为 1 大白猪经产母猪产仔数的总体平均数为 2 试验研究的目的,就是要给 1 、 2 是否相同做出推断。 以样本平均数 x1 、 x2 作为检验对象,更确切地说,是 以( x1 - x2)作为检验对象
确定适当的检验统计量

• •
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2014-8-16 版权所有 BY 统计学课程组 32
一、假设检验的一般性问题(6)

(三) 单、双侧检验问题
2014-8-16
版权所有 BY 统计学课程组
33
一、假设检验的一般性问题(7)
(四)假设检验中的两类错误
2014-8-16
版权所有 BY 统计学课程组
34
一、假设检验的一般性问题(8)
2014-8-16 版权所有 BY 统计学课程组 6
一、点估计


总体的参数估计按是否考虑估计误差及发生概率的大小, 可分为点估计和区间估计两大类。 1.点估计的定义和分类

点估计不考虑估计误差的大小,故不需确定估计量的概 率分布。点估计的基本方法包括矩估计法和最大似然估 计法,其主要作用是寻找参数的最佳估计量。
9

(2)有效性
2014-8-16
版权所有 BY 统计学课程组
10

(3)一致性 (相合性)
2014-8-16
版权所有 BY 统计学课程组
11
二、区间估计(1)


1.区间估计的含义
ˆ #q 1 在概率意义下计算参数 q 的变化范围,即 P {q ˆ = 1- a q 2
}

2014-8-16
版权所有 BY 统计学课程组
16
二、区间估计(6)--总体成数的区间估计

只讨论大样本情形
2014-8-16
版权所有 BY 统计学课程组
17
二、区间估计(7)--总体方差的区间估计
2014-8-16
版权所有 BY 统计学课程组
18
二、区间估计(8)--单侧置信区间
2014-8-16
版权所有 BY 统计学课程组
2014-8-16 版权所有 BY 统计学课程组 27
一、假设检验的一般性问题(1)

(一) 问题的提出 根据经验,我们在很多时候知道总体的分布形 式,但不知道某参数的具体数值是不是我们猜想的 那个值?在另外的情况下,我们不一定要知道总体 参数的具体值是多少,只想知道参数是否超过或者 是否不超过某个值就可以了。在这些情况下,使用 参数估计的方法显然不能满足要求,它需要用到参 数假设检验的方法。
2014-8-16
版权所有 BY 统计学课程组
43
二、几种常用的参数检验方法


在统计上进行假设检验的方法很多,按检验统 计量服从的分布来划分,最常用的检验方法有 四种:Z检验法(或称检验法)、t检验法、卡 方检验法和F检验法。 考虑到手工计算值的步骤比较复杂,而统计软 件在输出检验结果时一般都会有P值,故这里 主要介绍临界值检验法和Excel的应用。

2014-8-16
版权所有 BY 统计学课程组
23
三、样本容量的确定 (2)


二、处理问题的原则 1.从抽样角度来看,处理推断目标实现的精确 度与调查成本间矛盾的原则是:在保证达到推 断目标的要求下,尽量使调查成本最低。 2.从推断角度来看,处理统计推断精确度与调 查成本间矛盾的原则是:在调查成本一定的情 况下,尽量使推断目标实现的效果好,即估计 的精度更高。
2014-8-16
版权所有 BY 统计学课程组
14
二、区间估计(4)--总体均值的区间估计

1.正态总体方差已知;或非正态总体但有大样本;或正态 总体方差未知但有大样本
2014-8-16
版权所有 BY 统计学课程组
15
二、区间估计(5)--总体均值的区间估计

2.正态总体方差未知且小样本
2014-8-16
版权所有 BY 统计学课程组
12
二、区间估计(2)

2.区间估计中的两个基本要求:

3.Neyman原则 即在保证置信度的前提下,尽可能提高估计的精确度。
2014-8-16 版权所有 BY 统计学课程组 13
二、区间估计(3)

4.区间估计时应考虑的一些具体问题 在对总体均值进行区间估计时, 常常需要考虑总体是否为正态总体、 总体方差是否已知、用于构造估计量 的样本是大样本(n≥30)还是小样本(n< 30)等几种情况。
2014-8-16
版权所有 BY 统计学课程组
35
一、假设检验的一般性问题(9)

正确决策和犯错误种类可以归纳为表5-2: 表5-2 假设检验的结论和后果

2014-8-16
版权所有 BY 统计学课程组
36
一、假设检验的一般性问题(10)



(五) 如何确定原假设和备择假设 第一,当目的是希望从样本观察值取得对某一 论断强有力的支持时,把这一论断的否定作为 原假设; 第二,把由过去资料所提供的论断作为原假设。 人们常常把那些保守的、历史的、经验的取为 原假设,而把那些猜测的、可能的、预期的取 为备择假设。另外,人们在建立假设时,总是 把等号放在原假设中的。例如,“”或“ ” 或“”。
2014-8-16
版权所有 BY 统计学课程组
24
三、样本容量的确定 (3)


三、简单随机抽样下、调查成本既定时,样本容量的 确定方法 1. 总体均值估计情形
2014-8-16
版权所有 BY 统计学课程组
25
三、样本容量的确定 (4)

2.总体成数估计情形

注意:
2014-8-16
版权所有 BY 统计学课程组
2014-8-16
版权所有 BY 统计学课程组
31
一、假设检验的一般性问题(5) 假设检验的特点:


第一,假设检验采用逻辑上的反证法,即为了检验一 个假设是否成立,首先假设它是真的,然后对样本进 行观察,如果发现出现了不合理现象,则可以认为假 设是不合理的,拒绝假设;否则可以认为假设是合理 的,接受假设。 第二,假设检验采用的反证法带有概率性质。所谓假 设的不合理不是绝对的,而是基于小概率原理。生活 常识告诉人们,“小概率事件”在一次随机试验(一 次抽样)中几乎不会发生。买彩票的人很多很多,但 中大奖的人却少得可怜。至于事件的概率小到什么程 度才算是小概率事件,并没有统一的界定标准,要视 具体问题而定。
26
第二节 总体参数检验



一、假设检验的一般性问题 1. 问题的提出 3. 单、双侧检验问题 5. 如何确定原假设和备择假设 7. 统计检验的显著性
2. 假设检验的基本思想 4. 统计结论的两类错误 6. P值检验法 8. 假设检验的步骤


二、几种常用、具体的参数检验方法 1. Z检验法 2. t检验法 3. 卡方检验法 4. F检验法
19
二、区间估计(9)--区间估计的步骤


1.依题意确定待估参数; 2.依题设条件构造与待估参数相对应的估计 量; 3.确定估计量的抽样分布; 4.依估计量的抽样分布,由给定的置信度计 算待估参数置信区间的上、下限。
2014-8-16
版权所有 BY 统计学课程组
20
2014-8-16
版权所有 BY 统计学课程组
21
三、 样本容量的确定

一、问题的提出 二、处理问题的原则 三、简单随机抽样下,调查成本既定时样本容 量确定的方法
2014-8-16
版权所有 BY 统计学课程组
22
三、样本容量的确定 (1)
一、问题的提出 从推断来看,要达到估计所要求的精确程度, 自然要求样本容量越大越好;但从抽样来看, 增大样本容量,势必增加人力、物力,从而导 致调查成本增大,这无疑是不经济的做法。于 是在抽样推断中,势必要在统计推断的精确度 与调查成本这一对矛盾间进行权衡。
第五章
参数估计与假设检验
2014-8-16
版权所有 BY 统计学课程组
1
第五章 统计推断

案 例: 酒杯对酒杯 第一节 总体参数估计 第二节 总体参数检验
2014-8-16
版权所有 BY 统计学课程组
2
案 例:酒杯对酒杯


问题: 1.全部巴特威塞公司啤酒的忠实饮用者中喜 欢施利兹啤酒的比例会是多少? 2.由样本值是否真的能够说明巴特威塞啤酒 的忠实饮用者中喜欢施利兹啤酒的总体比例大 于35%?
2014-8-16
版权所有 BY 统计学课程组
45
Z 检验法(2)


1.一个正态总体均值的检验 (1) 假定条件:有一个方差已知的正态总体,或大 样本下的非正态总体,或大样本下方差未知的正态总 体。 (2) 使用检验统计量
2014-8-16 版权所有 BY 统计学课程组 7
一、点估计

按照构造统计量的方法不同,点估计有很 多具体方法,最经典的是矩估计法和最大似然 估计法。
2014-8-16
版权所有 BY 统计学课程组
8
一、点估计

2.点估计量的评价标准 (1)无偏性
2014-8-16
版权所有 BY 统计学课程组
2014-8-16
版权所有 BY 统计学课程组
5
第一节 总体参数估计





一、点估计 1.点估计的定义和分类 2.估计量的评价标准 二、区间估计 1.区间估计的含义 2.总体均值的区间估计 3.总体成数的区间估计 4.总体方差的区间估计 5.单侧置信区间 三、样本容量的确定
2014-8-16
版权所有 BY 统计学课程组
28
一、假设检验的一般性问题(2)

(二)假设检验的基本思想
2014-8-16
版权所有 BY 统计学课程组
29
一、假设检验的一般性问题(3)
相关文档
最新文档